DMOZ ( dmoz estilizado en su logotipo; de directorio.mozilla.org , un nombre de dominio anterior ) era un directorio multilingüe de contenido abierto de enlaces de la World Wide Web . El sitio y la comunidad que lo mantenían también se conocían como Open Directory Project ( ODP ). Era propiedad de AOL (ahora parte de Verizon Media ), pero lo construyó y mantuvo una comunidad de editores voluntarios.
DMOZ utilizó un esquema de ontología jerárquica para organizar listados de sitios. Los listados sobre un tema similar se agruparon en categorías que luego incluyeron categorías más pequeñas.
DMOZ cerró el 17 de marzo de 2017 porque AOL ya no deseaba apoyar el proyecto. [1] [2] El sitio web se convirtió en una única página de destino ese día, con enlaces a un archivo estático de DMOZ y al foro de discusión de DMOZ, donde se discutían planes para cambiar la marca y relanzar el directorio . [2]
En septiembre de 2017 [actualizar], un espejo no editable seguía disponible en dmoztools.net, [3] y se anunció que, si bien la URL DMOZ no regresaría, se proporcionaría una versión sucesora del directorio llamada Curlie . [4] [5]
DMOZ fue fundada en Estados Unidos como Gnuhoo por Rich Skrenta y Bob Truel en 1998 mientras ambos trabajaban como ingenieros para Sun Microsystems . Chris Tolles, que trabajó en Sun Microsystems como jefe de marketing de productos de seguridad de redes, también firmó en 1998 como cofundador de Gnuhoo junto con los cofundadores Bryn Dole y Jeremy Wenokur. Skrenta había desarrollado TASS, un antepasado de tin , el popular lector de noticias Usenet para sistemas Unix . La estructura de categorías original del directorio Gnuhoo se basó libremente en la estructura de los grupos de noticias de Usenet que existían en ese momento.
El directorio Gnuhoo entró en funcionamiento el 5 de junio de 1998. Después de que Richard Stallman y la Free Software Foundation se opusieran al uso de Gnu en el nombre, Gnuhoo se cambió a NewHoo . [6] Yahoo! Luego se opuso al uso de Hoo en el nombre, lo que provocó una propuesta de cambio de nombre a ZURL . [7] Antes de cambiar a ZURL , NewHoo fue adquirido por Netscape Communications Corporation en octubre de 1998 y se convirtió en Open Directory Project. Netscape publicó datos de Open Directory bajo la licencia Open Directory . Netscape fue adquirida por AOL poco después y DMOZ fue uno de los activos incluidos en la adquisición.
Cuando Netscape asumió la dirección, el Open Directory Project tenía alrededor de 100.000 URL indexadas con contribuciones de unos 4.500 editores. El 5 de octubre de 1999, el número de URL indexadas por DMOZ alcanzó el millón. Según una estimación no oficial, las URL en DMOZ sumaban 1,6 millones en abril de 2000, superando a las de Yahoo! Directorio . [8] DMOZ alcanzó los hitos de indexar dos millones de URL el 14 de agosto de 2000, tres millones de listados el 18 de noviembre de 2001 y cuatro millones el 3 de diciembre de 2003. En abril de 2013 había 5.169.995 sitios listados en más de 1.017.500 categorías. El 31 de octubre de 2015, había 3.996.412 sitios listados en 1.026.706 categorías.
En enero de 2006, DMOZ comenzó a publicar informes en línea para informar al público sobre el desarrollo del proyecto. El primer informe abarcó el año 2005. Posteriormente se publicaron informes mensuales hasta septiembre de 2006. [9] Estos informes ofrecieron una mejor comprensión del funcionamiento del directorio que las estadísticas simplificadas proporcionadas en la portada del directorio. El número de listados y categorías citados en la página principal incluía las categorías "Prueba" y "Marcadores", pero no se incluyeron en el volcado RDF ofrecido a los usuarios. Había alrededor de 7330 editores activos durante agosto de 2006. [9] 75,151 editores habían contribuido al directorio al 31 de marzo de 2007. [10] En abril de 2013, el número de editores contribuyentes había aumentado a 97,584. [10]
El 20 de octubre de 2006, el servidor principal de DMOZ sufrió una falla catastrófica [11] que impidió a los editores trabajar en el directorio hasta el 18 de diciembre de 2006. Durante ese período, el público pudo ver una versión anterior del directorio. El 13 de enero de 2007, los formularios de sugerencias de sitios y listados actualizados volvieron a estar disponibles. [12] El 26 de enero de 2007 se reanudó la publicación semanal de volcados de RDF. Para evitar futuras interrupciones, a partir de ese momento el sistema residió en una configuración redundante de dos servidores basados en Intel. [13]
La interfaz del sitio se actualizó en 2016, con la marca "DMOZ 3.0", pero AOL la desconectó el año siguiente.
A medida que DMOZ se hizo más conocido, surgieron otros dos directorios web importantes editados por voluntarios y patrocinados por Go.com y Zeal , ambos ya desaparecidos. Estos directorios no otorgaron licencias de su contenido para la distribución de contenido abierto . [14] [15]
El concepto de utilizar una comunidad de editores a gran escala para compilar contenido en línea se ha aplicado con éxito a otros tipos de proyectos. El modelo de edición de DMOZ inspiró directamente al menos otros tres proyectos voluntarios de contenido abierto: el sitio de música MusicMoz, un directorio de restaurantes de contenido abierto conocido como ChefMoz [16] y una enciclopedia conocida como Open Site. [17] Finalmente, según Larry Sanger , DMOZ fue parte de la inspiración para el proyecto Nupedia , del cual surgió Wikipedia . [18]
Gnuhoo tomó prestado el esquema básico para su ontología inicial de Usenet . En 1998, Rich Skrenta dijo: "Tomé una larga lista de grupos y los edité manualmente en una jerarquía". [19] Por ejemplo, el tema cubierto por el grupo de noticias comp.ai.alife estaba representado por la categoría Computadoras/IA/Vida_artificial. Las divisiones originales eran para Adultos , Artes , Negocios , Computadoras , Juegos , Salud , Hogar , Noticias , Recreación , Referencias , Regionales , Ciencias , Compras , Sociedad , Deportes y "Mundo". Si bien estas dieciséis categorías de nivel superior han permanecido intactas, la ontología de las categorías de segundo nivel y de nivel inferior ha experimentado una evolución gradual; Los cambios significativos se inician mediante discusión entre los editores y luego se implementan cuando se alcanza el consenso.
En julio de 1998, el directorio pasó a ser multilingüe con la incorporación de la categoría de nivel superior Mundial . El resto del directorio enumera sólo sitios en inglés. En mayo de 2005, estaban representadas setenta y cinco lenguas. La tasa de crecimiento de los componentes del directorio que no están en inglés había sido mayor que el componente en inglés desde 2002. Mientras que el componente en inglés del directorio ocupaba casi el 75% de los sitios en 2003, el nivel mundial creció a más de 1,5 millones de sitios a partir de 2003. mayo de 2005, formando aproximadamente un tercio del directorio. La ontología en categorías que no están en inglés generalmente refleja la del directorio en inglés, aunque las excepciones que reflejan diferencias de idioma son bastante comunes.
Varias de las categorías de alto nivel tienen características únicas. La categoría Adultos no está presente en la página de inicio del directorio, pero está completamente disponible en el volcado RDF que proporciona DMOZ. Si bien la mayor parte del directorio está categorizada principalmente por tema, la categoría Regional está categorizada principalmente por región. Esto ha llevado a muchos a ver DMOZ como dos directorios paralelos: Regional y Topical .
El 14 de noviembre de 2000 se creó un directorio especial dentro de DMOZ para personas menores de 18 años. [20] Los factores clave que distinguen esta área "Niños y adolescentes" del directorio principal son:
En mayo de 2005, esta parte de DMOZ incluía más de 32.000 listados de sitios.
Desde principios de 2004, todo el sitio estaba en codificación UTF-8 . Antes de esto, la codificación era ISO 8859-1 para las categorías del idioma inglés y un juego de caracteres dependiente del idioma para otros idiomas. Los volcados RDF se codificaron en UTF-8 desde principios de 2000.
Los editores mantenían las listas de directorios. Mientras que algunos editores se centraron en agregar nuevos listados, otros se concentraron en mantener los listados existentes y algunos hicieron ambas cosas. Esto incluía tareas como la edición de listados individuales para corregir errores ortográficos y/o gramaticales, así como el seguimiento del estado de los sitios vinculados. Otros revisaron los envíos del sitio para eliminar el spam y los envíos duplicados.
Robozilla era un rastreador web escrito para comprobar el estado de todos los sitios enumerados en DMOZ. Periódicamente, Robozilla marcaba los sitios que parecían haberse movido o desaparecido y los editores hacían un seguimiento para comprobar los sitios y tomar medidas. Este proceso fue fundamental para que el directorio se esforzara por lograr uno de sus objetivos fundacionales: reducir la descomposición de los enlaces en los directorios web. Poco después de cada ejecución, los sitios marcados con errores se movieron automáticamente a la cola no revisada donde los editores pueden investigarlos cuando el tiempo lo permita.
Debido a la popularidad de DMOZ y su impacto resultante en la clasificación de los motores de búsqueda (consulte PageRank ), los dominios con registro caducado que figuraban en DMOZ atrajeron el secuestro de dominios , un problema que se solucionó eliminando periódicamente los dominios caducados del directorio.
Si bien la financiación corporativa y el personal de DMOZ disminuyeron con el tiempo, los voluntarios crearon herramientas de edición como verificadores de enlaces para complementar a Robozilla, rastreadores de categorías, correctores ortográficos, herramientas de búsqueda que examinan directamente un volcado RDF reciente, marcadores para ayudar a automatizar algunas funciones de edición y complementos basados en Mozilla. , [22] y herramientas que ayudaron a trabajar en colas no revisadas.
Los datos DMOZ anteriormente estaban disponibles bajo los términos de la licencia Open Directory , que requería una tabla de atribución DMOZ específica en cada página web que utiliza los datos.
La licencia Open Directory también incluía el requisito de que los usuarios de los datos verificaran continuamente el sitio DMOZ en busca de actualizaciones y suspendieran el uso y distribución de los datos u trabajos derivados de los datos una vez que se produjera una actualización. Esta restricción llevó a la Free Software Foundation a referirse a la licencia Open Directory como una licencia de documentación no libre, citando que el derecho a redistribuir una versión determinada no es permanente y el requisito de verificar si hay cambios en la licencia.
En 2011, DMOZ cambió silenciosamente su licencia a una licencia Creative Commons Attribution [ cita necesaria ] , que es una licencia gratuita (y compatible con GPL). [23]
Los datos DMOZ están disponibles a través de un volcado tipo RDF que se publica en un servidor de descarga; las versiones anteriores también se archivan allí. [24] Las nuevas versiones generalmente se generan semanalmente. Un editor DMOZ ha catalogado una serie de errores que se encuentran en el volcado DMOZ RDF, el más importante es que el formato del archivo no es RDF. [25] Entonces, si bien hoy en día el llamado volcado RDF es XML válido , no es RDF válido y, como tal, el software para procesar el volcado DMOZ RDF debe escribirse específicamente para datos DMOZ.
Los datos DMOZ impulsan los servicios de directorio principales de muchos de los motores y portales de búsqueda más grandes de la Web, incluidos Netscape Search, AOL Search y Alexa . Google Directory utilizó información DMOZ hasta su cierre en julio de 2011. [26]
También se hacen otros usos de los datos DMOZ. Por ejemplo, en la primavera de 2004, Overture anunció un servicio de búsqueda para terceros que combinaba Yahoo! Resultados de búsqueda de directorio con títulos DMOZ, descripciones y metadatos de categorías. El motor de búsqueda Gigablast anunció el 12 de mayo de 2005 su copia de búsqueda de DMOZ. La tecnología permite la búsqueda de sitios web enumerados en categorías específicas, "de hecho, creando instantáneamente más de 500.000 motores de búsqueda verticales". [27]
Al 8 de septiembre de 2006 [actualizar], DMOZ enumeró 313 sitios web en inglés que utilizan datos DMOZ, así como 238 sitios en otros idiomas. [28] Sin embargo, estas cifras no reflejan el panorama completo del uso, ya que los sitios que utilizan datos DMOZ sin seguir los términos de la licencia DMOZ no figuran en la lista.
Se imponen restricciones sobre quién puede convertirse en editor de DMOZ. El principal mecanismo de control es un proceso de solicitud de editor en el que los candidatos a editor demuestran sus habilidades de edición, revelan afiliaciones que podrían plantear un conflicto de intereses [ cita necesaria ] y, de otro modo, dan una idea de cómo el solicitante probablemente encajaría con la cultura y misión de DMOZ. [29] La mayoría de las solicitudes son rechazadas, pero se permite y, en ocasiones, se anima a volver a presentar la solicitud. Los mismos estándares se aplican a los editores de todas las categorías y subcategorías. [ cita necesaria ]
El modelo de edición de DMOZ es jerárquico . Al convertirse en editores, las personas generalmente tendrán permisos de edición solo en una pequeña categoría. Una vez que hayan demostrado habilidades básicas de edición de acuerdo con las Pautas de edición, pueden solicitar privilegios de edición adicionales en una categoría más amplia o en otra categoría del directorio. Se fomentan las relaciones de tutoría entre editores y los foros internos proporcionan un vehículo para que los nuevos editores hagan preguntas. [ cita necesaria ]
DMOZ tiene sus propios foros internos, cuyos contenidos están destinados únicamente a que los editores se comuniquen entre sí principalmente sobre temas de edición. El acceso a los foros requiere una cuenta de editor y se espera que los editores mantengan la privacidad del contenido de estos foros. [30]
Con el tiempo, a los editores senior se les pueden otorgar privilegios adicionales que reflejan su experiencia en edición y su liderazgo dentro de la comunidad de edición. El más sencillo es editar todos los privilegios, que permiten a un editor acceder a todas las categorías del directorio. Los metaprivilegios también permiten a los editores realizar tareas como revisar aplicaciones de edición, configurar funciones de categorías y manejar informes de abuso internos y externos. Los privilegios de Cateditall son similares a editar todo , pero solo para una única categoría de directorio. De manera similar, los privilegios catmod son similares a meta , pero solo para una única categoría de directorio. Los privilegios de Catmv permiten a los editores realizar cambios en la ontología del directorio moviendo o cambiando el nombre de las categorías. Todos estos privilegios los otorgan los administradores y el personal, generalmente después de discutirlo con los metaeditores . [ cita necesaria ]
En agosto de 2004, se introdujo un nuevo nivel de privilegios llamado administrador . El personal otorgó el estatus de administrador a una serie de metas con muchos años de servicio. Los administradores tienen la capacidad de otorgar privilegios editall+ a otros editores y aprobar nuevas políticas para todo el directorio, poderes que anteriormente solo estaban disponibles para los editores raíz (personal). [31]
Se espera que todos los editores de DMOZ cumplan con las Pautas de edición de DMOZ. Estas pautas describen los conceptos básicos de edición: qué tipos de sitios pueden aparecer en la lista y cuáles no; cómo se deben titular y describir los listados de sitios de manera poco consistente; convenciones para la denominación y construcción de categorías; limitaciones de conflictos de intereses en la edición de sitios que el editor pueda poseer o con los que esté afiliado; y un código de conducta dentro de la comunidad. [32] Los editores que hayan violado estas pautas pueden ser contactados por el personal o los editores senior, reducir sus permisos de edición o perderlos por completo. Las pautas DMOZ se revisan periódicamente después de discutirlas en foros de editores. [ cita necesaria ]
Durante mucho tiempo ha habido acusaciones de que los editores voluntarios de DMOZ dan un trato favorable a sus propios sitios web y al mismo tiempo frustran los esfuerzos de buena fe de su competencia. [33] Tales acusaciones son presentadas por el personal y los metaeditores de ODP, quienes tienen la autoridad para tomar medidas disciplinarias contra los editores voluntarios que sean sospechosos de participar en prácticas de edición abusivas. [34] En 2003, DMOZ introdujo un nuevo Sistema de denuncia de abuso público que permite al público en general denunciar y realizar un seguimiento de las acusaciones de conducta abusiva de los editores utilizando un formulario en línea. [35] La discusión desinhibida sobre las supuestas deficiencias de DMOZ se ha vuelto más común en los principales foros de discusión de webmasters . Aunque las políticas del sitio sugieren que un sitio individual debe incluirse en una sola categoría, [36] en octubre de 2007, Topix.com, un sitio de agregación de noticias operado por el fundador de DMOZ, Rich Skrenta, tenía más de 17.000 listados. [37]
Al principio de la historia de DMOZ, su personal concedía a representantes de empresas seleccionadas, como Rolling Stone o CNN , acceso de edición para enumerar páginas individuales de sus sitios web. [38] Se agregaron enlaces a artículos individuales de CNN hasta 2004, pero se eliminaron por completo del directorio en enero de 2008 [39] debido a que el contenido estaba desactualizado y no se consideraba que valiera la pena mantener. Desde entonces no ha habido experimentos similares con la política de edición.
Detrás de cierta controversia en torno a DMOZ está su propiedad y gestión. Algunos de los voluntarios originales de GnuHoo sintieron que habían sido engañados para unirse a una empresa comercial. [6] En diversos grados, esas quejas han continuado hasta el presente.
En los inicios de DMOZ, se pensó poco en la idea de cómo debería administrarse DMOZ y no había foros oficiales , pautas o preguntas frecuentes . [40]
Con el paso del tiempo, los foros de editores de ODP se convirtieron en el parlamento de facto de DMOZ, y cuando uno de los miembros del personal de DMOZ publicaba una opinión en los foros, se consideraba una decisión oficial. [30] Aun así, el personal de DMOZ comenzó a otorgar privilegios de edición adicionales a los editores senior de confianza, incluida la capacidad de aprobar nuevas solicitudes de editor, lo que eventualmente condujo a una jerarquía estratificada de deberes y privilegios entre los editores de DMOZ, con el personal remunerado de DMOZ teniendo la última palabra. con respecto a las políticas y procedimientos de DMOZ. [31] [41]
Robert Keating, director de Touchstone Consulting Group en Washington, DC, desde 2006, trabajó como gerente de programas de AOL para DMOZ desde 2004. Comenzó a trabajar para AOL en 1999 como editor senior de AOL Search y luego como editor gerente de AOL Search, DMOZ. y luego como gerente del ecosistema de medios, AOL Product Marketing. [42] [43]
Los procedimientos de eliminación del editor de DMOZ son supervisados por el personal y los metaeditores de DMOZ. Según las directrices editoriales oficiales de DMOZ, los editores son destituidos por prácticas de edición abusivas o comportamiento descortés. Las discusiones que pueden resultar en medidas disciplinarias contra editores voluntarios se llevan a cabo en un foro privado al que solo pueden acceder el personal y los metaeditores de DMOZ. A los editores voluntarios que están siendo discutidos no se les notifica que se están llevando a cabo dichos procedimientos. [41] Algunas personas encuentran este acuerdo desagradable y prefieren, en cambio, una discusión que se parezca más a un juicio celebrado en el sistema judicial estadounidense. [44]
En el artículo "Explicación de la eliminación del editor", el metaeditor de DMOZ, Arlarson, afirma que "una gran confusión sobre la eliminación de editores de DMOZ se debe a declaraciones falsas o engañosas de ex editores". [45]
Las pautas de confidencialidad de DMOZ prohíben a los editores actuales de DMOZ que estén en condiciones de saber algo discutir los motivos de la eliminación de editores específicos, [41] sin embargo, en las pautas se proporciona una lista de posibles razones. [46] En el pasado, esto ha llevado a que los editores eliminados de DMOZ se pregunten por qué no pueden iniciar sesión en DMOZ para realizar su trabajo de edición. [47] [48]
David F. Prenatt Jr., ex editor de DMOZ netesq , y otro ex editor conocido con el alias The Cunctator , afirman haber sido removidos por no estar de acuerdo con el personal sobre los cambios en las políticas, particularmente las políticas de derechos de autor de DMOZ . Según sus afirmaciones, el personal utiliza la excusa del comportamiento descortés como medio para destituir a los editores molestos. [44] [49] [50]
Los editores senior de DMOZ tienen la capacidad de adjuntar notas de "advertencia" o "no incluir" a dominios individuales, pero ningún editor tiene la capacidad unilateral de bloquear ciertos sitios para que no aparezcan en la lista. Es posible que los sitios con estas notas aún aparezcan en la lista y, en ocasiones, las notas se eliminan después de un poco de discusión. [51]
Las críticas a la estructura jerárquica de DMOZ surgieron alrededor de 2005. Muchos creen que los directorios jerárquicos son demasiado complicados. Con la aparición de la Web 2.0 , comenzaron a aparecer las folksonomías , y algunos editores propusieron que las folksonomías, las redes y los gráficos dirigidos son más "naturales" y más fáciles de gestionar que las jerarquías. [52] [53] [54]
El software ODPSearch es una versión derivada de Isearch que es de código abierto y tiene la licencia pública de Mozilla . [55]
Los foros del editor ODP se ejecutaron originalmente en software basado en el sistema propietario Ultimate Bulletin Board. En junio de 2003, cambiaron al sistema phpBB de código abierto . A partir de 2007, estos foros funcionaban con una versión modificada de phpBB.
El software de seguimiento de errores utilizado por ODP es Bugzilla y el servidor web Apache . También se utilizó el servidor proxy web Squid , pero se eliminó en agosto de 2007 cuando se reorganizaron los servidores de almacenamiento. Todas estas aplicaciones son de código abierto.
El software de edición/base de datos DMOZ es de código cerrado (aunque Richard Skrenta dijo en junio de 1998 que estaba considerando licenciarlo bajo la Licencia Pública General GNU ). Esto ha generado críticas por parte del mencionado proyecto GNU, muchos de los cuales también criticaron la licencia de contenido DMOZ. Posteriormente, el contenido se publicó bajo una licencia Creative Commons, que es compatible con la licencia GNU. [56]
Como tal, se han realizado algunos esfuerzos para ofrecer alternativas a DMOZ. Estas alternativas permitirían a comunidades de editores con ideas afines configurar y mantener sus propios directorios web de código abierto/contenido abierto.
Chef Moz , una rama de DMOZ, era un directorio de contenido abierto de enlaces de restaurantes en la World Wide Web . El sitio web fue construido y mantenido por una comunidad de editores voluntarios y es propiedad de Netscape .
Chef Moz, similar a su matriz DMOZ, utilizó un esquema de ontología jerárquica para organizar listados de sitios. Los listados sobre un tema similar se agruparon en categorías, que luego pueden incluir categorías más pequeñas.
El 17 de febrero de 2011, la administradora de DMOZ, "lisagirl", confirmó que el Chef Moz estaba muerto. [57]
Desde sus inicios en 2000 hasta noviembre de 2009 (cuando a los editores les resultó imposible iniciar sesión en el sitio), ChefMoz había crecido hasta convertirse en el directorio mundial de restaurantes más grande de Internet. El número total de restaurantes indexados desde el año 2000 se registra en la siguiente tabla: [58]