DMOZ ( dmoz estilizado en su logotipo; de directory.mozilla.org , un nombre de dominio anterior ) era un directorio multilingüe de contenido abierto de enlaces de la World Wide Web . El sitio y la comunidad que lo mantenía también se conocían como Open Directory Project ( ODP ). Era propiedad de AOL (ahora parte de Yahoo! Inc ), pero lo construía y mantenía una comunidad de editores voluntarios.
DMOZ utilizó un esquema de ontología jerárquica para organizar los listados de sitios. Los listados sobre un tema similar se agruparon en categorías que a su vez incluían categorías más pequeñas.
DMOZ cerró el 17 de marzo de 2017, porque AOL ya no deseaba apoyar el proyecto. [1] [2] El sitio web se convirtió en una única página de inicio ese día, con enlaces a un archivo estático de DMOZ y al foro de discusión de DMOZ, donde se discutían los planes para cambiar la marca y relanzar el directorio . [2]
A partir de septiembre de 2017 [update], un espejo no editable permaneció disponible en dmoztools.net, [3] y se anunció que, si bien la URL de DMOZ no regresaría, se proporcionaría una versión sucesora del directorio llamada Curlie . [4] [5] Para 2018, ODP, DMoz y Curlie se consideraron sinónimos. [6] Curlie estaba bien establecido para 2022, utilizando la jerarquía de Dmoz. [7]
DMOZ fue fundada en los Estados Unidos como GnuHoo por Rich Skrenta y Bob Truel en 1998 mientras ambos trabajaban como ingenieros para Sun Microsystems . Chris Tolles, que trabajaba en Sun Microsystems como jefe de marketing de productos de seguridad de red, también se unió en 1998 como cofundador de Gnuhoo junto con los cofundadores Bryn Dole y Jeremy Wenokur. Skrenta había desarrollado TASS, un antecesor de tin , el popular lector de noticias de Usenet enhebrado para sistemas Unix . La estructura de categorías original del directorio Gnuhoo se basaba vagamente en la estructura de los grupos de noticias de Usenet que existían en ese momento.
El directorio Gnuhoo se puso en marcha el 5 de junio de 1998. Después de que Richard Stallman y la Free Software Foundation objetaran el uso de Gnu en el nombre, GnuHoo se cambió a NewHoo . [8] Luego Yahoo! objetó el uso de Hoo en el nombre, lo que provocó una propuesta de cambio de nombre a ZURL . [9] Antes de cambiar a ZURL , NewHoo fue adquirido por Netscape Communications Corporation en octubre de 1998 y se convirtió en el Proyecto Directorio Abierto. Netscape publicó los datos del Directorio Abierto bajo la Licencia de Directorio Abierto. Netscape fue adquirido por AOL poco después y DMOZ fue uno de los activos incluidos en la adquisición.
Cuando Netscape asumió la dirección, el Open Directory Project tenía alrededor de 100.000 URL indexadas con contribuciones de unos 4500 editores. El 5 de octubre de 1999, el número de URL indexadas por DMOZ alcanzó el millón. Según una estimación no oficial, las URL en DMOZ sumaban 1,6 millones en abril de 2000, superando a las del Directorio de Yahoo! [10] DMOZ logró los hitos de indexar dos millones de URL el 14 de agosto de 2000, tres millones de listados el 18 de noviembre de 2001 y cuatro millones el 3 de diciembre de 2003. En abril de 2013, había 5.169.995 sitios listados en más de 1.017.500 categorías. El 31 de octubre de 2015, había 3.996.412 sitios listados en 1.026.706 categorías.
En enero de 2006, DMOZ comenzó a publicar informes en línea para informar al público sobre el desarrollo del proyecto. El primer informe cubrió el año 2005. Posteriormente se publicaron informes mensuales hasta septiembre de 2006. [11] Estos informes brindaron una mayor comprensión del funcionamiento del directorio que las estadísticas simplificadas proporcionadas en la página principal del directorio. El número de listados y categorías citados en la página principal incluía las categorías "Prueba" y "Marcadores", pero no estaban incluidas en el volcado RDF ofrecido a los usuarios. Hubo alrededor de 7330 editores activos durante agosto de 2006. [11] 75.151 editores habían contribuido al directorio al 31 de marzo de 2007. [12] En abril de 2013, el número de editores contribuyentes había aumentado a 97.584. [12]
El 20 de octubre de 2006, el servidor principal de DMOZ sufrió una falla catastrófica [13] que impidió que los editores trabajaran en el directorio hasta el 18 de diciembre de 2006. Durante ese período, una versión anterior del directorio estuvo visible para el público. El 13 de enero de 2007, los formularios de sugerencias de sitios y de listados de actualizaciones volvieron a estar disponibles. [14] El 26 de enero de 2007, se reanudó la publicación semanal de volcados RDF. Para evitar futuras interrupciones, a partir de ese momento el sistema residió en una configuración redundante de dos servidores basados en Intel. [15]
La interfaz del sitio se actualizó en 2016, con el nombre "DMOZ 3.0", pero AOL lo retiró del mercado al año siguiente.
A medida que DMOZ se hizo más conocido, surgieron otros dos importantes directorios web editados por voluntarios y patrocinados por Go.com y Zeal , ambos hoy en día inactivos. Estos directorios no otorgaban licencias para su contenido para su distribución abierta . [16] [17]
El concepto de utilizar una comunidad de editores a gran escala para compilar contenido en línea se ha aplicado con éxito a otros tipos de proyectos. El modelo de edición de DMOZ inspiró directamente al menos otros tres proyectos voluntarios de contenido abierto: el sitio de música MusicMoz, un directorio de restaurantes de contenido abierto conocido como ChefMoz [18] y una enciclopedia conocida como Open Site. [19] Finalmente, según Larry Sanger , DMOZ fue parte de la inspiración para el proyecto Nupedia , del cual surgió Wikipedia . [20]
Gnuhoo tomó prestado el esquema básico para su ontología inicial de Usenet . En 1998, Rich Skrenta dijo: "Tomé una larga lista de grupos y los edité a mano para formar una jerarquía". [21] Por ejemplo, el tema cubierto por el grupo de noticias comp.ai.alife estaba representado por la categoría Computadoras/IA/Vida_artificial. Las divisiones originales eran para Adultos , Artes , Negocios , Computadoras , Juegos , Salud , Hogar , Noticias , Recreación , Referencia , Regional , Ciencia , Compras , Sociedad , Deportes y "Mundo". Si bien estas dieciséis categorías de nivel superior se han mantenido intactas, la ontología de las categorías de segundo y menor nivel ha experimentado una evolución gradual; los cambios significativos se inician mediante discusión entre editores y luego se implementan cuando se ha alcanzado un consenso.
En julio de 1998, el directorio pasó a ser multilingüe con la incorporación de la categoría de nivel superior Mundial . El resto del directorio sólo incluye sitios en idioma inglés. En mayo de 2005, había setenta y cinco idiomas representados. La tasa de crecimiento de los componentes no ingleses del directorio había sido mayor que la del componente inglés desde 2002. Mientras que el componente inglés del directorio contenía casi el 75% de los sitios en 2003, el nivel Mundial creció a más de 1,5 millones de sitios en mayo de 2005, lo que representa aproximadamente un tercio del directorio. La ontología de las categorías no inglesas generalmente refleja la del directorio inglés, aunque son bastante comunes las excepciones que reflejan diferencias lingüísticas.
Varias de las categorías de nivel superior tienen características únicas. La categoría Adultos no está presente en la página de inicio del directorio, pero está completamente disponible en el volcado RDF que proporciona DMOZ. Si bien la mayor parte del directorio está categorizada principalmente por tema, la categoría Regional está categorizada principalmente por región. Esto ha llevado a muchos a ver DMOZ como dos directorios paralelos: Regional y Topical .
El 14 de noviembre de 2000 se creó un directorio especial dentro del DMOZ para personas menores de 18 años. [22] Los factores clave que distinguen esta área "Niños y adolescentes" del directorio principal son:
En mayo de 2005, esta parte de DMOZ incluía más de 32.000 listados de sitios.
Desde principios de 2004, todo el sitio estaba codificado en UTF-8 . Antes de esto, la codificación había sido ISO 8859-1 para las categorías en inglés y un conjunto de caracteres dependiente del idioma para otros idiomas. Los volcados RDF se codificaron en UTF-8 desde principios de 2000.
Los editores se encargaban del mantenimiento de los listados de directorios. Mientras que algunos editores se centraban en la incorporación de nuevos listados, otros se centraban en el mantenimiento de los listados existentes y algunos hacían ambas cosas. Esto incluía tareas como la edición de listados individuales para corregir errores ortográficos o gramaticales, así como el control del estado de los sitios vinculados. Otros revisaban los envíos de sitios para eliminar el spam y los envíos duplicados.
Robozilla era un rastreador web diseñado para verificar el estado de todos los sitios incluidos en DMOZ. Periódicamente, Robozilla marcaba los sitios que parecían haberse movido o desaparecido y los editores hacían un seguimiento para verificar los sitios y tomar medidas. Este proceso era fundamental para el directorio en su esfuerzo por lograr uno de sus objetivos fundacionales: reducir la pérdida de enlaces en los directorios web. Poco después de cada ejecución, los sitios marcados con errores se movían automáticamente a la cola de sitios sin revisar, donde los editores podían investigarlos cuando el tiempo lo permitiera.
Debido a la popularidad de DMOZ y su impacto resultante en las clasificaciones de los motores de búsqueda (ver PageRank ), los dominios con registros vencidos que figuraban en DMOZ atrajeron el secuestro de dominios , un problema que se solucionó eliminando regularmente los dominios vencidos del directorio.
Si bien la financiación corporativa y el personal de DMOZ disminuyeron con el tiempo, los voluntarios crearon herramientas de edición como verificadores de enlaces para complementar a Robozilla, rastreadores de categorías, correctores ortográficos, herramientas de búsqueda que examinan directamente un volcado RDF reciente, bookmarklets para ayudar a automatizar algunas funciones de edición, complementos basados en Mozilla, [24] y herramientas que ayudaron a trabajar con colas no revisadas.
Anteriormente, los datos de DMOZ estaban disponibles bajo los términos de la Licencia de Directorio Abierto, que requería una tabla de atribución de DMOZ específica en cada página web que utiliza los datos.
La Licencia de Directorio Abierto también incluía un requisito por el cual los usuarios de los datos debían consultar continuamente el sitio DMOZ para ver si había actualizaciones y dejar de usar y distribuir los datos o las obras derivadas de los datos una vez que se produjera una actualización. Esta restricción llevó a la Free Software Foundation a referirse a la Licencia de Directorio Abierto como una licencia de documentación no libre, citando el derecho a redistribuir una versión determinada que no era permanente y el requisito de comprobar si había cambios en la licencia.
En 2011, DMOZ cambió silenciosamente su licencia a una licencia Creative Commons Attribution [ cita requerida ] , que es una licencia libre (y compatible con GPL). [25]
Los datos DMOZ se ponen a disposición a través de un volcado similar a RDF que se publica en un servidor de descarga, las versiones anteriores también se archivan allí. [26] Las nuevas versiones se generan normalmente semanalmente. Un editor DMOZ ha catalogado una serie de errores que se encuentran en el volcado RDF de DMOZ, el más importante de los cuales es que el formato de archivo no es RDF. [27] Por lo tanto, si bien hoy en día el llamado volcado RDF es XML válido , no es RDF válido y, como tal, el software para procesar el volcado RDF de DMOZ debe estar escrito específicamente para datos DMOZ.
Los datos de DMOZ alimentan los servicios de directorio básicos de muchos de los motores de búsqueda y portales más importantes de la Web, incluidos Netscape Search, AOL Search y Alexa . Google Directory utilizó información de DMOZ hasta que fue cerrado en julio de 2011. [28]
Los datos de DMOZ también se utilizan para otros fines. Por ejemplo, en la primavera de 2004 Overture anunció un servicio de búsqueda para terceros que combinaba los resultados de búsqueda del directorio Yahoo! con títulos, descripciones y metadatos de categorías de DMOZ. El motor de búsqueda Gigablast anunció el 12 de mayo de 2005 su copia de DMOZ con capacidad de búsqueda. La tecnología permite buscar sitios web incluidos en categorías específicas, "creando de manera instantánea más de 500.000 motores de búsqueda verticales". [29]
Al 8 de septiembre de 2006 [update], DMOZ enumeró 313 sitios web en idioma inglés que utilizan datos de DMOZ, así como 238 sitios en otros idiomas. [30] Sin embargo, estas cifras no reflejan el panorama completo de uso, ya que aquellos sitios que utilizan datos de DMOZ sin seguir los términos de la licencia de DMOZ no están listados.
Se imponen restricciones sobre quién puede convertirse en editor de DMOZ. El principal mecanismo de control es un proceso de solicitud de editor en el que los candidatos a editor demuestran sus habilidades de edición, revelan afiliaciones que podrían plantear un conflicto de intereses [ cita requerida ] y, de otro modo, dan una idea de cómo el solicitante probablemente encajaría con la cultura y la misión de DMOZ. [31] La mayoría de las solicitudes son rechazadas, pero se permite y, a veces, se alienta la presentación de nuevas solicitudes. Las mismas normas se aplican a los editores de todas las categorías y subcategorías. [ cita requerida ]
El modelo de edición de DMOZ es jerárquico . Al convertirse en editores, los individuos generalmente tendrán permisos de edición solo en una pequeña categoría. Una vez que hayan demostrado habilidades de edición básicas de conformidad con las Pautas de Edición, pueden solicitar privilegios de edición adicionales en una categoría más amplia o en otra categoría del directorio. Se fomentan las relaciones de mentoría entre editores y los foros internos brindan un vehículo para que los nuevos editores hagan preguntas. [ cita requerida ]
DMOZ tiene sus propios foros internos, cuyos contenidos están destinados únicamente a que los editores se comuniquen entre sí, principalmente sobre temas de edición. El acceso a los foros requiere una cuenta de editor y se espera que los editores mantengan el contenido de estos foros en privado. [32]
Con el tiempo, a los editores senior se les pueden otorgar privilegios adicionales que reflejen su experiencia de edición y liderazgo dentro de la comunidad de edición. El más sencillo es el privilegio de editar todo , que permite a un editor acceder a todas las categorías del directorio. Los privilegios meta también permiten a los editores realizar tareas como revisar aplicaciones de editor, configurar características de categorías y manejar informes de abuso internos y externos. Los privilegios cateditall son similares a edit all , pero solo para una sola categoría de directorio. De manera similar, los privilegios catmod son similares a meta , pero solo para una sola categoría de directorio. Los privilegios catmv permiten a los editores realizar cambios en la ontología del directorio moviendo o renombrando categorías. Todos estos privilegios son otorgados por administradores y personal, generalmente después de discutirlo con los editores meta . [ cita requerida ]
En agosto de 2004, se introdujo un nuevo nivel de privilegios llamado admin . El personal concedió el estatus de administrador a un número de metadatos con larga trayectoria. Los administradores tienen la capacidad de conceder privilegios de editall+ a otros editores y aprobar nuevas políticas para todo el directorio, poderes que antes sólo estaban disponibles para los editores root (personal). [33]
Se espera que todos los editores de DMOZ cumplan con las Pautas de Edición de DMOZ. Estas pautas describen los aspectos básicos de la edición: qué tipos de sitios pueden incluirse en la lista y cuáles no; cómo se deben titular y describir las listas de sitios de una manera coherente; convenciones para la denominación y la creación de categorías; limitaciones de conflictos de intereses en la edición de sitios que el editor puede poseer o con los que puede estar afiliado de alguna otra manera; y un código de conducta dentro de la comunidad. [34] Los editores que hayan violado estas pautas pueden ser contactados por el personal o los editores senior, se les pueden reducir los permisos de edición o perder sus privilegios de edición por completo. Las Pautas de DMOZ se revisan periódicamente después de un debate en los foros de editores. [ cita requerida ]
Desde hace tiempo se han formulado acusaciones de que los editores voluntarios de DMOZ dan un trato favorable a sus propios sitios web y, al mismo tiempo, frustran los esfuerzos de buena fe de sus competidores. [35] Estas acusaciones las presentan el personal de ODP y los editores meta, que tienen la autoridad de tomar medidas disciplinarias contra los editores voluntarios que sean sospechosos de participar en prácticas de edición abusivas. [36] En 2003, DMOZ introdujo un nuevo Sistema de Informe de Abuso Público que permite a los miembros del público en general informar y hacer un seguimiento de las acusaciones de conducta abusiva de los editores mediante un formulario en línea. [37] La discusión sin inhibiciones de las supuestas deficiencias de DMOZ se ha vuelto más común en los principales foros de discusión de webmasters . Aunque las políticas del sitio sugieren que un sitio individual debe enviarse a una sola categoría, [38] a octubre de 2007, Topix.com, un sitio de agregación de noticias operado por el fundador de DMOZ, Rich Skrenta, tenía más de 17.000 listados. [39]
En los inicios de DMOZ, su personal dio a los representantes de empresas seleccionadas, como Rolling Stone o CNN , acceso de edición para incluir páginas individuales en sus sitios web. [40] Se añadieron enlaces a artículos individuales de CNN hasta 2004, pero se eliminaron por completo del directorio en enero de 2008 [41] debido a que el contenido estaba desactualizado y no se consideraba que valiera la pena el esfuerzo de mantenerlo. Desde entonces, no ha habido experimentos similares con la política de edición.
La controversia que rodea a DMOZ se basa en su propiedad y gestión. Algunos de los voluntarios originales de GnuHoo sintieron que los habían engañado para que se unieran a una empresa comercial. [8] En distintos grados, esas quejas han continuado hasta el presente.
Al comienzo de DMOZ, se pensó poco en la idea de cómo debía gestionarse y no había foros oficiales , directrices ni preguntas frecuentes . [42]
Con el paso del tiempo, los foros de editores del ODP se convirtieron en el parlamento de facto del DMOZ, y cuando uno de los miembros del personal del DMOZ publicaba una opinión en los foros, se consideraba una decisión oficial. [32] Aun así, el personal del DMOZ comenzó a otorgar a los editores senior de confianza privilegios de edición adicionales, incluida la capacidad de aprobar nuevas solicitudes de editores, lo que eventualmente condujo a una jerarquía estratificada de deberes y privilegios entre los editores del DMOZ, y el personal remunerado del DMOZ tenía la última palabra con respecto a las políticas y procedimientos del DMOZ. [33] [43]
Robert Keating, director de Touchstone Consulting Group en Washington, DC, trabajó como gerente de programas de AOL para DMOZ a partir de 2004. Comenzó a trabajar para AOL en 1999 como editor senior de AOL Search, luego como editor gerente del programa DMOZ de AOL y luego como gerente del ecosistema de medios de AOL Product Marketing. [44] [45] [ verificación fallida ]
Los procedimientos de eliminación de editores de DMOZ son supervisados por el personal de DMOZ y los metaeditores. De acuerdo con las pautas editoriales oficiales de DMOZ, los editores son eliminados por prácticas de edición abusivas o comportamiento incivilizado. Las discusiones que pueden resultar en acciones disciplinarias contra editores voluntarios se llevan a cabo en un foro privado al que solo pueden acceder el personal de DMOZ y los metaeditores. Los editores voluntarios que están siendo discutidos no reciben notificación de que tales procedimientos se están llevando a cabo. [43] Algunas personas encuentran este arreglo desagradable, y desean en cambio una discusión modelada más como un juicio celebrado en el sistema judicial de los EE. UU. [46]
En el artículo "Explicación de la eliminación de editores", el editor meta de DMOZ, Arlarson, afirma que "una gran confusión sobre la eliminación de editores de DMOZ es resultado de declaraciones falsas o engañosas de antiguos editores". [47]
Las directrices de confidencialidad del DMOZ prohíben que cualquier editor actual del DMOZ que esté en condiciones de saber algo discuta las razones de las eliminaciones de editores específicos, [43] sin embargo, en las directrices se proporcionó una lista de posibles razones. [48] En el pasado, esto ha llevado a que los editores eliminados del DMOZ se pregunten por qué no pueden iniciar sesión en el DMOZ para realizar su trabajo de edición. [49] [50]
David F. Prenatt Jr., ex editor de DMOZ netesq , y otro ex editor conocido por el alias The Cunctator , ambos afirman haber sido eliminados por estar en desacuerdo con el personal sobre los cambios en las políticas, en particular las políticas de derechos de autor de DMOZ . Según sus afirmaciones, el personal usa la excusa del comportamiento incivilizado como un medio para eliminar a los editores molestos. [46] [51] [52]
Los editores senior de DMOZ tienen la capacidad de adjuntar notas de "advertencia" o "no incluir en la lista" a dominios individuales, pero ningún editor tiene la capacidad unilateral de bloquear la inclusión de determinados sitios en la lista. Los sitios con estas notas pueden seguir estando incluidos en la lista y, en ocasiones, las notas se eliminan después de un debate. [53]
Las críticas a la estructura jerárquica de DMOZ surgieron alrededor de 2005. Muchos creen que los directorios jerárquicos son demasiado complicados. Con la aparición de la Web 2.0 , comenzaron a aparecer las folksonomías , y algunos editores propusieron que las folksonomías, las redes y los gráficos dirigidos son más "naturales" y más fáciles de gestionar que las jerarquías. [54] [55] [56]
El software ODPSearch es una versión derivada de Isearch que es de código abierto y tiene licencia pública de Mozilla . [57]
Los foros del editor ODP funcionaban originalmente con un software basado en el sistema propietario Ultimate Bulletin Board. En junio de 2003, se pasó al sistema de código abierto phpBB . A partir de 2007, estos foros funcionaban con una versión modificada de phpBB.
El software de seguimiento de errores que utiliza el ODP es Bugzilla y el servidor web Apache . También se utilizaba el servidor proxy web Squid , pero se eliminó en agosto de 2007 cuando se reorganizaron los servidores de almacenamiento. Todas estas aplicaciones son de código abierto.
El software de edición y base de datos DMOZ es de código cerrado (aunque Richard Skrenta dijo en junio de 1998 que estaba considerando licenciarlo bajo la Licencia Pública General GNU ). Esto ha llevado a críticas del proyecto GNU antes mencionado, muchos de los cuales también criticaron la licencia de contenido DMOZ. El contenido fue publicado posteriormente bajo una licencia Creative Commons, que es compatible con la licencia GNU. [58]
Por ello, se han hecho algunos esfuerzos para ofrecer alternativas a DMOZ que permitan a las comunidades de editores con ideas afines crear y mantener sus propios directorios web de código abierto y contenido abierto.
Chef Moz , una rama de DMOZ, era un directorio de contenido abierto con enlaces a restaurantes en la World Wide Web . El sitio web fue creado y mantenido por una comunidad de editores voluntarios y era propiedad de Netscape .
Chef Moz, al igual que su padre DMOZ, utilizó un esquema de ontología jerárquica para organizar los listados de sitios. Los listados sobre un tema similar se agruparon en categorías, que luego pueden incluir categorías más pequeñas.
El 17 de febrero de 2011, la administradora de DMOZ, "lisagirl", confirmó que el Chef Moz estaba muerto. [59]
Desde sus inicios en 2000 hasta noviembre de 2009 (cuando se hizo imposible para los editores iniciar sesión en el sitio), ChefMoz ha crecido hasta convertirse en el directorio global de restaurantes más grande de Internet. El número total de restaurantes indexados desde 2000 se registra en la siguiente tabla: [60]