stringtranslate.com

Wikipedia:Intersección de categorías

La categoría azul A, la categoría rosa B y la intersección violeta llamada A ∩ B

La intersección de categorías es la capacidad de encontrar todos los artículos que pertenecen a más de una categoría. Requiere un cambio en el software de MediaWiki, así como un cambio importante en las políticas relacionadas con la forma en que se rellenan las categorías. Se espera que estos cambios resuelvan algunos problemas de categorización de larga data y pongan fin a algunos conflictos comunes entre los editores de Wikipedia. La intersección de categorías también ofrece la posibilidad de agregar varias características nuevas que beneficiarán a los usuarios al agregar valiosas herramientas de investigación e indexación, además de hacer que el sistema de categorías sea más fácil de administrar.

Muchas categorías existentes son, lógicamente, la intersección de atributos para los que existen categorías "primarias", por ejemplo, Category:American agents es, lógicamente, la intersección de Category:Actors y Category:American people . Aunque estas categorías "primarias" se subdividen hoy en día en general en subcategorías, si se completaran directamente (por completo) las "categorías de intersección" podrían generarse automáticamente. Las categorías en la Wikipedia en alemán ya están organizadas en categorías primarias completamente completadas.

Esta propuesta intenta prever los cambios necesarios para que la intersección de categorías sea una realidad. Está diseñada para ampliar el sistema de categorización actual, no para reemplazarlo.

Fondo

Cuando se añadieron las categorías a Wikipedia en 2004, no existía ningún mecanismo para limitar los resultados de búsqueda de categorías grandes. Las categorías muy grandes causaban problemas de rendimiento, y se realizó un cambio de software para limitar los resultados de búsqueda a 200 entradas a la vez. Si hay más de 200 entradas, los usuarios deben navegar por varias páginas para ver todas las entradas. Este mecanismo de navegación página por página se vuelve poco práctico con categorías grandes, ya que lleva demasiado tiempo ver las entradas al final del alfabeto. Las consideraciones de rendimiento de las categorías grandes y la navegación página por página precipitaron políticas para despoblar las categorías grandes en subcategorías más pequeñas.

A mediados de 2005 se creó la plantilla de índice de categorías {{ CategoryTOC }}. Con el índice se hizo posible navegar por categorías muy grandes con unos pocos clics. Debido a la combinación del cambio de rendimiento y CategoryTOC, ya no hay ninguna razón para que las categorías tengan que ser pequeñas.

Las taxonomías de categorías múltiples han formado parte del esquema de categorización desde el principio. Es posible tomar una categoría y subcategorizarla de muchas maneras diferentes. El uso de estas categorías de "subconjunto" dificulta la búsqueda de todos los miembros de una categoría de "nivel superior"; o bien los artículos tienen que añadirse tanto a la categoría de "subconjunto" como a la de "nivel superior" o bien los miembros de las "subcategorías" (y, recursivamente, sus subcategorías) tienen que enumerarse. Definir con precisión las circunstancias en las que los artículos deben añadirse tanto a la categoría de "nivel inferior" como a la de "nivel superior", e incluso si esto es apropiado en algún momento, sigue siendo una fuente de constante discusión entre los editores (véase, por ejemplo, Wikipedia:Categorización/Categorías y subcategorías y Wikipedia discusión:Categorización/Archivo 7 ).

Esta historia ha dado lugar a varias visiones superpuestas sobre el propósito de las categorías de Wikipedia y a la creación de varios tipos distintos de categorías:

La intersección de categorías ha sido una característica deseada durante bastante tiempo. Al revisar los archivos de la lista de correo wikitech-l, alguien incluso escribió el código que implementa una versión de la intersección de categorías. Este comentario señala su limitación: "No veo cómo esto puede ser más que marginalmente útil a menos que también busque en todas las subcategorías con una profundidad infinita (¡¿con comprobaciones de recursión?!)".

Uso de la búsqueda de MediaWiki para encontrar intersecciones de categorías

Es posible utilizar el parámetro de búsqueda incategory: para encontrar intersecciones de categorías; sin embargo, esta función no busca dentro de las subcategorías. Para encontrar una intersección de categorías, escriba incategory:"CategoryName"en el cuadro de búsqueda para cada categoría de interés. Por ejemplo, incategory:"Películas alemanas" incategory:"Películas de 1998" devolverá los artículos que son comunes a ambas categorías: películas alemanas estrenadas en 1998. También se pueden encontrar resultados similares utilizando el servicio de consulta Wikidata .

La propuesta central

Categorías primarias completamente pobladas

Para que la intersección de categorías funcione mejor, muchas categorías deben estar completamente pobladas. Las categorías deberán estar pobladas con TODOS los artículos que cumplan con la definición de la categoría o no tener NINGUNO de los artículos porque se pueden encontrar en subcategorías. Si una categoría está completamente poblada, se denominaría categoría " Principal ". Las categorías primarias deben corresponder a los artículos temáticos. Eso significa que hay, o podría haber, un artículo epónimo para la categoría. Un ejemplo de esto es Director de cine .

La regla general sería: si una categoría puede expresarse completa y totalmente como la intersección de otras categorías, no es una categoría primaria y debe definirse solo como esta intersección. Por ejemplo, Category:American film directors puede definirse como la intersección de Category:Film directors y Category:American people , que a su vez serían categorías primarias completamente pobladas . Category:American film directors no existiría como una categoría "regular" y nunca aparecería como una categoría en ningún artículo. Los artículos en ambas categorías se mostrarían al seleccionar para ver su intersección. Si hay artículos que se relacionan con un tema de intersección, pero por alguna razón no están en una o más de las categorías intersectadas, pueden aparecer como enlaces wiki normales en una sección "Ver también" en la descripción de texto de la categoría de intersección. Por ejemplo, podría haber un comentario para ver un artículo llamado American film directors en la intersección correspondiente a Category:American film directors .

Todas las categorías existentes que son intersecciones se despoblarían y sus miembros se trasladarían a las categorías primarias más grandes. Algunas categorías primarias serán bastante grandes (como Category:American people ). Dado que están completamente pobladas, cada categoría primaria será un índice completo de todos los artículos de Wikipedia relacionados con el tema.

Esta propuesta cambiará la lista de categorías que aparece en los artículos. Solo aparecerán las categorías principales (completamente completadas). Por ejemplo, el artículo de Laurence Fishburne contiene actualmente las siguientes categorías:

Categorías: Nacidos en 1961 | Actores afroamericanos | Actores infantiles estadounidenses | Actores de cine estadounidenses | Actores de telenovelas estadounidenses | Actores de televisión estadounidenses | Personas vivas | Personas de Augusta, Georgia | Ganadores del premio Tony

Según esta propuesta contendría:

Categorías: Nacidos en 1961 | Personas de origen estadounidense | Personas de ascendencia africana | Actores | Actores infantiles | Actores de cine | Actores de televisión | Personas vivas | Personas de Georgia (estado de EE. UU.) | Personas de Augusta, Georgia | Ganadores del premio Tony

Hay algunas cosas que tener en cuenta sobre esto. La definición de algunas de estas categorías puede resultar confusa. Las categorías "Personas de" se definen actualmente como personas que tienen una conexión notable con el lugar, pero que podrían no ser ciudadanos del país más grande. Esto significa que tanto las subdivisiones más pequeñas como las más grandes son categorías primarias. Con el fin de facilitar las categorías de intersección, probablemente sería útil completar todas las subdivisiones geográficas a partir del nivel de nacionalidad hacia abajo. Del mismo modo, no es posible definir a los actores de cine como la intersección de "cine" (o gente de cine) y "actores", porque (por ejemplo) una persona podría ser un actor de teatro famoso que luego se convirtió en director de cine. Los artículos pueden pertenecer a estas dos categorías, pero NO a la categoría de "intersección", lo que significa que "actores de cine" no es un candidato para una categoría de intersección. Por esta razón, se podría decidir convertir a "actor" y todas las categorías de "actor por medio" en categorías primarias.

Nuevo espacio de nombres para intersecciones de categorías

Habrá un nuevo espacio de nombres para la creación de intersecciones de categorías. Las páginas en este espacio de nombres, tal vez llamadas "Índice" o "Intersección", se verían muy similares a una lista de artículos de la categoría. En esta propuesta se utilizan ambos nombres, pero se podría seleccionar cualquier otro nombre cuando se implemente esta propuesta. Las páginas de intersección se pueden crear sobre la marcha, simplemente escribiendo el nombre de la intersección que está buscando. Por ejemplo, podría ir a la página Intersección: Actor::Personas estadounidenses::Personas de ascendencia africana . Del mismo modo, este sería el marcado para crear un enlace a una página de intersección. (Nota: El marcado y la URL precisos pueden verse diferentes a esto). Por lo tanto, podría agregar un enlace a una página de intersección agregando:

[[Intersección:Actor::Personas estadounidenses::Personas de ascendencia africana]]

a una página. Como cualquier otro enlace, estos enlaces se pueden "canalizar" para que el texto que se muestra al usuario no tenga que ser el enlace "sin procesar". El enlace se mostraría como un enlace "azul" (la página existe) no en función de si existe una página en el espacio de nombres de intersección, sino en función de si todas las categorías que se intersecan existen en el espacio de nombres de categoría. Esto significa que cualquier intersección de categorías existentes parecería existir, independientemente de si un usuario ha "creado" previamente la página de intersección o no.

Las páginas de intersección se verán más o menos como páginas de categorías. Se mostrará el título de la página, posiblemente seguido de contenido generado manualmente (agregado al hacer clic en "editar"), luego los primeros 200 enlaces generados automáticamente a las subcategorías y artículos que son miembros de todas las categorías intersectadas (muy similar a una lista de categorías normal), tal vez seguido de un mecanismo para expandir o limitar aún más la intersección.

El título de la página enumerará las categorías que se intersectan en el orden especificado en la URL utilizada para acceder a la página. Dado que la categoría A intersectada con la categoría B es la misma que la categoría B intersectada con la categoría A, las páginas de intersección tienen varios sinónimos incorporados. Más sobre esto más adelante.

Intersección de categorías creadas por el usuario

Habrá varias formas para que los usuarios creen intersecciones de categorías:

  1. Escribiendo la URL de la intersección.
  2. Escribiendo el nombre de la intersección en el “cuadro de búsqueda” y haciendo clic en “Ir”.
  3. Creando un enlace a la intersección en una página y luego haciendo clic en el enlace. (Esto será útil para debates y para crear listas de páginas de intersecciones).
  4. Seleccionando las categorías que aparecen en la parte inferior de las páginas de los artículos.
  5. (en algunas variantes) Al seleccionar otras categorías para intersectar desde otra visualización de intersección

La cuarta (y quinta) opción sería una característica nueva y poderosa. Usando el mismo artículo de Laurence Fishburne como ejemplo, en lugar de la lista de categorías existente, las categorías podrían mostrarse de esta manera:

Categorías : Nacidos en 1961 | Personas vivas | ☑ Personas de Estados Unidos | Personas de Georgia (estado de EE. UU.) | Personas de Augusta, Georgia | Personas de ascendencia africana | Actores | Actores de cine | Actores de televisión | Ganadores del premio Tony
[ Mostrar artículos en todas las categorías seleccionadas ]
La redacción exacta del enlace puede ser diferente, por ejemplo, "Crear índice utilizando todas las categorías seleccionadas". También puede haber un enlace que diga "¿Qué es esto?"

Esta disposición es muy similar a cómo funcionan las etiquetas en Flickr.com, Delicious.com y Movie Wordpress Analyzer de IMDb. La lista de categorías existente tendría una casilla de verificación agregada al lado de cada categoría. Cualquier usuario podría ver el resultado de una intersección de categorías marcando las casillas junto a las categorías y luego haciendo clic en el enlace para ver el conjunto de intersecciones. En este caso, las tres casillas marcadas conducirían a una lista de intersecciones que es funcionalmente muy similar a la actual Category:Afro-American actresses , pero generada dinámicamente en función de una intersección de las categorías seleccionadas en lugar de completarse manualmente. Muchas categorías existentes podrían reemplazarse con intersecciones, y con este sistema cualquier intersección es posible, incluidas las que se han desaconsejado y/o eliminado anteriormente a través de WP:CFD .

Esto añade una pequeña cantidad de "desorden" de categorías, pero añade la posibilidad de generar la intersección de dos o más categorías. Puede haber unas cuantas categorías "principales" más de las que existen ahora, pero en general puede que en última instancia haya menos categorías enumeradas por artículo. TODAS las categorías que aparecen en la parte inferior de un artículo serían categorías primarias completamente pobladas y, por lo tanto, serían útiles como componentes de las intersecciones. Se podrían ver las intersecciones incluso si nadie hubiera creado explícitamente una página de intersección para ellas, por ejemplo, lo que ahora tendría que ser Categoría:Actores de cine afroamericanos de Augusta, Georgia, que ganaron un premio Tony. Esto crea el efecto de tener decenas de categorías sin saturar los artículos.

Las búsquedas en el espacio de nombres Intersección se realizarán ordenando primero las categorías intersectadas en orden alfabético antes de realizar una consulta a la base de datos para encontrar una intersección existente. De esta manera, cualquier permutación del orden de categorías en una URL o un enlace coincidirá con la página de intersección correspondiente.

Opciones y variaciones

Existen diversas variantes de esta propuesta. Los aspectos que varían se refieren a:

Para cada opción, se proporcionan maquetas y una subpágina con más detalles.

Opción: Transcluir intersecciones en categorías

Esta opción vincula estrechamente las intersecciones con las categorías. Las categorías que se pueden definir como intersecciones se despoblarían, pero seguirían estando en la estructura de categorías. En lugar de agregar artículos a la categoría, la página de intersección se asociaría con una página de categoría al asignarle el nombre de la categoría. Una vez nombrada, la página de intersección se vincularía a la categoría asociada y se incluiría automáticamente en ella. La estructura de categorización actual no se vería afectada con esta opción. Todas las categorías existentes actualmente permanecerían, algunas serían categorías "normales" y otras se redefinirían como categorías de "intersección".

Las características básicas de esta opción:

Maquetas:

Más detalles sobre esta opción: Wikipedia:Intersección de categorías/Transcluir intersecciones en categorías

Opción: Índices con nombre, separados de las categorías

Esta opción está diseñada a imagen de un índice que se puede encontrar en un libro. En esta opción, el espacio de intersección utiliza el nombre "Índice" y sus páginas contienen índices de artículos, así como enlaces a más páginas de índice. Al igual que la opción anterior, las páginas de "índice" pueden tener nombres. A diferencia de la opción anterior, las páginas de "índice" no están asociadas con categorías ni se incluyen en ellas. Las categorías que se pueden definir como intersecciones se eliminarán después de recategorizar los artículos en categorías primarias apropiadas. Las categorías eliminadas se reemplazan por índices que se pueden categorizar o vincular manualmente a páginas de categorías. Las páginas de "índice" tienen conjuntos de enlaces a otros índices que se generan automáticamente mediante el uso de las subcategorías de las categorías intersectadas. Esto permite a los usuarios pasar fácilmente de un índice a otros índices relacionados. Las páginas en el espacio de nombres de índice se pueden editar (de manera muy similar a cómo se pueden editar las categorías), lo que permite a los usuarios anotar la página de índice con texto descriptivo, agregar páginas de índice a categorías y agregar enlaces a otros índices relacionados.

Las características básicas de esta opción:

Maquetas:

Más detalles: Wikipedia:Intersección de categorías/Índices con nombre, separados de las categorías

Opción: Espacio de intersección separado

En esta opción, el espacio de nombres "intersección" estaría completamente separado del espacio de nombres "categoría". Las categorías que se pudieran definir como intersecciones se eliminarían después de recategorizar los artículos en categorías primarias apropiadas. Cada página en el espacio de nombres intersección incluiría una tabla de selección de intersecciones generada automáticamente , lo que permitiría a los usuarios pasar fácilmente de una intersección a otras intersecciones relacionadas. Las páginas en el espacio de nombres intersección podrían editarse (de manera muy similar a cómo se pueden editar las categorías), lo que permitiría a los usuarios anotar la página intersección con texto descriptivo y agregar páginas intersección a las categorías.

Las características básicas de esta opción:

Maquetas:

Más detalles: Wikipedia:Categoría intersección/Espacio de intersección separado

Otras variaciones

Son posibles otras variaciones. Es posible combinar, intercambiar y eliminar características de las tres opciones anteriores para crear otras opciones. Invitamos a los participantes de este debate a que agreguen cualquier idea que puedan tener.

Cambios en la política de categorización

Esta propuesta, si se implementa alguna de las opciones, tendrá un efecto importante en la política de categorización . Algunos de estos cambios pueden preverse y otros evolucionarán a medida que todos se acostumbren al nuevo sistema. También es necesario pensar y planificar mucho antes de implementar el cambio.

Una vez que el nuevo sistema esté en funcionamiento, será necesario revisar la política de categorización. Muchos aspectos del nuevo sistema probablemente serán controvertidos y es probable que se produzcan intensos debates. También es posible que haya menos controversia que con el sistema actual.

Categorías primarias

El principal cambio en la política será el concepto de una categoría primaria como se describió anteriormente. Las categorías primarias deben etiquetarse como tales, para que los editores sepan que deben completarlas por completo. Es posible que sea necesario dividir algunas categorías porque son categorías primarias y categorías de navegación . Una categoría de navegación es una categoría que contiene subdirectorios. Un ejemplo de esto es Category:American people by occupation . Las categorías de navegación no deben contener ningún artículo. Actualmente, Category:American people funciona como una categoría primaria y una categoría de navegación. Probablemente debería dividirse en Category:American people (que estaría completamente llena de artículos sobre estadounidenses) y Category:American people by type o algo similar (que tendría todas o la mayoría de las subcategorías). Category:American people by type sería entonces una subcategoría de Category:American people . Esto facilitará la navegación a través de las subcategorías, especialmente cuando las categorías primarias son muy grandes y tienen muchas subcategorías.

Categorías como tabla de contenidos: Navegación

Las pautas actuales establecen que las categorías están pensadas principalmente como un método para navegar por los artículos sobre un tema. No es necesario cambiar estas pautas.

Categorías como índice: Categorías primarias

Dado que las categorías principales estarán completamente rellenas, también funcionarán como un índice completo de su tema. Esta característica ya no estará reñida con otras funciones de las categorías. Las páginas de intersección agregarán capacidades de indexación adicionales.

Categorías como clasificación

En lugar de clasificar los artículos buscando la subcategoría más específica para el artículo, se clasificarán buscando todas las categorías principales a las que pertenecen. Su clasificación es, en esencia, el conjunto de intersección que selecciona todas sus categorías. En la mayoría de los casos, no habrá otros artículos con el mismo conjunto de categorías principales.

Taxonomías múltiples

Se han desaconsejado o eliminado muchas subcategorías porque no se consideraban subclasificaciones importantes de las categorías existentes. Esto ya no sería un problema con el nuevo sistema. Añadir atributos a las personas como género ( Categoría:Hombres o Categoría:Mujeres ) o religión ( Categoría:Metodistas ) ya no debería ser controvertido porque las subcategorías que utilicen estos atributos solo se verán si las personas las buscan. Esto permitirá que coexistan múltiples taxonomías.

En la actualidad, se prefieren ciertas taxonomías, como las subcategorías por nacionalidad y ocupación. Esto ya no será así. Ninguna taxonomía parecerá mejor que otra. Ciertamente, las taxonomías aún podrían eliminarse si se demuestra que no son enciclopédicas. Eliminar estas taxonomías solo requerirá eliminar una sola categoría principal. Una vez eliminadas, las páginas de intersección ya no mostrarán ningún artículo. Todos los enlaces a la intersección que utilicen la categoría principal eliminada aparecerán en rojo. En la opción uno, cualquier categoría con una intersección que tenga un enlace en rojo debería ser candidata a una eliminación rápida. En todas las opciones, cualquier página de intersección que tenga un enlace en rojo a una categoría principal también debería ser una eliminación rápida. Este proceso probablemente se pueda automatizar con un bot.

Categorías como búsqueda en una base de datos

Este sistema, al igual que el sistema de flickr.com, facilita la búsqueda de artículos que son similares en los aspectos deseados. A partir de un actor de Ohio, un usuario podrá encontrar todos los actores de Ohio. A partir de un poeta inglés nacido en 1883, podrá encontrar todos los poetas ingleses nacidos en 1883. A partir de un puente colgante de la ciudad de Nueva York, podrá encontrar todos los puentes colgantes de la ciudad de Nueva York. Esto no es posible actualmente para la mayoría de las búsquedas.

Actualizaciones futuras relacionadas

Categoría vista como un esquema

Actualmente, existe un consenso claro para no poner a las personas en la Categoría:Artistas y, en su lugar, ponerlas en las subcategorías de artistas. Puede ser útil en ocasiones ver un índice completo de lo que hay en la Categoría:Artistas , incluidos todos los contenidos de las subcategorías. Una futura actualización podría agregar la capacidad de ver cualquier Categoría en un esquema. Tal vez habría un enlace en la parte superior de cada categoría que diga "Ver como un esquema". Cuando se haga clic en el enlace, la vista de la categoría cambiará a una vista de esquema. Todas las subcategorías y artículos aparecerán como una lista alfabética única. Las subcategorías se formatearían de manera diferente a los artículos (quizás en negrita o con una fuente más grande). También habría otra opción que dijera "Mostrar contenidos de todas las subcategorías". Al hacer clic en esto, se agregarían los contenidos de las subcategorías a la categoría o lista. Si se seleccionan ambas opciones, el contenido de la subcategoría se sangraría y se enumeraría directamente debajo del encabezado de la subcategoría. La vista de índice solo abarcaría una cantidad determinada de niveles y no mostraría el contenido de ninguna categoría definida como intersección. Tal vez la profundidad del índice podría ser una preferencia del usuario. También podría haber una manera de "aplanar" el esquema para que el contenido de todas las subcategorías se combinara en una única lista alfabética.

Buscando en categorias

La interfaz de búsqueda podría ampliarse para incluir la posibilidad de encontrar artículos en categorías específicas también.

Herramientas disponibles actualmente

Mediawiki semántico

Hay una característica en Semantic MediaWiki llamada Conceptos, que resuelve los problemas que la intersección de categorías busca resolver mientras extiende el concepto aún más.

Extensión de Mediawiki "Búsqueda multicategoría"

La extensión "Búsqueda en múltiples categorías" presenta una nueva página especial que permite a los usuarios encontrar páginas incluidas en varias categorías específicas a la vez. También está disponible la transclusión de resultados de búsqueda.

Herramienta de intersección de categorías de Magnus Manske

Magnus Manske ha escrito una herramienta para realizar intersecciones de categorías:

Especial:Buscar/lista=API de búsqueda

Las páginas de búsqueda de Wikipedia, basadas en Elasticsearch, toman parámetros "incategory" que permiten limitar las búsquedas por categoría. Al combinar varios parámetros incategory, se pueden intersectar categorías.

Por ejemplo:

Digamos que tienes dos categorías:
Categoría:Atletas (atletismo) en los Juegos Olímpicos de Verano de 1984
Categoría:Velocistas francesas
Ambos grupos son demasiado grandes para analizarlos a simple vista, pero la intersección de las dos listas daría como resultado una lista concisa y agradable de las velocistas francesas que estuvieron en los Juegos de 1984. En realidad, no vale la pena crear categorías para esto, pero la intersección de las dos categorías sería un comportamiento realmente útil.
incategory:"Atletas (atletismo) en los Juegos Olímpicos de Verano de 1984" incategory:"Velocistas francesas"

Para la búsqueda básica de Mediawiki, a través de https://webapps.stackexchange.com/questions/28412/search-within-a-category-on-a-mediawiki-site, funciona

"[[Categoría:Atletas (atletismo) en los Juegos Olímpicos de Verano de 1984]]" "[[Categoría:Velocistas francesas]]"

Comentarios

Por favor responda en la página de discusión .

Véase también