stringtranslate.com

Wikipedia:Tamaño de Wikipedia

  • WP:TAMAÑOWP
  • WP:TAMAÑO WPS
Un desglose en forma de mapa de árbol de las áreas temáticas de Wikipedia a febrero de 2016, basado en una muestra aleatoria de 1000 artículos
Una imagen que estima el tamaño de una versión impresa de Wikipedia en marzo de 2020 (a partir de una imagen actualizada automáticamente basada en el uso de volúmenes de la Encyclopædia Britannica con una silueta de un hombre promedio como escala)

El tamaño de la Wikipedia en inglés se puede medir en términos de número de artículos, número de palabras, número de páginas y tamaño de la base de datos, entre otras formas. A fecha de 17 de octubre de 2024, hay 6.896.953 artículos en la Wikipedia en inglés que contienen más de 4.6 mil millones de palabras (lo que da un promedio de aproximadamente 681 palabras por artículo). El número total de páginas es de 61.659.198. Los artículos representan el 11,19 por ciento de todas las páginas de Wikipedia. A fecha de 16 de octubre de 2024, el tamaño de la versión actual de todos los artículos comprimidos es de aproximadamente 24,09 GB sin medios. [1] [2]

Wikipedia sigue creciendo y el número de artículos en Wikipedia aumenta a un ritmo de unos 14.000 al mes (a fecha de enero de 2024). El número de artículos añadidos a Wikipedia cada mes alcanzó su pico en 2006, con más de 50.000 artículos nuevos al mes, y ha ido disminuyendo de forma lenta pero constante desde entonces. Aunque esto podría parecer una señal de que el crecimiento de Wikipedia se está desacelerando o deteniéndose, cabe señalar que la cantidad de texto añadido a los artículos de Wikipedia cada año se ha mantenido constante desde 2006, con aproximadamente 1 gigabyte de texto (comprimido) añadido al año. Esto implica que, a medida que pasa el tiempo, se añade proporcionalmente más contenido a los artículos existentes que a los nuevos, y que Wikipedia ha mantenido la misma tasa de crecimiento persistente desde la década de 2010. En otras palabras, con el tiempo, el tamaño medio de los artículos crece más rápido que el número de artículos.

La mayoría de las entradas anteriores se extrajeron de Wikipedia:Milestones . Las entradas posteriores se tomaron de observaciones de las funciones de recuento de artículos integradas del nuevo software. Para obtener información sobre qué software de Wikipedia cuenta como artículo, consulte Wikipedia:Qué es un artículo#Listas de artículos y estadísticas .

El recuento de artículos de Wikipedias generadas por robots, como la edición en cebuano de Wikipedia, así como las ediciones en sueco , holandés y waray , crece mucho más rápido que aquellas escritas principalmente por humanos, como la Wikipedia en inglés. . Lsjbot del wikipedista sueco Sverker Johansson es el autor principal de esas cuatro Wikipedias generadas principalmente por bots. El cebuano y el waray son lenguas filipinas . Sin embargo, los artículos individuales en Wikipedias generadas por bots son, en promedio, mucho más cortos que los de Wikipedias escritas principalmente por humanos. [3] Por lo tanto, el recuento de artículos por sí solo es un indicador muy pobre de la escala y el alcance de todas las ediciones de Wikipedia.

Crecimiento del número de artículos en Wikipedia

Antes de 2012, el crecimiento de Wikipedia seguía aproximadamente un modelo de crecimiento de Gompertz. Este modelo se creó en junio de 2010 y está determinado por la función de Gompertz .

,

con parámetros

a = 4.378.449
b = −15,42677
c = −0,384124
t es el tiempo en años desde el 1/1/2000 (por lo que el 1/1/2010 es t = 10,00)

y donde e es la constante 2,71828... ( número de Euler ).

Número de artículos de Wikipedia en inglés [4]
Editores de Wikipedia en inglés con más de 100 ediciones por mes [5]


Algunas características de este modelo son:

Este modelo está relacionado con la cantidad (número de artículos). La calidad puede aumentar de forma independiente según el artículo individual. El modelo no tiene en cuenta el tamaño del artículo.

Gráficas de tamaño y tasa de crecimiento

En esta sección, el primer gráfico muestra el número total histórico y esperado de artículos; en el segundo gráfico, la tasa de crecimiento mensual, que se ha desacelerado desde finales de 2006 (la serie tiende a la baja).

Un análisis detallado de los datos muestra que, entre 2006 y 2009, la tasa de crecimiento de los artículos siguió un ciclo semestral, con un crecimiento más rápido en febrero y agosto que en mayo y noviembre. Este ciclo no aparece en el gráfico de la tasa de crecimiento porque los valores que se muestran en el gráfico se han promediado durante períodos de seis meses.

El gráfico final de esta sección muestra el crecimiento de las páginas de contenido (es decir, incluyendo artículos y otras páginas) hasta mayo de 2019: observe la tendencia de crecimiento casi lineal desde 2018.

Tenga en cuenta la pequeña caída en el número de artículos desde finales de agosto de 2022 hasta principios de septiembre de 2022.

Tasa de crecimiento anual de la Wikipedia en inglés

A este ritmo, faltan 199 días para que la Wikipedia en inglés alcance los 7 millones de artículos.

Número de palabras

A partir de septiembre de 2024, hay más de 4700 millones de palabras en todos los artículos de Wikipedia en inglés, aproximadamente 681 palabras por artículo y alrededor de 28 200 millones de caracteres, suponiendo que cada palabra tiene seis caracteres (cinco letras por palabra en promedio más un espacio o signo de puntuación). Para ver el recuento de palabras más reciente, consulte la página Especial:Estadísticas .

La tabla que aparece a continuación muestra únicamente el número de palabras en todas las páginas de contenido, es decir, los 6.896.953 artículos; no incluye palabras en otros espacios de nombres como Discusión, Usuario o Wikipedia. Los datos de 2002 a 2010 proceden del antiguo Wikistats-1 y, por tanto, solo son precisos hasta el mes en lugar de hasta un día específico dentro de un mes. Los datos de 2018 al presente proceden de la página Special:Statistics, tal y como se guardó en esa fecha en Internet Archive . No hay registro del número de palabras desde enero de 2010 hasta diciembre de 2017; Wikistats-1 ya no incluye el número de palabras después de enero de 2010, y la página Special:Statistics solo empezó a mostrar el número de palabras en todas las páginas de contenido en diciembre de 2017. En algún momento dentro de ese lapso de casi ocho años, el número medio de palabras descendió. Tenga en cuenta que Internet Archive no siempre tiene una versión archivada de la página Special:Statistics el primer día de cada año.

Estadísticas anuales

Un aumento promedio por año desde 2010 hasta 2018; aumento total de 1.279.581.000 palabras durante el mismo período de tiempo
B Aumento porcentual promedio por año de 2010 a 2018; aumento general del 71% durante el mismo período de tiempo
C Aumento promedio por día de 2010 a 2018
D En lo que va del año

Estadísticas mensuales de enero de 2019 a agosto de 2024

La siguiente tabla incluye el número total de palabras en todos los artículos y el número de palabras agregadas al comienzo o cerca del comienzo de cada mes desde enero de 2019 hasta agosto de 2024.

Número de páginas

A fecha de 17 de octubre de 2024, hay 61.659.198 páginas en la Wikipedia en inglés , de las cuales 6.896.953 (11,19%) son artículos, que se encuentran en el espacio de nombres principal , o simplemente mainspace . El resto de las páginas pertenecen a uno de los otros 11 espacios de nombres , enumerados aquí en orden alfabético: Categoría, Borrador, Archivo, Ayuda, MediaWiki, Módulo, Portal, Plantilla, TimedText, Usuario y Wikipedia. Cada página de Wikipedia también puede tener una página de discusión correspondiente. Los datos de esta tabla proceden de la página Special:Statistics , tal y como la guardó Internet Archive en esa fecha . Tenga en cuenta que Internet Archive no siempre tiene una versión archivada de la página Special:Statistics el primer día de cada año. Con el tiempo, el porcentaje de todas las páginas de Wikipedia que constan de artículos disminuye a medida que se crean más páginas que no son artículos que artículos.

Tamaño de la base de datos de Wikipedia en inglés

Texto total del artículo en Wikipedia en inglés, medido en gigabytes (comprimido). [6]

Hay varios elementos de la base de datos de Wikipedia que se deben tener en cuenta al describir su tamaño. Los más obvios incluyen el texto de marcado de los artículos, las plantillas, las descripciones de los archivos y los medios y las metapáginas principales que serían necesarias para representar correctamente el texto de la última versión de la enciclopedia actual. Las páginas de discusión asociadas y los otros espacios de nombres (Usuario, Wikipedia, Ayuda, etc.) a menudo se consideran por separado. Cada uno de ellos tiene un historial de edición asociado, etc. Además, están las imágenes y otros elementos multimedia (almacenados en común en todas las Wikipedias). Es importante tener en cuenta si los datos están comprimidos y, en caso afirmativo, qué esquema de compresión se utiliza. Además de la Wikipedia en inglés, también hay cientos de Wikipedias en otros idiomas que se deben considerar.

En abril de 2010, el tamaño del historial de edición completo de Wikipedia en inglés era de 5,6 TB sin comprimir. [7]

A partir de junio de 2015, el volcado de todas las páginas con el historial de edición completo en formato XML en enwiki dump progress del 20150602 es de aproximadamente 100 GB comprimidos con 7-Zip y 10 TB sin comprimir.

En mayo de 2015, la versión actual del artículo/plantilla/texto de redirección de Wikipedia en inglés ocupaba aproximadamente 51 GB sin comprimir en formato XML.

El tamaño del texto del artículo en la Wikipedia en inglés, medido en gigabytes (comprimido), creció de manera constante desde 1 GB en 2006 a 9 GB en 2013 y a 11,5 GB en 2015, como se muestra en el gráfico. Sin embargo, debido a un error en la compilación del volcado de datos de abril de 2016, el tamaño del texto del artículo se redujo aproximadamente un 9 por ciento a 10,8 GB comprimido (aunque el tamaño real del texto del artículo aumentó en realidad, lo que se puede ver al comparar con los volcados de datos de marzo y mayo de 2016). [8] Asimismo, también hay un error similar al compilar los datos del 20 de abril de 2018, que se muestran como 12,85 GB (nuevamente, el tamaño real del texto del artículo aumentó en realidad, como se puede ver al comparar los meses anteriores y posteriores). [9]

En febrero de 2013, el archivo XML que contenía únicamente las páginas actuales, sin páginas de usuario ni de discusión, ocupaba 42.987.293.445 bytes sin comprimir (43 GB). El archivo XML con las páginas actuales, incluidas las páginas de usuario y de discusión, ocupaba 93.754.003.797 bytes sin comprimir (94 GB). Los volcados de historial completos, los 174 archivos, ocupaban 10.005.676.791.734 bytes (10 TB). [10]

En agosto de 2023, Wikimedia Commons, que incluye las imágenes, los vídeos y otros medios utilizados en todas las Wikipedias específicas de cada idioma, contenía 96.519.778 archivos, con un total de 470.991.810.222.099 bytes (428,36 TB). [11]

Otras fuentes de estimaciones de tamaño recientes son:

Comparaciones con otras Wikipedias

Distribución de los 63.816.354 artículos en ediciones en diferentes idiomas (a 17 de octubre de 2024) [12]

  Inglés (10,8%)
  Cebuano (9,6%)
  Alemán (4,6%)
  Francés (4,1%)
  Sueco (4,1%)
  Holandés (3,4%)
  Ruso (3,1%)
  Español (3,1%)
  Italiano (3%)
  Polaco (2,6%)
  Otros (51,6%)

Códigos: en - inglés • es - español • de - alemán • ja - japonés • ru - ruso • fr - francés • it - italiano • pl - polaco • pt - portugués • zh - chino

Este gráfico se basa en datos de https://stats.wikimedia.org/EN/TablesArticlesTotal.htm al 14 de junio de 2015, con valores recientes para la Wikipedia en inglés tomados de los datos que aparecen a continuación. La suma incluye los más de 270 idiomas de Wikipedia. Consulte la página principal en https://www.wikipedia.org para obtener un recuento reciente de artículos de las diez Wikipedias más grandes.

La edición en inglés sigue siendo la Wikipedia más grande, ligeramente más grande que la segunda edición más grande, la Wikipedia en cebuano . Muchas otras ediciones compartieron el crecimiento cuasi exponencial de la edición en inglés, aunque con un retraso de uno a tres años. A medida que estas otras Wikipedias han crecido, el porcentaje general de artículos en inglés ha ido disminuyendo de forma constante y cayó por debajo del 25 por ciento en marzo de 2007. El porcentaje de artículos en las diez Wikipedias más grandes también ha ido disminuyendo, aunque estas diez principales todavía representan alrededor del 67 por ciento de todos los artículos de Wikipedia en junio de 2007. Tenga en cuenta que Lsjbot , un bot dirigido por Sverker Johansson , es responsable de gran parte del crecimiento de la segunda y quinta Wikipedias más grandes, la Wikipedia en cebuano y la Wikipedia en sueco , respectivamente, así como del rápido crecimiento de la Wikipedia en waray . Los gráficos no muestran las Wikipedias en cebuano, sueco o waray. El crecimiento del número de artículos de esas tres Wikipedias consiste principalmente en esbozos relacionados con organismos vivos y entidades geográficas (como islas, ríos, represas y montañas).

Actualmente, la Wikipedia en inglés representa el 10,81 por ciento de todos los volúmenes en todas las ediciones de Wikipedia.

El tamaño de la base de datos de Wikipedia en inglés es apenas diez veces mayor que el de la siguiente Wikipedia más grande por cantidad de artículos, la Wikipedia en cebuano. (A octubre de 2023)

Cronología de versiones de software

Este conjunto de datos señala el hecho de que estas cifras se extraen de múltiples fuentes de datos y diferentes estimaciones (consulte la clave a continuación para obtener más detalles) y las presenta como una tabla lista para usar en una hoja de cálculo para realizar gráficos. Los conjuntos de datos originales están archivados: consulte los enlaces a continuación. Tenga en cuenta también que las cifras se toman en momentos aleatorios del día.

Tamaño de la copia impresa

A principios de 2015, Michael Mandiberg publicó la Wikipedia en inglés en 7473 volúmenes de 700 páginas cada uno a través de Lulu , una plataforma de autopublicación, distribuidor y minorista de libros electrónicos e impresos en línea. [13]

El siguiente gráfico ilustra el tamaño que podría tener la Wikipedia en inglés si los artículos (sin imágenes ni otro contenido multimedia) se imprimieran y encuadernaran en forma de libro con un formato similar al de la Encyclopædia Britannica . Se supone que cada volumen tiene 25 cm (9,8 pulgadas) de alto, 5 cm (2,0 pulgadas) de grosor y contiene 1.600.000 palabras u 8.000.000 de caracteres. El tamaño de esta ilustración se basa en el recuento de artículos en vivo ajustado manualmente por el recuento de palabras promedio de forma irregular en una subpágina de usuario.

El conjunto de datos

Clave de los datos a continuación:

Ahora ampliado y anotado con información de origen (algo gnómica ). Nótese que los tiempos de muestreo solo se registran hasta el día indicado por el usuario que registra la entrada y que no hay información clara de la zona horaria para ese día. Sin embargo, la mayoría de los recuentos más recientes (hasta 2022) se tomaron al comienzo del día según la UTC tomada de la tabla Lista de Wikipedias en Meta Wiki. Desde 2023, los recuentos se toman aproximadamente a la misma hora, aunque se toman de la nueva tabla Lista de Wikipedias en Wikimedia Commons, ya que deja un registro de revisión permanente en su página de historial, aunque no necesariamente a la medianoche UTC.

Nota: El recuento actual de artículos mpac3.2 para la Wikipedia en inglés es de 6.896.953 artículos.