stringtranslate.com

Wikipedia: Tamaño de Wikipedia

  • WP: TAMAÑOWP
  • WP: TAMAÑO WP
Un desglose similar a un mapa de árbol de las áreas temáticas de Wikipedia a febrero de 2016, basado en una muestra aleatoria de 1000 artículos.
Una imagen que estima el tamaño de una versión impresa de Wikipedia en marzo de 2020 (a partir de una imagen actualizada automáticamente basada en el uso de volúmenes de Encyclopædia Britannica con la silueta de un hombre promedio a escala)

El tamaño de la Wikipedia en inglés se puede medir en términos de número de artículos, número de palabras, número de páginas y tamaño de la base de datos, entre otras formas. Al 16 de marzo de 2024, hay 6.797.683 artículos en la Wikipedia en inglés que contienen más de 4.500 millones de palabras (lo que da un promedio de aproximadamente 668 palabras por artículo). El número total de páginas es 60.226.640. Los artículos representan el 11,29 por ciento de todas las páginas de Wikipedia. [1] Al 2 de julio de 2023, el tamaño de la versión actual de todos los artículos comprimidos es de aproximadamente 22,14 GB sin medios. [2] [3]

Wikipedia sigue creciendo y el número de artículos en Wikipedia aumenta en unos 14.000 al mes (a partir de enero de 2024). El número de artículos añadidos a Wikipedia cada mes alcanzó su punto máximo en 2006, con más de 50.000 nuevos artículos al mes, y ha ido disminuyendo lenta pero constantemente desde entonces. Si bien esto podría parecer mostrar que el crecimiento de Wikipedia se está desacelerando o deteniéndose, cabe señalar que la cantidad de texto agregado a los artículos de Wikipedia cada año ha sido constante desde 2006, aproximadamente 1 gigabyte de texto (comprimido) agregado por año. Esto implica que a medida que pasa el tiempo, proporcionalmente se agrega más contenido a los artículos existentes que a los nuevos, y que Wikipedia ha mantenido la misma tasa persistente de crecimiento desde la década de 2010. En otras palabras, con el tiempo, el tamaño promedio de los artículos crece más rápido que el número de artículos.

La mayoría de las entradas anteriores se extrajeron de Wikipedia: Milestones . Las entradas posteriores se toman de observaciones de las funciones integradas de recuento de artículos del nuevo software. Para obtener información sobre lo que el software de Wikipedia cuenta como artículo, consulte Wikipedia: ¿Qué es un artículo?#Listas de artículos y estadísticas .

El recuento de artículos de Wikipedias generadas por robots, como la edición en cebuano de Wikipedia, así como las ediciones en sueco , holandés y waray , crece mucho más rápido que aquellas que están escritas principalmente por humanos, como la Wikipedia en inglés. . Lsjbot del wikipedista sueco Sverker Johansson es el autor principal de esas cuatro Wikipedias generadas principalmente por bots. El cebuano y el waray son lenguas filipinas . Sin embargo, los artículos individuales en Wikipedias generadas por bots son, en promedio, mucho más cortos que los de Wikipedias escritas principalmente por humanos. [4] Por lo tanto, el recuento de artículos por sí solo es un indicador muy pobre de la escala y el alcance de todas las ediciones de Wikipedia.

Crecimiento del recuento de artículos en Wikipedia

Antes de 2012, el crecimiento de Wikipedia seguía aproximadamente un modelo de crecimiento de Gompertz. Este modelo fue creado en junio de 2010 y está determinado por la función de Gompertz ,

,

con parametros

un = 4378449
segundo = −15,42677
c = −0,384124
t es el tiempo en años desde 2000/1/1 (por lo que 2010/1/1 es t = 10,00)

y donde e es la constante 2,71828... ( número de Euler ).

Número de artículos de Wikipedia en inglés [5]
Editores de Wikipedia en inglés con >100 ediciones por mes [6]


Algunas características de este modelo son:

Este modelo está relacionado con la cantidad (número de artículos). La calidad aún puede aumentar de forma independiente dependiendo del artículo individual. El modelo no tiene en cuenta el tamaño del artículo.

Gráficos de tamaño y tasa de crecimiento.

En esta sección, el primer gráfico muestra el número total histórico y esperado de artículos; en el segundo gráfico, la tasa de crecimiento mensual, desacelerándose desde finales de 2006 (serie con tendencia a la baja).

Un análisis detallado de los datos muestra que de 2006 a 2009 la tasa de crecimiento de artículos siguió un ciclo semestral con un crecimiento más rápido en febrero y agosto que en mayo y noviembre. Este ciclo no aparece aquí en el gráfico de tasa de crecimiento porque los valores mostrados en el gráfico se han promediado durante períodos de seis meses.

El gráfico final de esta sección muestra el crecimiento de las páginas de contenido (es decir, incluidos artículos y otras páginas) hasta mayo de 2019: observe la tendencia de crecimiento casi lineal desde 2018.

Tenga en cuenta la pequeña caída en el recuento de artículos desde finales de agosto de 2022 hasta principios de septiembre de 2022.

Tasa de crecimiento anual de la Wikipedia en inglés

A este ritmo, faltan 384 días para que la Wikipedia en inglés alcance los 7 millones de artículos.

Número de palabras

En febrero de 2024, hay más de 4.5 mil millones de palabras en todos los artículos de Wikipedia en inglés, alrededor de 670 palabras por artículo y alrededor de 27 mil millones de caracteres, suponiendo que cada palabra tenga seis caracteres (cinco letras por cada palabra en promedio más un espacio o signo de puntuación). Para conocer el recuento de palabras más reciente, consulte la página Especial:Estadísticas .

La siguiente tabla muestra sólo el número de palabras en todas las páginas de contenido, es decir, los 6.797.683 artículos; no incluye palabras en otros espacios de nombres como Talk, User o Wikipedia. Los datos de 2002 a 2010 provienen del antiguo Wikistats-1 y, por lo tanto, solo son precisos para el mes en lugar de un día específico dentro de un mes. Los datos desde 2018 hasta el presente provienen de la página Especial: Estadísticas, tal como los guardó Internet Archive en esa fecha . No existe registro del número de palabras desde enero de 2010 a diciembre de 2017; Wikistats-1 ya no incluye la cantidad de palabras después de enero de 2010, y la página Especial: Estadísticas solo comenzó a mostrar la cantidad de palabras en todas las páginas de contenido en diciembre de 2017. En algún momento dentro de ese lapso de casi ocho años, la cantidad promedio de palabras abandonó. Tenga en cuenta que Internet Archive no siempre tiene una versión archivada de la página Especial: Estadísticas el primer día de cada año.

Estadísticas anuales

A Incremento promedio por año de 2010 a 2018; aumento total de 1.279.581.000 palabras durante el mismo período de tiempo
B Aumento porcentual promedio por año de 2010 a 2018; aumento general del 71% durante el mismo período de tiempo
C Incremento promedio por día de 2010 a 2018
D En lo que va del año

Estadísticas mensuales desde enero de 2019

La siguiente tabla incluye la cantidad total de palabras en todos los artículos y la cantidad de palabras agregadas al comienzo o cerca del comienzo de cada mes desde enero de 2019.

Número de páginas

Al 16 de marzo de 2024, hay 60.226.640 páginas en la Wikipedia en inglés , de las cuales 6.797.683 (11,29%) son artículos, que se encuentran en el espacio de nombres principal , o simplemente espacio principal . El resto de las páginas pertenecen a uno de los otros 11 espacios de nombres , enumerados aquí en orden alfabético: Categoría, Borrador, Archivo, Ayuda, MediaWiki, Módulo, Portal, Plantilla, TimedText, Usuario y Wikipedia. Cada página de Wikipedia también puede tener una página de discusión correspondiente. Los datos de esta tabla provienen de la página Especial: Estadísticas , tal como los guardó Internet Archive en esa fecha . Tenga en cuenta que Internet Archive no siempre tiene una versión archivada de la página Especial: Estadísticas el primer día de cada año. Con el tiempo, el porcentaje de todas las páginas de Wikipedia que consisten en artículos disminuye a medida que se crean más páginas que no son artículos.

Tamaño de la base de datos de Wikipedia en inglés

Texto total del artículo en Wikipedia en inglés, medido en gigabytes (comprimido). [7]

Hay varios elementos de la base de datos de Wikipedia a considerar al describir su tamaño. Los más obvios incluyen el texto marcado de los artículos, plantillas, descripciones de medios/archivos y metapáginas principales que serían necesarias para representar el texto de la última versión de la enciclopedia actual. Las páginas de discusión asociadas y los demás espacios de nombres (Usuario, Wikipedia, Ayuda, etc.) suelen considerarse por separado. Cada uno de ellos tiene un historial de edición asociado, etc. Además, están las imágenes y otros elementos multimedia (almacenados en común en todas las Wikipedias). Es importante tener en cuenta si los datos están comprimidos y, en caso afirmativo, qué esquema de compresión se utiliza. Además de la Wikipedia en inglés, también hay cientos de Wikipedias en otros idiomas a considerar.

En abril de 2010, el tamaño del historial de edición completo de Wikipedia en inglés era de 5,6 TB sin comprimir. [8]

En junio de 2015, el volcado de todas las páginas con el historial de edición completo en formato XML en el progreso del volcado de enwiki en 20150602 es de aproximadamente 100 GB comprimidos con 7-Zip y 10 TB sin comprimir.

En mayo de 2015, la versión actual del artículo/plantilla/texto de redireccionamiento de Wikipedia en inglés tenía aproximadamente 51 GB sin comprimir en formato XML.

El tamaño del texto del artículo en la Wikipedia en inglés, medido en gigabytes (comprimidos), creció constantemente de 1 GB en 2006 a 9 GB en 2013 y 11,5 GB en 2015, como se muestra en el gráfico. Sin embargo, debido a un error al compilar el volcado de datos de abril de 2016, el tamaño del texto del artículo se redujo aproximadamente un 9 por ciento a 10,8 GB comprimidos (aunque el tamaño real del texto del artículo aumentó en realidad, lo que se puede ver al compararlo con los volcados de datos de marzo de 2016 y mayo de 2016). [9] Asimismo, también hay un error similar al compilar los datos del 20 de abril de 2018, que muestran 12,85 GB (nuevamente, el tamaño real del texto del artículo creció en realidad, como se puede ver al comparar los meses anteriores y siguientes). [10]

En febrero de 2013, el archivo XML que contiene únicamente las páginas actuales, sin páginas de usuario ni de discusión, tenía 42.987.293.445 bytes sin comprimir (43 GB). El archivo XML con las páginas actuales, incluidas las páginas de usuario y de discusión, tenía 93.754.003.797 bytes sin comprimir (94 GB). Los volcados del historial completo, los 174 archivos, ocuparon 10.005.676.791.734 bytes (10 TB). [11]

En agosto de 2023, Wikimedia Commons, que incluye las imágenes, vídeos y otros medios utilizados en todas las Wikipedias de idiomas específicos, contenía 96.519.778 archivos, con un total de 470.991.810.222.099 bytes (428,36 TB). [12]

Otras fuentes de estimaciones de tamaño recientes son:

Comparaciones con otras Wikipedias

Distribución de los 62.656.150 artículos en ediciones en diferentes idiomas (a 16 de marzo de 2024) [13]

  Inglés (10,8%)
  Cebuano (9,8%)
  Alemán (4,6%)
  Francés (4,1%)
  sueco (4,1%)
  Holandés (3,4%)
  Ruso (3,1%)
  Español (3,1%)
  italiano (3%)
  Árabe egipcio (2,6%)
  Otros (51,4%)

Códigos: en - Inglés • es - Español • de - Alemán • ja - Japonés • ru - Ruso • fr - Francés • it - Italiano • pl - Polaco • pt - Portugués • zh - Chino

Este gráfico se basa en datos de https://stats.wikimedia.org/EN/TablesArticlesTotal.htm al 14 de junio de 2015, con valores recientes para la Wikipedia en inglés tomados de los datos a continuación. La suma incluye los más de 270 idiomas de Wikipedia. Consulte la página principal en https://www.wikipedia.org para ver un recuento reciente de artículos de las diez Wikipedias más importantes.

La edición en inglés sigue siendo la Wikipedia más grande, un poco más grande que la segunda edición más grande, la Wikipedia en cebuano . Muchas otras ediciones compartieron el crecimiento casi exponencial de la edición en inglés, aunque con un retraso de uno a tres años. A medida que estas otras Wikipedias han ido creciendo, el porcentaje general de artículos en inglés ha ido disminuyendo constantemente, y cayó por debajo del 25 por ciento en marzo de 2007. El porcentaje de artículos en las diez Wikipedias más importantes también ha ido disminuyendo, aunque estos diez primeros todavía representan alrededor del 67 por ciento de todos los artículos de Wikipedia en junio de 2007. Tenga en cuenta que Lsjbot , un robot dirigido por Sverker Johansson , es responsable de gran parte del crecimiento de la segunda y quinta Wikipedia más grande, la Wikipedia en cebuano y la sueca , respectivamente, como así como el rápido crecimiento de la Wikipedia de Waray . Los gráficos no muestran las Wikipedias en cebuano, sueco o waray. El crecimiento del recuento de artículos de esas tres Wikipedias consiste principalmente en fragmentos pertenecientes a organismos vivos y entidades geográficas (como islas, ríos, represas y montañas).

Actualmente, la Wikipedia en inglés representa el 10,85 por ciento de todos los volúmenes de todas las ediciones de Wikipedia.

El tamaño de la base de datos de la Wikipedia en inglés es poco más de 10 veces mayor que el de la siguiente Wikipedia en tamaño por número de artículos, la Wikipedia en cebuano. (A octubre de 2023)

Cronología de versiones de software.

Este conjunto de datos señala el hecho de que estas cifras se extraen de múltiples fuentes de datos y diferentes estimaciones (consulte la clave a continuación para obtener más detalles) y las presenta como una tabla lista para usar en una hoja de cálculo para representar gráficamente. Los conjuntos de datos originales están archivados: consulte los enlaces a continuación. Tenga en cuenta también que las cifras se muestran en momentos aleatorios del día.

Tamaño de copia impresa

A principios de 2015, Michael Mandiberg publicó la Wikipedia en inglés en 7473 volúmenes de 700 páginas cada uno a través de Lulu , una plataforma, distribuidora y minorista de autoedición impresa y de libros electrónicos en línea. [14]

El siguiente gráfico ilustra el tamaño que podría tener la Wikipedia en inglés si los artículos (sin imágenes ni otro contenido multimedia) se imprimieran y encuadernaran en forma de libro con un formato similar al de la Encyclopædia Britannica . Se supone que cada volumen mide 25 cm (9,8 pulgadas) de alto, 5 cm (2,0 pulgadas) de grosor y contiene 1.600.000 palabras u 8.000.000 de caracteres. El tamaño de esta ilustración se basa en el recuento de artículos activos ajustado manualmente por el recuento promedio de palabras de forma irregular.

el conjunto de datos

Clave de los datos siguientes:

Ahora ampliado y anotado con información fuente (algo gnómica ). Tenga en cuenta que los tiempos de muestreo solo se registran hasta el día indicado por el usuario que registra la entrada y que no hay información clara de zona horaria para ese día. Sin embargo, la mayoría de los recuentos más recientes (hasta 2022) se realizaron al comienzo del día según UTC extraído de la tabla Lista de Wikipedias en Meta Wiki. Desde 2023, los recuentos se realizan aproximadamente al mismo tiempo, aunque de la nueva tabla Lista de Wikipedias en Wikimedia Commons, ya que deja un registro de revisión en su página de historial, aunque no necesariamente a la medianoche UTC.

Nota: El recuento actual de artículos mpac3.2 para la Wikipedia en inglés es de 6.797.683 artículos.