El Proyecto GDELT , o Base de Datos Global de Eventos, Lenguaje y Tono , creado por Kalev Leetaru de Yahoo! y la Universidad de Georgetown , junto con Philip Schrodt y otros, se describe a sí mismo como "una iniciativa para construir un catálogo de comportamientos y creencias a escala social humana en todos los países del mundo, conectando a cada persona, organización, ubicación, recuento, tema, fuente de noticias y evento en todo el planeta en una única red masiva que captura lo que está sucediendo en todo el mundo, cuál es su contexto y quién está involucrado, y cómo se siente el mundo al respecto, todos los días". [1] [2] [3] Las primeras exploraciones que condujeron a la creación de GDELT fueron descritas por el cocreador Philip Schrodt en un artículo de conferencia en enero de 2011. [4] El conjunto de datos está disponible en Google Cloud Platform . [5]
Datos
GDELT incluye datos desde 1979 hasta el presente. Los datos están disponibles como archivos zip en formato de valores separados por tabulaciones utilizando una extensión CSV para una fácil importación a Microsoft Excel o un software de hoja de cálculo similar. [6] Los datos desde 1979 hasta 2005 están disponibles en forma de un archivo zip por año, con un tamaño de archivo que aumenta gradualmente de 14,3 MB en 1979 a 125,9 MB en 2005, lo que refleja el aumento en la cantidad de medios de comunicación y la frecuencia y exhaustividad del registro de eventos. [7] Los archivos de datos desde enero de 2006 hasta marzo de 2013 están disponibles con una granularidad mensual, y el tamaño del archivo comprimido aumenta de 11 MB en enero de 2006 a 103,2 MB en marzo de 2013. Los archivos de datos desde el 1 de abril de 2013 en adelante están disponibles con una granularidad diaria. El archivo de datos para cada fecha está disponible a las 6 a. m., hora estándar del este, del día siguiente. A partir de junio de 2014, el tamaño del archivo comprimido diario es de aproximadamente 5 a 12 MB. [6] [7] Los archivos de datos utilizan la codificación CAMEO ( Observaciones de eventos de conflicto y mediación ) para registrar eventos. [8]
En una publicación de blog para Foreign Policy , el cocreador Kalev Leetaru intentó usar datos de GDELT para responder a la pregunta de si la Primavera Árabe desencadenó protestas en todo el mundo, utilizando el cociente del número de eventos relacionados con las protestas con el número total de eventos registrados como una medida de la intensidad de la protesta para la cual luego se estudió la tendencia temporal. [9] El politólogo y experto en ciencia de datos y pronósticos Jay Ulfelder criticó la publicación en su blog personal, diciendo que el método de normalización de Leetaru puede no haber explicado adecuadamente el cambio en la naturaleza y composición de la cobertura de los medios. [10]
El conjunto de datos también está disponible en Google Cloud Platform y se puede acceder a él mediante Google BigQuery . [5]
Recepción
Recepción académica
GDELT ha sido citado y utilizado en varios estudios académicos, como un estudio de análisis visual y predictivo de noticias de Singapur (junto con Wikipedia y el Straits Times Index ) [11] y un estudio de conflicto político. [12]
El problema del desafío en la Conferencia Internacional de Computación Social, Modelado del Comportamiento y Predicción (SBP) de 2014 pidió a los participantes explorar GDELT y aplicarlo al análisis de redes sociales , comportamiento y predicción. [13]
Recepción en blogs y medios
GDELT ha sido cubierto en el sitio web del Centro para la Innovación de Datos [14] así como en el GIS Lounge. [15] También ha sido discutido y criticado en blogs sobre violencia política y predicción de crisis. [10] [16] [17] El conjunto de datos ha sido citado y criticado repetidamente en Foreign Policy , [2] [18] incluso en discusiones sobre eventos políticos en Siria , [19] la Primavera Árabe , [9] [20] y Nigeria . [21] También ha sido citado en New Scientist , [22] en el sitio web FiveThirtyEight [23] y en el blog de Andrew Sullivan . [24]
El blog Predictive Heuristics y otros blogs han comparado el GDELT con el Sistema Integrado de Alerta Temprana de Conflictos (ICEWS). [25] [26] Alex Hanna escribió un blog sobre su experimento de evaluación del GDELT con datos codificados manualmente comparándolo con el conjunto de datos de Dinámica de la Acción Colectiva. [27]
En mayo de 2014, el blog de Google Cloud Platform anunció que todo el conjunto de datos GDELT estaría disponible como un conjunto de datos público en Google BigQuery . [5]
Véase también
Referencias
- ^ "Acerca de GDELT: La base de datos global de eventos, lenguaje y tono" . Consultado el 2 de junio de 2014 .
- ^ ab "Mapped: Every Protest on the Planet Since 1979" (Mapeado: todas las protestas del planeta desde 1979). Foreign Policy . Consultado el 2 de junio de 2014 .
- ^ "Base de datos global de eventos, lenguaje y tono". datahub.io . Consultado el 2 de junio de 2014 .
- ^ Schrodt, Philip (20 de enero de 2011). "Producción automatizada de datos de eventos políticos en gran volumen y casi en tiempo real" (PDF) . Archivado desde el original (PDF) el 2 de julio de 2017. Consultado el 12 de junio de 2014 .
- ^ abc "El conjunto de datos de eventos más grande del mundo ahora está disponible públicamente en BigQuery". Google Cloud Platform . 29 de mayo de 2014 . Consultado el 2 de junio de 2014 .
- ^ ab "Archivos de datos sin procesar". Base de datos global de eventos, lenguaje y tono.
- ^ ab "Todos los archivos de eventos GDELT" . Consultado el 12 de junio de 2014 .
- ^ "Documentación". Base de datos global de eventos, lenguaje y tono.
- ^ ab Leetaru, Kalev (29 de mayo de 2014). "¿Realmente la Primavera Árabe desencadenó una ola de protestas globales? El mundo puede parecer agitado ahora, pero los años 1980 fueron mucho peores". Foreign Policy . Consultado el 2 de junio de 2014 .
- ^ ab Ulfelder, Jay (6 de junio de 2014). "Otra nota sobre las limitaciones de los datos de eventos" . Consultado el 12 de junio de 2014 .
- ^ Phua, Clifton; Feng, Yuzhang; Ji, Junyao; Soh, Timoteo (2014). "Análisis visual y predictivo en noticias de Singapur: experimentos con GDELT, Wikipedia y ^STI". arXiv : 1404,1996 [cs.OH].
- ^ Yonamine, James E. "Un estudio matizado del conflicto político utilizando el conjunto de datos Global Datasets of Events Location and Tone (GDELT)" (Conjuntos de datos globales de ubicación y tono de eventos [Global Datasets of Events Location and Tone (GDELT)]) . Consultado el 2 de junio de 2014 .
- ^ "Gran desafío SBP 2014: explorar GDELT, base de datos global de eventos, lenguaje y tono" . Consultado el 2 de junio de 2014 .
- ^ "Creación de una base de datos global en tiempo real de eventos, personas y lugares en las noticias". Centro para la Innovación de Datos. 15 de diciembre de 2013. Consultado el 2 de junio de 2014 .
- ^ Caitlin Dempsey Morais (5 de septiembre de 2013). "Mapping Global Events Since 1979". GIS Lounge . Consultado el 2 de junio de 2014 .
- ^ "Llueve sobre la marcha: algunas precauciones con respecto a la base de datos global de eventos, lenguaje y tono". Violencia política de un vistazo. 20 de febrero de 2014. Consultado el 2 de junio de 2014 .
- ^ Jongman, Berto (5 de enero de 2014). "Base de datos global de eventos, lenguaje y tono (GDELT): ¿(antiguos) grandes datos para ver (nuevas) crisis?". Public Intelligence Blog . Consultado el 2 de junio de 2014 .
- ^ Keating, Joshua (10 de abril de 2013). «¿Qué podemos aprender de los últimos 200 millones de cosas que sucedieron en el mundo?». Foreign Policy . Archivado desde el original el 6 de junio de 2014. Consultado el 2 de junio de 2014 .
- ^ Keating, Joshua (9 de julio de 2013). "¿Qué tan bien sigue el GDELT los acontecimientos en Siria?". Foreign Policy . Archivado desde el original el 6 de junio de 2014. Consultado el 2 de junio de 2014 .
- ^ Steinert-Threlkeld, Zachary (27 de septiembre de 2013). «La Primavera Árabe y el GDELT» . Consultado el 18 de junio de 2014 .
- ^ Leetaru, Kalev (13 de marzo de 2014). "Mapeo de la violencia y las protestas en Nigeria: cómo los macrodatos pueden encontrar la gran historia". Foreign Policy . Consultado el 2 de junio de 2014 .
- ^ Heaven, Douglas (13 de mayo de 2013). «La base de datos de eventos más grande del mundo podría predecir conflictos». New Scientist . Consultado el 2 de junio de 2014 .
- ^ Chalabi, Mona (6 de mayo de 2014). "El secuestro de niñas en Nigeria es parte de un problema que empeora (actualizado)". FiveThirtyEight . Consultado el 2 de junio de 2014 .
- ^ Sullivan, Andrew (30 de mayo de 2014). "Not Your Father's Global Uprising" (No es el levantamiento global de tu padre) . Consultado el 2 de junio de 2014 .
- ^ mdwardlab (17 de octubre de 2013). «GDELT y ICEWS, una breve comparación». Heurística predictiva. Archivado desde el original el 17 de julio de 2014. Consultado el 18 de junio de 2014 .
- ^ Beieler, John (28 de octubre de 2013). «Noise in GDELT» (Ruido en GDELT) . Consultado el 21 de junio de 2014 .
- ^ Hanna, Alex (24 de febrero de 2014). "Evaluación de GDELT con datos de protestas codificados manualmente". Bad Hessian . Consultado el 21 de junio de 2014 .
Enlaces externos