El Proyecto Genoma de la BBC es una base de datos de búsqueda en línea de listados de programas basados inicialmente en el contenido del Radio Times desde su primera edición en 1923 hasta 2009. [1] Se puede acceder a los listados de programas de televisión posteriores a 2009 a través del sitio de Programas de la BBC. [2]
BBC Genome no es la primera base de datos de la BBC que se puede buscar en línea. En abril de 2006, la BBC dio acceso público a Infax, su única base de datos electrónica de programas en ese momento. Contenía alrededor de 900.000 entradas, pero no todos los programas que se emitieron, y dejó de funcionar en diciembre de 2007. [3] La página principal del sitio web todavía está disponible a través de Internet Archive . [4] Después de que Infax dejara de funcionar, un mensaje en el sitio web decía que incorporaría la información en páginas de programas individuales. [5] En 2012, Infax fue reemplazada por la base de datos Fabric, pero esta es solo para uso interno dentro de la BBC.
En diciembre de 2012, la BBC completó un ejercicio de digitalización, escaneando los listados de Radio Times de todos los programas de la BBC desde 1923 hasta 2009 de una tirada completa de aproximadamente 4.500 copias de la revista. [6] Identificaron alrededor de cinco millones de programas que involucraban a 8,5 millones de actores, presentadores, escritores y personal técnico. [6] BBC Genome se lanzó para uso público el 15 de octubre de 2014. [7] [8]
Los listados se publican con antelación, por lo que no incluyen cambios ni cancelaciones posteriores que se reflejaron en Infax. Sin embargo, sí incluyen una gran cantidad de emisiones de radio y televisión tempranas y "programas de DJ" de BBC Radio 1 y BBC Radio 2 que rara vez se conservaban oficialmente y que no se incluyeron en Infax (que tampoco incluía repeticiones de programas archivados antes de 1976) porque no estaban en los archivos de la BBC. Los números se escanearon a alta resolución , lo que produjo imágenes TIFF y luego se utilizó el reconocimiento óptico de caracteres para convertir el texto de la página en texto que se puede buscar en la base de datos Genome. [1]
El objetivo de este proyecto es permitir que los investigadores puedan encontrar información más fácilmente y ayudar a BBC Archives a construir una imagen de lo que existe y lo que falta actualmente en el archivo. [9] [10] Las correcciones a los errores de OCR y los cambios a los horarios anunciados se están realizando mediante crowdsourcing , [7] con más de 440,910 ediciones generadas por los usuarios aceptadas después de la revisión editorial a mediados de diciembre de 2018. [11] [12] Cada entrada de listado tiene un identificador único que puede expresarse como una URL. Por ejemplo, la primera proyección de Doctor Who es http://genome.ch.bbc.co.uk/8f81c193ba224e84981f353cae480d49. Un programa transmitido puede tener más de un identificador de este tipo, si se transmitió (y, por lo tanto, se incluyó en la lista) en ocasiones repetidas o en diferentes regiones.
Se agregaron ediciones digitalizadas de revistas completas (incluidas portadas, artículos en prosa, anuncios y otro contenido que no figura en los listados) de la década de 1920 en marzo de 2017; [13] para la década de 1930 en diciembre de 2017; [14] para la década de 1940 en diciembre de 2018; [15] y para la década de 1950 en diciembre de 2019. [16]
Una vez que edite una entrada, su sugerencia será validada y, si se acepta, se cambiará Genome. Si su sugerencia no coincide con la revista, incluiremos su edición en los datos adicionales que estamos recopilando para su uso en una fecha posterior.