stringtranslate.com

Datos

Estos son algunos de los diferentes tipos de datos.

En el uso común, los datos ( EE. UU .: / ˈ d æ t ə / ; Reino Unido : / ˈ d t ə / ) son una colección de valores discretos o continuos que transmiten información y describen la cantidad , la calidad , los hechos , las estadísticas y otras unidades básicas. de significado, o simplemente secuencias de símbolos que pueden interpretarse formalmente . Un dato es un valor individual en una colección de datos. Los datos generalmente se organizan en estructuras como tablas que proporcionan contexto y significado adicionales, y que a su vez pueden usarse como datos en estructuras más grandes. Los datos pueden usarse como variables en un proceso computacional . [1] [2] Los datos pueden representar ideas abstractas o medidas concretas. [3] Los datos se utilizan comúnmente en la investigación científica , la economía y prácticamente en cualquier otra forma de actividad organizacional humana. Ejemplos de conjuntos de datos incluyen índices de precios (como el índice de precios al consumidor ), tasas de desempleo , tasas de alfabetización y datos del censo . En este contexto, los datos representan hechos y cifras en bruto de los que se puede extraer información útil.

Los datos se recopilan mediante técnicas como la medición , la observación , la consulta o el análisis , y normalmente se representan como números o caracteres que pueden procesarse posteriormente . Los datos de campo son datos que se recopilan en un entorno in situ no controlado . Los datos experimentales son datos que se generan en el curso de un experimento científico controlado . Los datos se analizan mediante técnicas como cálculo , razonamiento , discusión, presentación , visualización u otras formas de posanálisis. Antes del análisis, los datos sin procesar (o datos no procesados) generalmente se limpian : se eliminan los valores atípicos y se corrigen los errores obvios de ingreso de datos o instrumentos.

Los datos pueden verse como las unidades más pequeñas de información fáctica que pueden usarse como base para cálculos, razonamientos o discusiones. Los datos pueden variar desde ideas abstractas hasta mediciones concretas, incluidas, entre otras, estadísticas . Los datos conectados temáticamente y presentados en algún contexto relevante pueden considerarse información . Las piezas de información conectadas contextualmente pueden describirse como conocimientos de datos o inteligencia . El acervo de conocimientos e inteligencia que se acumula con el tiempo como resultado de la síntesis de datos en información puede describirse como conocimiento . Los datos han sido descritos como "el nuevo petróleo de la economía digital ". [4] [5] Datos, como concepto general , se refiere al hecho de que alguna información o conocimiento existente se representa o codifica de alguna forma adecuada para un mejor uso o procesamiento .

Los avances en las tecnologías informáticas han propiciado la llegada del big data , que suele referirse a cantidades muy grandes de datos, normalmente a escala de petabytes. Utilizando métodos tradicionales de análisis de datos y computación, trabajar con conjuntos de datos tan grandes (y en crecimiento) es difícil, incluso imposible. (En teoría, datos infinitos producirían información infinita, lo que haría imposible extraer conocimientos o inteligencia). En respuesta, el campo relativamente nuevo de la ciencia de datos utiliza métodos de aprendizaje automático (y otros métodos de inteligencia artificial (IA)) que permiten aplicaciones eficientes de métodos analíticos para big data.

Etimología y terminología

La palabra latina data es el plural de datum , "(cosa) dada", participio pasado neutro de dare , "dar". [6] El primer uso en inglés de la palabra "datos" data de la década de 1640. La palabra "datos" se utilizó por primera vez para significar "información informática transmisible y almacenable" en 1946. La expresión "procesamiento de datos" se utilizó por primera vez en 1954. [6]

Cuando "datos" se utiliza de manera más general como sinónimo de "información", se trata como un sustantivo masivo en forma singular. Este uso es común en el lenguaje cotidiano y en campos técnicos y científicos como el desarrollo de software y la informática . Un ejemplo de este uso es el término " big data ". Cuando se utiliza más específicamente para referirse al procesamiento y análisis de conjuntos de datos, el término conserva su forma plural. Este uso es común en las ciencias naturales, las ciencias biológicas, las ciencias sociales, el desarrollo de software y la informática, y ganó popularidad en los siglos XX y XXI. Algunas guías de estilo no reconocen los diferentes significados del término y simplemente recomiendan la forma que mejor se adapta al público objetivo de la guía. Por ejemplo, el estilo APA a partir de la séptima edición requiere que "datos" se traten en plural. [7]

Significado

"Una TABLA de las aperturas de los objetos-gafas" de Adrien Auzout de un artículo de 1665 en Philosophical Transactions

Datos, información , conocimiento y sabiduría son conceptos estrechamente relacionados, pero cada uno tiene su papel respecto del otro, y cada término tiene su significado. Según una visión común, los datos se recopilan y analizan; Los datos sólo se convierten en información adecuada para tomar decisiones una vez que han sido analizados de alguna manera. [8] Se puede decir que el grado en que un conjunto de datos es informativo para alguien depende del grado en que es inesperado para esa persona. La cantidad de información contenida en un flujo de datos puede caracterizarse por su entropía de Shannon .

El conocimiento es la conciencia de su entorno que posee alguna entidad, mientras que los datos simplemente comunican ese conocimiento. Por ejemplo, la entrada en una base de datos que especifica la altura del Monte Everest es un dato que comunica un valor medido con precisión. Esta medida puede incluirse en un libro junto con otros datos sobre el Monte Everest para describir la montaña de una manera útil para quienes deseen decidir cuál es el mejor método para escalarla. La conciencia de las características representadas por estos datos es conocimiento.

A menudo se supone que los datos son el concepto menos abstracto, la información el siguiente menos abstracto y el conocimiento el más abstracto. [9] Desde este punto de vista, los datos se convierten en información mediante interpretación; por ejemplo, la altura del Monte Everest generalmente se considera "datos", un libro sobre las características geológicas del Monte Everest puede considerarse "información" y una guía para escaladores que contiene información práctica sobre la mejor manera de alcanzar la cima del Monte Everest puede considerarse "conocimiento". . "Información" tiene una diversidad de significados que van desde el uso cotidiano hasta el uso técnico. Sin embargo, también se ha argumentado que esta visión invierte la forma en que los datos surgen de la información y la información del conocimiento. [10] En términos generales, el concepto de información está estrechamente relacionado con las nociones de restricción, comunicación, control, datos, forma, instrucción, conocimiento, significado, estímulo mental, patrón , percepción y representación. Beynon-Davies utiliza el concepto de signo para diferenciar entre datos e información; Los datos son una serie de símbolos, mientras que la información se produce cuando los símbolos se utilizan para referirse a algo. [11] [12]

Antes del desarrollo de las máquinas y dispositivos informáticos, la gente tenía que recopilar datos manualmente e imponerles patrones. Desde el desarrollo de máquinas y dispositivos informáticos, estos dispositivos también pueden recopilar datos. En la década de 2010, las computadoras se utilizan ampliamente en muchos campos para recopilar datos y clasificarlos o procesarlos, en disciplinas que van desde el marketing , el análisis del uso de los servicios sociales por parte de los ciudadanos hasta la investigación científica. Estos patrones en los datos se consideran información que puede utilizarse para mejorar el conocimiento. Estos patrones pueden interpretarse como " verdad " (aunque "verdad" puede ser un concepto subjetivo) y pueden autorizarse como criterios estéticos y éticos en algunas disciplinas o culturas. Los acontecimientos que dejan restos físicos o virtuales perceptibles se pueden rastrear a través de los datos. Las notas ya no se consideran datos una vez que se rompe el vínculo entre la nota y la observación. [13]

Los dispositivos informáticos mecánicos se clasifican según cómo representan los datos. Una computadora analógica representa un dato como voltaje, distancia, posición u otra cantidad física. Una computadora digital representa un dato como una secuencia de símbolos extraídos de un alfabeto fijo . Las computadoras digitales más comunes utilizan un alfabeto binario, es decir, un alfabeto de dos caracteres normalmente denominados "0" y "1". Luego se construyen representaciones más familiares, como números o letras, a partir del alfabeto binario. Se distinguen algunas formas especiales de datos. Un programa de computadora es una colección de datos que pueden interpretarse como instrucciones. La mayoría de los lenguajes informáticos hacen una distinción entre programas y otros datos sobre los cuales operan los programas, pero en algunos lenguajes, en particular Lisp y lenguajes similares, los programas son esencialmente indistinguibles de otros datos. También es útil distinguir metadatos , es decir, una descripción de otros datos. Un término similar, aunque anterior, para los metadatos es "datos auxiliares". El ejemplo prototípico de metadatos es el catálogo de biblioteca, que es una descripción del contenido de los libros.

Documentos de datos

Siempre que es necesario registrar datos, estos existen en forma de documento de datos . Los tipos de documentos de datos incluyen:

Algunos de estos documentos de datos (repositorios de datos, estudios de datos, conjuntos de datos y software) están indexados en Data Citation Indexes, mientras que los artículos de datos están indexados en bases de datos bibliográficas tradicionales, por ejemplo, Science Citation Index .

Recopilación de datos

La recopilación de datos se puede lograr a través de una fuente primaria (el investigador es la primera persona en obtener los datos) o una fuente secundaria (el investigador obtiene los datos que ya han sido recopilados por otras fuentes, como los datos difundidos en una revista científica). Las metodologías de análisis de datos varían e incluyen triangulación y filtración de datos. [14] Este último ofrece un método articulado de recopilación, clasificación y análisis de datos utilizando cinco posibles ángulos de análisis (al menos tres) para maximizar la objetividad de la investigación y permitir una comprensión de los fenómenos investigados lo más completa posible: cualitativa y cuantitativa. métodos, revisiones de literatura (incluidos artículos académicos), entrevistas con expertos y simulación por computadora. A continuación, los datos se "filtran" mediante una serie de pasos predeterminados para extraer la información más relevante.

Longevidad y accesibilidad de los datos

Un campo importante en informática , tecnología y bibliotecología es la longevidad de los datos. La investigación científica genera enormes cantidades de datos, especialmente en genómica y astronomía , pero también en las ciencias médicas , por ejemplo en imágenes médicas . En el pasado, los datos científicos se publicaban en artículos y libros y se almacenaban en bibliotecas, pero más recientemente prácticamente todos los datos se almacenan en discos duros o discos ópticos . Sin embargo, a diferencia del papel, estos dispositivos de almacenamiento pueden volverse ilegibles después de algunas décadas. Las editoriales científicas y las bibliotecas luchan contra este problema desde hace algunas décadas y todavía no existe una solución satisfactoria para el almacenamiento a largo plazo de datos durante siglos o incluso para la eternidad.

Accesibilidad de datos . Otro problema es que muchos datos científicos nunca se publican ni se depositan en depósitos de datos como, por ejemplo, bases de datos . En una encuesta reciente, se solicitaron datos de 516 estudios que se publicaron entre 2 y 22 años antes, pero menos de uno de cada cinco de estos estudios pudo o quiso proporcionar los datos solicitados. En general, la probabilidad de recuperar datos disminuyó un 17% cada año después de su publicación. [15] De manera similar, una encuesta de 100 conjuntos de datos en Dryad encontró que más de la mitad carecían de los detalles para reproducir los resultados de la investigación de estos estudios. [16] Esto muestra la terrible situación del acceso a datos científicos que no están publicados o no tienen suficientes detalles para ser reproducidos.

Una solución al problema de la reproducibilidad es el intento de exigir datos FAIR , es decir, datos que sean Encontrables, Accesibles, Interoperables y Reutilizables. Los datos que cumplan estos requisitos se pueden utilizar en investigaciones posteriores y, por lo tanto, hacen avanzar la ciencia y la tecnología. [17]

En otros campos

Aunque los datos también se utilizan cada vez más en otros campos, se ha sugerido que su naturaleza altamente interpretativa podría estar en desacuerdo con el espíritu de los datos como "dados". Peter Checkland introdujo el término capta (del latín capere , "tomar") para distinguir entre un inmenso número de datos posibles y un subconjunto de ellos, al que se orienta la atención. [18] Johanna Drucker ha argumentado que dado que las humanidades afirman que la producción de conocimiento es "situada, parcial y constitutiva", el uso de datos puede introducir suposiciones que son contraproducentes, por ejemplo, que los fenómenos son discretos o independientes del observador. [19] El término capta , que enfatiza el acto de observación como constitutivo, se ofrece como una alternativa a los datos para las representaciones visuales en las humanidades.

El término basado en datos es un neologismo aplicado a una actividad que se basa principalmente en datos sobre todos los demás factores. [ cita necesaria ] Las aplicaciones basadas en datos incluyen programación basada en datos y periodismo basado en datos .

Ver también

Referencias

  1. ^ Glosario de términos estadísticos de la OCDE . OCDE. 2008. pág. 119.ISBN _ 978-92-64-025561.
  2. ^ "Lenguaje estadístico: ¿Qué son los datos?". Oficina de Estadísticas de Australia . 2013-07-13. Archivado desde el original el 19 de abril de 2019 . Consultado el 9 de marzo de 2020 .
  3. ^ "Datos versus información: diferencia y comparación | Diffen". www.diffen.com . Consultado el 11 de diciembre de 2018 .
  4. ^ Yonego, Joris Toonders (23 de julio de 2014). "Los datos son el nuevo petróleo de la economía digital". Cableado : a través de www.wired.com.
  5. ^ "Los datos son el nuevo petróleo". 16 de julio de 2018. Archivado desde el original el 16 de julio de 2018.
  6. ^ ab "datos | Origen y significado de los datos según el Diccionario de Etimología en línea". www.etymonline.com .
  7. ^ Asociación Estadounidense de Psicología (2020). "6.11". Manual de publicaciones de la Asociación Estadounidense de Psicología: la guía oficial del estilo APA . Asociacion Americana de Psicologia. ISBN 9781433832161.
  8. ^ "Publicación conjunta 2-0, Inteligencia Conjunta" (PDF) . Estado Mayor Conjunto, Publicaciones de Doctrina Conjunta . Departamento de Defensa. 23 de octubre de 2013. págs. I-1. Archivado desde el original (PDF) el 18 de julio de 2018 . Consultado el 17 de julio de 2018 .
  9. ^ Akash Mitra (2011). "Clasificación de datos para un modelado exitoso". Archivado desde el original el 7 de noviembre de 2017 . Consultado el 5 de noviembre de 2017 .
  10. ^ Tuomi, Ilkka (2000). "Los datos son más que conocimiento". Revista de sistemas de información de gestión . 6 (3): 103–117. doi :10.1080/07421222.1999.11518258.
  11. ^ P. Beynon-Davies (2002). Sistemas de información: una introducción a la informática en las organizaciones . Basingstoke, Reino Unido: Palgrave Macmillan . ISBN 0-333-96390-3.
  12. ^ P. Beynon-Davies (2009). Sistemas de Información Empresarial . Basingstoke, Reino Unido: Palgrave. ISBN 978-0-230-20368-6.
  13. ^ Sharon Daniel. La base de datos: una estética de la dignidad .
  14. ^ Mesly, Olivier (2015). Creación de modelos en investigación psicológica. États-Unis: Springer Psicología: 126 páginas. ISBN 978-3-319-15752-8 
  15. ^ Vides, Timothy H.; Albert, Arianne YK; Andrés, Rosa L.; Débarre, Florencia; Bock, Dan G.; Franklin, Michelle T.; Gilbert, Kimberly J.; Moore, Jean-Sébastien; Renaut, Sébastien; Rennison, Diana J. (6 de enero de 2014). "La disponibilidad de datos de investigación disminuye rápidamente con la antigüedad del artículo". Biología actual . 24 (1): 94–97. arXiv : 1312.5670 . doi : 10.1016/j.cub.2013.11.014 . ISSN  1879-0445. PMID  24361065. S2CID  7799662.
  16. ^ Roche, Dominique G.; Kruuk, Loeske EB; Lanfear, Robert; Binning, Sandra A. (2015). "Archivo de datos públicos en ecología y evolución: ¿qué tan bien lo estamos haciendo?". Más biología . 13 (11): e1002295. doi : 10.1371/journal.pbio.1002295 . ISSN  1545-7885. PMC 4640582 . PMID  26556502. 
  17. ^ Eisenstein, Michael (abril de 2022). "En busca de la inmortalidad de los datos". Naturaleza . 604 (7904): 207–208. Código Bib :2022Natur.604..207E. doi : 10.1038/d41586-022-00929-3 . ISSN  1476-4687. PMID  35379989. S2CID  247954952.
  18. ^ P. Checkland y S. Holwell (1998). Información, sistemas y sistemas de información: dar sentido al campo . Chichester, West Sussex: John Wiley & Sons. págs. 86–89. ISBN 0-471-95820-4.
  19. ^ Johanna Drucker (2011). "Enfoques de las humanidades para la visualización gráfica". Humanidades Digitales Trimestrales . 005 (1).

enlaces externos