La computación centrada en los datos es un concepto emergente que tiene relevancia en la arquitectura de la información y el diseño de centros de datos . Describe un sistema de información en el que los datos se almacenan independientemente de las aplicaciones, que pueden actualizarse sin una migración de datos costosa y complicada. Este es un cambio radical en los sistemas de información que será necesario para abordar las necesidades organizacionales de almacenamiento, recuperación, traslado y procesamiento de conjuntos de datos en crecimiento exponencial. [1]
Las arquitecturas tradicionales de los sistemas de información se basan en una mentalidad centrada en las aplicaciones. Tradicionalmente, las aplicaciones se instalaban, se mantenían relativamente estáticas, se actualizaban con poca frecuencia y utilizaban un conjunto fijo de elementos de computación, almacenamiento y redes para manejar un conjunto relativamente pequeño de datos estructurados. [2]
Este enfoque funcionó bien durante décadas, pero en la última década, el crecimiento de los datos, en particular el crecimiento de los datos no estructurados, generó nuevas presiones sobre las organizaciones, las arquitecturas de información y la infraestructura de los centros de datos. El 90 % de los datos nuevos no están estructurados y, según un informe de 2018, el 59 % de las organizaciones administran más de 10 mil millones de archivos y objetos [3] distribuidos en una gran cantidad de servidores y nodos de almacenamiento. Las organizaciones están luchando por hacer frente al crecimiento exponencial de los datos mientras buscan mejores enfoques para extraer información de esos datos utilizando servicios que incluyen análisis de Big Data y aprendizaje automático . Sin embargo, las arquitecturas existentes no están diseñadas para abordar los requisitos de servicio a escala de petabytes y más allá sin límites de rendimiento significativos. [4]
Las arquitecturas tradicionales no logran almacenar, recuperar, mover y utilizar completamente esos datos debido a limitaciones de la infraestructura de hardware, así como del diseño, desarrollo y gestión de sistemas centrados en aplicaciones. [5]
Cargas de trabajo centradas en datos
Hay dos problemas que la informática centrada en datos pretende abordar.
Computación centrada en datos
La computación centrada en los datos es un enfoque que fusiona hardware y software innovadores para tratar los datos, no las aplicaciones, como la fuente permanente de valor. [8] La computación centrada en los datos apunta a repensar tanto el hardware como el software para extraer el máximo valor posible de las fuentes de datos existentes y nuevas. Aumenta la agilidad al priorizar la transferencia y el cálculo de datos sobre el rendimiento y la resiliencia de las aplicaciones estáticas.
Hardware y software centrados en datos
Para cumplir con los objetivos de la computación centrada en datos, la infraestructura de hardware del centro de datos evolucionará para abordar la escala masiva, el crecimiento rápido, la necesidad de movimiento de datos de muy alto rendimiento y amplios requisitos de cálculo.
En lo que respecta al software, la computación centrada en los datos acelera la desaparición de las aplicaciones estáticas tradicionales. [12] Las aplicaciones se vuelven efímeras, se agregan, actualizan o eliminan constantemente a medida que los algoritmos aparecen y desaparecen. El software se rediseña para realizar análisis sobre todos los datos disponibles en lugar de subconjuntos. Los microservicios visitan los datos, realizan cálculos y expresan los resultados de sus procesos a velocidades que superan los enfoques convencionales.
{{cite web}}
: CS1 maint: varios nombres: lista de autores ( enlace )