stringtranslate.com

Computación centrada en datos

La computación centrada en los datos es un concepto emergente que tiene relevancia en la arquitectura de la información y el diseño de centros de datos . Describe un sistema de información en el que los datos se almacenan independientemente de las aplicaciones, que pueden actualizarse sin una migración de datos costosa y complicada. Este es un cambio radical en los sistemas de información que será necesario para abordar las necesidades organizacionales de almacenamiento, recuperación, traslado y procesamiento de conjuntos de datos en crecimiento exponencial. [1]

Fondo

Las arquitecturas tradicionales de los sistemas de información se basan en una mentalidad centrada en las aplicaciones. Tradicionalmente, las aplicaciones se instalaban, se mantenían relativamente estáticas, se actualizaban con poca frecuencia y utilizaban un conjunto fijo de elementos de computación, almacenamiento y redes para manejar un conjunto relativamente pequeño de datos estructurados. [2]

Este enfoque funcionó bien durante décadas, pero en la última década, el crecimiento de los datos, en particular el crecimiento de los datos no estructurados, generó nuevas presiones sobre las organizaciones, las arquitecturas de información y la infraestructura de los centros de datos. El 90 % de los datos nuevos no están estructurados y, según un informe de 2018, el 59 % de las organizaciones administran más de 10 mil millones de archivos y objetos [3] distribuidos en una gran cantidad de servidores y nodos de almacenamiento. Las organizaciones están luchando por hacer frente al crecimiento exponencial de los datos mientras buscan mejores enfoques para extraer información de esos datos utilizando servicios que incluyen análisis de Big Data y aprendizaje automático . Sin embargo, las arquitecturas existentes no están diseñadas para abordar los requisitos de servicio a escala de petabytes y más allá sin límites de rendimiento significativos. [4]

Las arquitecturas tradicionales no logran almacenar, recuperar, mover y utilizar completamente esos datos debido a limitaciones de la infraestructura de hardware, así como del diseño, desarrollo y gestión de sistemas centrados en aplicaciones. [5]

Cargas de trabajo centradas en datos

Hay dos problemas que la informática centrada en datos pretende abordar.

  1. Las organizaciones necesitan utilizar todos los datos disponibles, pero las aplicaciones tradicionales no son lo suficientemente ágiles ni flexibles. Los nuevos cambios hacia la innovación constante de los servicios, respaldados por nuevos enfoques de prestación de servicios (incluidos los microservicios y los contenedores), abren nuevas posibilidades que se alejan de las mentalidades tradicionales centradas en las aplicaciones.
  2. Las limitaciones actuales del hardware de los centros de datos también restringen el movimiento, la gestión y la utilización completos de conjuntos de datos no estructurados. Las CPU convencionales impiden el rendimiento porque no incluyen las capacidades especializadas necesarias para el almacenamiento, la conexión en red y el análisis. [6] El almacenamiento lento, incluidos los discos duros y las unidades de estado sólido SAS/SATA a través de la red, puede reducir el rendimiento y limitar la accesibilidad a los datos. [7] Se necesitan nuevas capacidades de hardware.

Computación centrada en datos

La computación centrada en los datos es un enfoque que fusiona hardware y software innovadores para tratar los datos, no las aplicaciones, como la fuente permanente de valor. [8] La computación centrada en los datos apunta a repensar tanto el hardware como el software para extraer el máximo valor posible de las fuentes de datos existentes y nuevas. Aumenta la agilidad al priorizar la transferencia y el cálculo de datos sobre el rendimiento y la resiliencia de las aplicaciones estáticas.

Hardware y software centrados en datos

Para cumplir con los objetivos de la computación centrada en datos, la infraestructura de hardware del centro de datos evolucionará para abordar la escala masiva, el crecimiento rápido, la necesidad de movimiento de datos de muy alto rendimiento y amplios requisitos de cálculo.

En lo que respecta al software, la computación centrada en los datos acelera la desaparición de las aplicaciones estáticas tradicionales. [12] Las aplicaciones se vuelven efímeras, se agregan, actualizan o eliminan constantemente a medida que los algoritmos aparecen y desaparecen. El software se rediseña para realizar análisis sobre todos los datos disponibles en lugar de subconjuntos. Los microservicios visitan los datos, realizan cálculos y expresan los resultados de sus procesos a velocidades que superan los enfoques convencionales.

Referencias

  1. ^ "La revolución centrada en los datos". TDAN.com . Septiembre de 2015. Consultado el 7 de diciembre de 2019 .
  2. ^ Bhageshpur, Kiran (6 de octubre de 2016). "El surgimiento de la informática centrada en los datos". The Next Platform . Consultado el 7 de diciembre de 2019 .
  3. ^ Bhagheshpur, Kiran. «Estado de la gestión de datos no estructurados en 2018» (PDF) . Ígneo . Archivado desde el original (PDF) el 18 de julio de 2020. Consultado el 7 de diciembre de 2019 .
  4. ^ "Requisitos para datos no estructurados a escala de petabytes". StorageSwiss.com - La página de inicio de Storage Switzerland . 14 de octubre de 2019. Consultado el 7 de diciembre de 2019 .
  5. ^ George S. Davidson, Kevin W. Boyack, Ron A. Zacharski, Stephen C. Helmreich y Jim R. Cowie (abril de 2006). "Computación centrada en datos con la arquitectura Netezza" (PDF) . sandia.gov . Consultado el 7 de diciembre de 2019 .{{cite web}}: CS1 maint: varios nombres: lista de autores ( enlace )
  6. ^ Por qué necesitamos arquitecturas informáticas abiertas y centradas en los datos , consultado el 7 de diciembre de 2019
  7. ^ Estados Unidos, Austin TX (10 de noviembre de 2016). "La red es el nuevo cuello de botella del almacenamiento". Datanami . Consultado el 7 de diciembre de 2019 .
  8. ^ "Manifiesto centrado en los datos". datacentricmanifesto.org . Consultado el 7 de diciembre de 2019 .
  9. ^ Simonite, Tom. "Los cimientos de la innovación en la industria informática están tambaleándose. ¿Qué puede reemplazarlos?". MIT Technology Review . Consultado el 7 de diciembre de 2019 .
  10. ^ "DPU: Data Processing Unit Programmable Processor" (Unidad de procesamiento de datos programable). Fungible . Archivado desde el original el 2020-08-05 . Consultado el 2019-12-07 .
  11. ^ Kieran, Mike (21 de marzo de 2019). "Cuando se implementa NVMe sobre estructuras, la estructura realmente importa". Blog de NetApp . Consultado el 7 de diciembre de 2019 .
  12. ^ "El impulso de los microservicios se acelera". DevOps.com . 2018-05-10 . Consultado el 2019-12-07 .