stringtranslate.com

Virtualización de datos

La virtualización de datos es un enfoque de gestión de datos que permite a una aplicación recuperar y manipular datos sin requerir detalles técnicos sobre los datos, como cómo están formateados en la fuente o dónde están ubicados físicamente, [1] y puede proporcionar una vista única del cliente (o una vista única de cualquier otra entidad) de todos los datos. [2]

A diferencia del proceso tradicional de extracción, transformación y carga ("ETL"), los datos permanecen en su lugar y se proporciona acceso en tiempo real al sistema de origen para los datos. Esto reduce el riesgo de errores de datos, de que la carga de trabajo mueva datos que tal vez nunca se utilicen y no intenta imponer un modelo de datos único sobre los datos (un ejemplo de datos heterogéneos es un sistema de base de datos federado ). La tecnología también admite la escritura de actualizaciones de datos de transacciones en los sistemas de origen. [3] Para resolver las diferencias en los formatos y la semántica de origen y consumidor, se utilizan varias técnicas de abstracción y transformación. Este concepto y software es un subconjunto de la integración de datos y se utiliza comúnmente en inteligencia empresarial , servicios de datos de arquitectura orientada a servicios , computación en la nube , búsqueda empresarial y gestión de datos maestros .

Aplicaciones, ventajas y desventajas

La característica distintiva de la virtualización de datos es que los datos utilizados permanecen en sus ubicaciones originales y se establece un acceso en tiempo real para permitir el análisis de múltiples fuentes. Esto ayuda a resolver algunas dificultades técnicas, como problemas de compatibilidad al combinar datos de varias plataformas, reduciendo el riesgo de error causado por datos defectuosos y garantizando que se utilicen los datos más recientes. Además, evitar la creación de una nueva base de datos que contenga información personal puede facilitar el cumplimiento de las normas de privacidad. Como resultado, la virtualización de datos crea nuevas posibilidades para el uso de los datos. [4]

Partiendo de esta base, el valor real de la virtualización de datos, en particular para los usuarios, es su enfoque declarativo. A diferencia de los métodos tradicionales de integración de datos que requieren especificar cada paso de la integración, este enfoque puede ser menos propenso a errores y más eficiente. Los métodos tradicionales son tediosos, especialmente cuando se adaptan a requisitos cambiantes, que implican cambios en múltiples pasos. La virtualización de datos, en cambio, permite a los usuarios simplemente describir el resultado deseado. Luego, el software genera automáticamente los pasos necesarios para lograr este resultado. Si el resultado deseado cambia, basta con actualizar la descripción y el software ajusta los pasos intermedios en consecuencia. Esta flexibilidad puede acelerar los procesos hasta cinco veces, lo que subraya la principal ventaja de la virtualización de datos. [5]

Sin embargo, con la virtualización de datos, la conexión a todas las fuentes de datos necesarias debe estar operativa, ya que no existe una copia local de los datos, lo que constituye uno de los principales inconvenientes de este enfoque. Los problemas de conexión ocurren con mayor frecuencia en sistemas complejos en los que una o más fuentes cruciales ocasionalmente no estarán disponibles. El almacenamiento inteligente de datos en búfer, como mantener los datos de las solicitudes más recientes en el búfer del sistema de virtualización, puede ayudar a mitigar este problema. [4]

Además, debido a que las soluciones de virtualización de datos pueden utilizar una gran cantidad de conexiones de red para leer los datos originales y las tablas virtualizadas del servidor a otras soluciones a través de la red, la seguridad del sistema requiere una mayor consideración que con los lagos de datos tradicionales. En un sistema de lago de datos convencional, los datos se pueden importar al lago siguiendo procedimientos específicos en un único entorno. Cuando se utiliza un sistema de virtualización, el entorno debe establecer por separado conexiones seguras con cada fuente de datos, que normalmente se encuentra en un entorno diferente del propio sistema de virtualización. [4]

La seguridad de los datos personales y el cumplimiento de las normativas pueden ser un problema importante a la hora de introducir nuevos servicios o intentar combinar varias fuentes de datos. Cuando se entregan datos para su análisis, la virtualización de datos puede ayudar a resolver problemas relacionados con la privacidad. La virtualización permite combinar datos personales de distintas fuentes sin tener que copiarlos físicamente a otra ubicación, al tiempo que limita la visualización a todas las demás variables recopiladas. Sin embargo, la virtualización no elimina el requisito de confirmar la seguridad y la privacidad de los resultados del análisis antes de hacerlos más accesibles. Independientemente del método de integración de datos elegido, todos los resultados basados ​​en datos de nivel personal deben protegerse con los requisitos de privacidad adecuados. [4]

Virtualización de datos y almacenamiento de datos

Algunos entornos empresariales están repletos de fuentes de datos dispares, incluidos múltiples almacenes de datos , depósitos de datos y lagos de datos , aunque un almacén de datos, si se implementa correctamente, debería ser único y una única fuente de información veraz . La virtualización de datos puede unir de manera eficiente los datos entre almacenes de datos, depósitos de datos y lagos de datos sin tener que crear una nueva plataforma de datos física integrada. La infraestructura de datos existente puede seguir realizando sus funciones principales mientras que la capa de virtualización de datos simplemente aprovecha los datos de esas fuentes. Este aspecto de la virtualización de datos la hace complementaria a todas las fuentes de datos existentes y aumenta la disponibilidad y el uso de los datos empresariales. [ cita requerida ]

La virtualización de datos también puede considerarse una alternativa a la extracción, transformación y carga de datos (ETL) y al almacenamiento de datos, pero por cuestiones de rendimiento no se recomienda realmente para un almacén de datos muy grande. La virtualización de datos tiene como objetivo inherente producir información rápida y oportuna de múltiples fuentes sin tener que embarcarse en un gran proyecto de datos con una extracción, transformación y carga de datos extensa. Sin embargo, la virtualización de datos puede extenderse y adaptarse para satisfacer también los requisitos del almacenamiento de datos. Esto requerirá una comprensión de los requisitos de almacenamiento e historial de datos junto con la planificación y el diseño para incorporar el tipo correcto de virtualización de datos, integración y estrategias de almacenamiento, y optimizaciones de infraestructura/rendimiento (por ejemplo, transmisión, en memoria, almacenamiento híbrido). [ cita requerida ]

Ejemplos

Funcionalidad

El software de virtualización de datos proporciona algunas o todas las siguientes capacidades: [7]

El software de virtualización de datos puede incluir funciones de desarrollo, operación y/o gestión. [ cita requerida ]

Un motor de metadatos recopila, almacena y analiza información sobre datos y metadatos (datos sobre datos) en uso dentro de un dominio. [8] [ aclaración necesaria ]

Los beneficios incluyen:

Las desventajas incluyen:

Evitar el uso:

Historia

La integración de información empresarial (EII) (acuñado por primera vez por Metamatrix), ahora conocida como Red Hat JBoss Data Virtualization, y los sistemas de bases de datos federadas son términos utilizados por algunos proveedores para describir un elemento central de la virtualización de datos: la capacidad de crear uniones relacionales en una VISTA federada. [ cita necesaria ] [ aclaración necesaria ]

Tecnología

Algunas soluciones y proveedores de virtualización de datos:

Gartner elabora otra lista más actualizada con clasificaciones de usuarios. [29]

Véase también

Referencias

  1. ^ "¿Qué es la virtualización de datos?", Margaret Rouse, TechTarget.com, consultado el 19 de agosto de 2013
  2. ^ Racionalización de los datos de los clientes
  3. ^ abc "La virtualización de datos en aumento como alternativa ETL para la integración de datos" Gareth Morgan, Computer Weekly, consultado el 19 de agosto de 2013
  4. ^ abcd Paiho, Satu; Tuominen, Pekka; Rökman, Jyri; Ylikerälä, Markus; Pajula, Juha; Siikavirta, Hanne (2022). "Oportunidades de los datos urbanos recopilados para ciudades inteligentes". Ciudades inteligentes IET . 4 (4): 275–291. doi : 10.1049/smc2.12044 . S2CID  253467923.
  5. ^ ab "El verdadero valor de la virtualización de datos: más allá de las palabras de moda del marketing", Nick Golovin, medium.com, consultado el 14 de noviembre de 2023
  6. ^ "Hammerspace: un verdadero sistema de archivos global". Hammerspace . Consultado el 31 de octubre de 2021 .
  7. ^ Summan, Jesse; Handmaker, Leslie (20 de diciembre de 2022). "Federación de datos frente a virtualización de datos". StreamSets . Consultado el 8 de febrero de 2024 .
  8. ^ Kendall, Aaron. "Diseño basado en metadatos: diseño de un motor flexible para la recuperación de datos de API". InfoQ . Consultado el 25 de abril de 2017 .
  9. ^ "Acceso rápido a datos dispares en distintos proyectos sin necesidad de volver a trabajar" Informatica, consultado el 19 de agosto de 2013
  10. ^ Virtualización de datos: 6 prácticas recomendadas para ayudar a las empresas a "entenderlo" Joe McKendrick, ZDNet, 27 de octubre de 2011
  11. ^ |Los profesionales de TI revelan los beneficios y desventajas del software de virtualización de datos" Mark Brunelli, SearchDataManagement, 11 de octubre de 2012
  12. ^ abc "Los pros y contras de la virtualización de datos" Archivado el 5 de agosto de 2014 en Wayback Machine Loraine Lawson, BusinessEdge, 7 de octubre de 2011
  13. ^ "Analyticscreator: la caja de herramientas definitiva para ingenieros de datos". www.analyticscreator.com . Consultado el 27 de agosto de 2024 .
  14. ^ "Virtualización de datos de IBM". www.ibm.com . Consultado el 9 de abril de 2024 .
  15. ^ https://www.actifio.com/company/blog/post/enterprise-data-service-new-copy-data-virtualization/ [ URL desnuda ]
  16. ^ "Ultrawrap - Estándares de la Web Semántica". www.w3.org . Consultado el 9 de abril de 2024 .
  17. ^ "Virtualidad de datos: integre datos para tomar decisiones mejor informadas". Virtualidad de datos . Consultado el 9 de abril de 2024 .
  18. ^ "Mi blog – Mi blog de WordPress". 2023-09-19 . Consultado el 2024-04-09 .
  19. ^ "La empresa líder en datos de la industria para DevOps". Delphix . Consultado el 9 de abril de 2024 .
  20. ^ "Denodo es líder en gestión de datos". Denodo . 2014-09-03 . Consultado el 2024-04-09 .
  21. ^ https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RWJFdq [ URL desnuda ]
  22. ^ "Inicio". Querona Data Virtualization . Consultado el 9 de abril de 2024 .
  23. ^ "Guía de introducción a Red Hat JBoss Data Virtualization 6.4 | Portal del cliente de Red Hat". access.redhat.com . Consultado el 9 de abril de 2024 .
  24. ^ "Stone Bond Technologies | Solución de plataforma de integración de datos avanzada". Stone Bond Technologies . Consultado el 9 de abril de 2024 .
  25. ^ "La capa de datos semánticos empresariales de Stratio ofrece una precisión de respuesta del 99 % para los estudiantes de maestría en derecho". Stratio . 2024-01-15 . Consultado el 2024-04-09 .
  26. ^ "Teiid". teiid.io . Consultado el 9 de abril de 2024 .
  27. ^ "Administración de los parámetros de configuración del sistema de archivos de aprovisionamiento de Veritas (VPFS) | Administración de servicios de NetBackup desde el shell de deduplicación | Acceso a instancias del servidor de almacenamiento WORM de NetBackup para tareas de administración | Administración de instancias de la aplicación NetBackup | Guía de la aplicación NetBackup™ 10.2.0.1 | Veritas™". www.veritas.com . Consultado el 9 de abril de 2024 .
  28. ^ "Proyecto de integración de datos de XAware". SourceForge . 2016-04-06 . Consultado el 2024-04-09 .
  29. ^ "Reseñas de las mejores soluciones de virtualización de datos". Gartner . 2024 . Consultado el 7 de febrero de 2024 .

Lectura adicional