La migración de datos es el proceso de selección, preparación, extracción y transformación de datos y su transferencia permanente de un sistema de almacenamiento informático a otro. Además, la validación de la integridad de los datos migrados y el desmantelamiento del almacenamiento de datos heredado se consideran parte de todo el proceso de migración de datos. [1] [2] La migración de datos es una consideración clave para cualquier implementación, actualización o consolidación de sistemas, y normalmente se realiza de tal manera que sea lo más automatizada posible, liberando a los recursos humanos de tareas tediosas. La migración de datos se produce por diversas razones, entre ellas, reemplazos de servidores o equipos de almacenamiento, mantenimiento o actualizaciones, migración de aplicaciones , consolidación de sitios web, recuperación ante desastres y reubicación de centros de datos . [2]
En 2011 [actualizar], "casi el 40 por ciento de los proyectos de migración de datos se retrasaron, superaron el presupuesto o fracasaron por completo". [1] [3] Por lo tanto, una planificación adecuada es fundamental para una migración de datos eficaz. Si bien los detalles de un plan de migración de datos pueden variar (a veces significativamente) de un proyecto a otro, IBM sugiere que existen tres fases principales para la mayoría de los proyectos de migración de datos: planificación, migración y posmigración. [2] Cada una de esas fases tiene sus propios pasos. Durante la planificación, se analizan las dependencias y los requisitos, se desarrollan y prueban los escenarios de migración y se crea un plan de proyecto que incorpora la información previa. Durante la fase de migración, se implementa el plan y, durante la posmigración, se valida, documenta y cierra la integridad y minuciosidad de la migración, incluido el desmantelamiento necesario de los sistemas heredados. [2] Para aplicaciones de complejidad moderada a alta, estas fases de migración de datos pueden repetirse varias veces antes de que se considere que el nuevo sistema está completamente validado e implementado.
Planificación : Los datos y las aplicaciones que se van a migrar se seleccionan en función de los requisitos y dependencias comerciales, del proyecto y técnicos. Se analizan los requisitos de hardware y ancho de banda. Se desarrollan escenarios de migración y retroceso factibles, así como las pruebas asociadas, los scripts de automatización, los mapeos y los procedimientos. También se miden los requisitos de limpieza y transformación de datos para los formatos de datos a fin de mejorar la calidad de los mismos y eliminar información redundante u obsoleta. Se decide y desarrolla la arquitectura de migración, se obtienen las licencias de software necesarias y se inician los procesos de gestión de cambios. [1] [2]
Migración : Se validan los requisitos de hardware y software, y se personalizan los procedimientos de migración según sea necesario. También puede realizarse algún tipo de prueba de validación previa para garantizar que los requisitos y las configuraciones personalizadas funcionen como se espera. Si todo está bien, comienza la migración, incluidos los actos primarios de extracción de datos , donde se leen los datos del sistema anterior, y carga de datos , donde se escriben los datos en el nuevo sistema. Los pasos de verificación adicionales garantizan que el plan de migración desarrollado se haya implementado en su totalidad. [1] [2]
Post-migración : Después de la migración de datos, los resultados se someten a una verificación de datos para determinar si los datos se tradujeron correctamente, están completos y respaldan los procesos del nuevo sistema. Durante la verificación, puede ser necesario ejecutar en paralelo ambos sistemas para identificar áreas de disparidad y prevenir la pérdida errónea de datos . Se lleva a cabo documentación e informes adicionales del proyecto de migración y, una vez que se valida que la migración está completa, también se pueden desmantelar los sistemas heredados. Las reuniones de cierre de la migración finalizarán oficialmente el proceso de migración. [1] [2]
Existe una diferencia entre las actividades de migración de datos y las de integración de datos . La migración de datos es un proyecto mediante el cual se moverán o copiarán datos de un entorno a otro, y se eliminarán o desmantelarán en la fuente. Durante la migración (que puede durar meses o incluso años), los datos pueden fluir en múltiples direcciones y puede haber múltiples migraciones simultáneas. Las acciones ETL ( extraer, transformar, cargar ) serán necesarias, aunque los medios para lograrlas pueden no ser los tradicionalmente asociados con el acrónimo ETL.
Por el contrario, la integración de datos es una parte permanente de la arquitectura de TI y es responsable de la forma en que los datos fluyen entre las distintas aplicaciones y almacenes de datos, y es un proceso más que una actividad de proyecto. Las tecnologías ETL estándar diseñadas para suministrar datos desde los sistemas operativos a los almacenes de datos encajarían en la última categoría. [4]
Los datos se almacenan en diversos medios, en archivos o bases de datos , y son generados y consumidos por aplicaciones de software , que a su vez respaldan los procesos empresariales . La necesidad de transferir y convertir datos puede estar impulsada por múltiples requisitos empresariales, y el enfoque adoptado para la migración depende de esos requisitos. Sobre esta base, se proponen cuatro categorías principales de migración.
Una empresa puede optar por racionalizar los medios físicos para aprovechar tecnologías de almacenamiento más eficientes. [2] Esto dará como resultado la necesidad de mover bloques físicos de datos de una cinta o disco a otro, a menudo utilizando técnicas de virtualización . El formato de los datos y el contenido en sí no suelen modificarse en el proceso y normalmente se puede lograr con un impacto mínimo o nulo en las capas superiores. [5]
De manera similar, puede ser necesario cambiar de un proveedor de base de datos a otro, o actualizar el software de base de datos que se está utilizando. Es menos probable que el último caso requiera una migración física de datos, pero esto puede suceder con actualizaciones importantes. En estos casos, puede ser necesario un proceso de transformación física, ya que el formato de datos subyacente puede cambiar significativamente. Esto puede afectar o no al comportamiento en la capa de aplicaciones, dependiendo en gran medida de si el lenguaje o protocolo de manipulación de datos ha cambiado. [6] Sin embargo, algunas aplicaciones modernas están escritas para ser casi completamente independientes de la tecnología de la base de datos, [7] por lo que un cambio de Sybase , MySQL , IBM Db2 o SQL Server a Oracle solo debería requerir un ciclo de pruebas para estar seguro de que el rendimiento funcional y no funcional no se ha visto afectado negativamente.
Cambiar de proveedor de aplicaciones (por ejemplo, una nueva plataforma CRM o ERP ) implicará inevitablemente una transformación sustancial, ya que casi todas las aplicaciones o suites operan con su propio modelo de datos específico y también interactúan con otras aplicaciones y sistemas dentro del entorno de integración de aplicaciones empresariales . [8] Además, para permitir que la aplicación se venda al mercado más amplio posible, los paquetes comerciales listos para usar generalmente se configuran para cada cliente utilizando metadatos . Los proveedores pueden proporcionar interfaces de programación de aplicaciones (API) para proteger la integridad de los datos que deben manejar.
Los procesos de negocio funcionan mediante una combinación de acciones de sistemas humanos y de aplicaciones, a menudo orquestadas por herramientas de gestión de procesos de negocio. Cuando estos cambian, pueden requerir el movimiento de datos de una tienda, base de datos o aplicación a otra para reflejar los cambios en la organización y la información sobre clientes, productos y operaciones. Ejemplos de estos impulsores de la migración son las fusiones y adquisiciones, la optimización empresarial y la reorganización para atacar nuevos mercados o responder a amenazas competitivas. [9]
Las dos primeras categorías de migración suelen ser actividades operativas rutinarias de las que se encarga el departamento de TI sin la participación del resto de la empresa. Las dos últimas categorías afectan directamente a los usuarios operativos de los procesos y aplicaciones, son necesariamente complejas y su realización sin tiempos de inactividad significativos de la empresa puede resultar un desafío. Un enfoque altamente adaptable, una sincronización concurrente, una capacidad de auditoría orientada a la empresa y una visibilidad clara de la migración para las partes interesadas (a través de una oficina de gestión de proyectos o un equipo de gobernanza de datos) probablemente sean requisitos clave en dichas migraciones. [9]
La migración, que se centra en el objeto digital en sí, es el acto de transferir o reescribir datos de un medio obsoleto a un medio actual y durante muchos años se ha considerado el único enfoque viable para la preservación a largo plazo de objetos digitales. [10] La reproducción de periódicos frágiles en microfilm es un ejemplo de dicha migración.