Control de versiones distribuidas

En el desarrollo de software , el control de versiones distribuido (también conocido como control de revisiones distribuido ) es una forma de control de versiones en la que el código base completo , incluido su historial completo, se refleja en la computadora de cada desarrollador. ^[1] En comparación con el control de versiones centralizado, esto permite la administración automática de bifurcaciones y fusiones , acelera la mayoría de las operaciones (excepto empujar y tirar), mejora la capacidad de trabajar sin conexión y no depende de una única ubicación para las copias de seguridad. ^[1]^[2]^[3] Git , el sistema de control de versiones más popular del mundo, ^[4] es un sistema de control de versiones distribuido.

En 2010, el autor de desarrollo de software Joel Spolsky describió los sistemas de control de versiones distribuidas como "posiblemente el mayor avance en la tecnología de desarrollo de software en los [últimos] diez años". ^[2]

Distribuido versus centralizado

Los sistemas de control de versiones distribuidos (DVCS) utilizan un enfoque de igual a igual para el control de versiones, a diferencia del enfoque cliente-servidor de los sistemas centralizados. El control de revisiones distribuido sincroniza los repositorios transfiriendo parches de igual a igual. No existe una versión central única del código base; en cambio, cada usuario tiene una copia de trabajo y el historial de cambios completo.

Las ventajas de DVCS (en comparación con los sistemas centralizados) incluyen:

Permite a los usuarios trabajar de forma productiva cuando no están conectados a una red.
Las operaciones comunes (como confirmaciones, visualización del historial y reversión de cambios) son más rápidas para DVCS porque no es necesario comunicarse con un servidor central. ^[5] Con DVCS, la comunicación es necesaria solo cuando se comparten cambios entre otros pares.
Permite el trabajo privado, por lo que los usuarios pueden utilizar sus cambios incluso en borradores iniciales que no quieran publicar. ^{[ cita necesaria ]}
Las copias de trabajo funcionan efectivamente como copias de seguridad remotas, lo que evita depender de una máquina física como único punto de falla. ^[5]
Permite utilizar varios modelos de desarrollo, como el uso de ramas de desarrollo o un modelo de Comandante/Teniente. ^[6]
Permite el control centralizado de la "versión de lanzamiento" del proyecto ^{[ cita necesaria ]}
En proyectos de software FOSS es mucho más fácil crear una bifurcación de un proyecto que está estancado debido a conflictos de liderazgo o desacuerdos de diseño.

Las desventajas de DVCS (en comparación con los sistemas centralizados) incluyen:

El pago inicial de un repositorio es más lento en comparación con el pago en un sistema de control de versiones centralizado, porque todas las ramas y el historial de revisiones se copian en la máquina local de forma predeterminada.
La falta de mecanismos de bloqueo que forma parte de la mayoría de los VCS centralizados y que aún juega un papel importante cuando se trata de archivos binarios no fusionables, como recursos gráficos o paquetes binarios o XML de un solo archivo demasiado complejos (por ejemplo, documentos de Office, archivos PowerBI, SQL Server). paquetes de BI de herramientas de datos, etc.). ^{[ cita necesaria ]}
Se requiere almacenamiento adicional para que cada usuario tenga una copia completa del historial completo del código base. ^[7]
Mayor exposición del código base ya que cada participante tiene una copia localmente vulnerable. ^{[ cita necesaria ]}

Algunos sistemas originalmente centralizados ahora ofrecen algunas características distribuidas. Team Foundation Server y Visual Studio Team Services ahora alojan repositorios de control de versiones centralizados y distribuidos a través de Git.

De manera similar, algunos sistemas distribuidos ahora ofrecen características que mitigan los problemas de tiempos de pago y costos de almacenamiento, como el sistema de archivos virtual para Git desarrollado por Microsoft para trabajar con bases de código muy grandes, ^[8] que expone un sistema de archivos virtual que descarga archivos a almacenamiento local sólo cuando sean necesarios.

Modelo de trabajo

El modelo distribuido generalmente es más adecuado para proyectos grandes con desarrolladores parcialmente independientes, como el proyecto del kernel de Linux, porque los desarrolladores pueden trabajar de forma independiente y enviar sus cambios para su fusión (o rechazo). El modelo distribuido permite de manera flexible adoptar flujos de trabajo de contribución de código fuente personalizados. El flujo de trabajo del integrador es el más utilizado. En el modelo centralizado, los desarrolladores deben serializar su trabajo para evitar problemas con diferentes versiones.

Repositorios centrales y sucursales

En un proyecto verdaderamente distribuido, como Linux , cada contribuyente mantiene su propia versión del proyecto, con diferentes contribuyentes hospedando sus respectivas versiones e incorporando cambios de otros usuarios según sea necesario, lo que resulta en un consenso general que surge de múltiples nodos diferentes. Esto también facilita el proceso de "bifurcación", ya que todo lo que se requiere es que un colaborador deje de aceptar solicitudes de extracción de otros contribuyentes y permita que las bases de código se separen gradualmente.

Sin embargo, este acuerdo puede ser difícil de mantener, lo que da lugar a que muchos proyectos opten por cambiar a un paradigma en el que un contribuyente es el "ascendente" universal, un depósito del que casi siempre se extraen los cambios. Bajo este paradigma, el desarrollo está algo recentralizado, ya que cada proyecto ahora tiene un repositorio central que se considera informalmente como el repositorio oficial, administrado colectivamente por los mantenedores del proyecto. Si bien los sistemas de control de versiones distribuidos facilitan a los nuevos desarrolladores "clonar" una copia del repositorio de cualquier otro colaborador, en un modelo central, los nuevos desarrolladores siempre clonan el repositorio central para crear copias locales idénticas del código base. Bajo este sistema, los cambios de código en el repositorio central se sincronizan periódicamente con el repositorio local y, una vez finalizado el desarrollo, el cambio debe integrarse en el repositorio central lo antes posible.

Las organizaciones que utilizan este patrón de centralización a menudo optan por alojar el repositorio central en un servicio de terceros como GitHub , que no solo ofrece un tiempo de actividad más confiable que los repositorios autohospedados, sino que también puede agregar características centralizadas como rastreadores de problemas e integración continua .

Solicitudes de extracción

Las contribuciones a un repositorio de código fuente que utiliza un sistema de control de versiones distribuido se realizan comúnmente mediante una solicitud de extracción , también conocida como solicitud de fusión . ^[9] El colaborador solicita que el responsable del proyecto realice el cambio en el código fuente, de ahí el nombre "solicitud de extracción". El mantenedor tiene que fusionar la solicitud de extracción si la contribución debe pasar a formar parte de la base de origen. ^[10]

El desarrollador crea una solicitud de extracción para notificar a los mantenedores sobre un nuevo cambio; un hilo de comentarios está asociado con cada solicitud de extracción. Esto permite una discusión centrada en los cambios de código . Las solicitudes de extracción enviadas son visibles para cualquier persona con acceso al repositorio. Los mantenedores pueden aceptar o rechazar una solicitud de extracción. ^[11]

Una vez que la solicitud de extracción se revisa y aprueba, se fusiona en el repositorio. Dependiendo del flujo de trabajo establecido, es posible que sea necesario probar el código antes de incluirlo en el lanzamiento oficial. Por lo tanto, algunos proyectos contienen una rama especial para fusionar solicitudes de extracción no probadas. ^[10]^[12] Otros proyectos ejecutan un conjunto de pruebas automatizadas en cada solicitud de extracción, utilizando una herramienta de integración continua , y el revisor verifica que cualquier código nuevo tenga una cobertura de prueba adecuada.

Historia

Los primeros sistemas DVCS de código abierto incluyeron Arch , Monotone y Darcs . Sin embargo, los DVCS de código abierto nunca fueron muy populares hasta el lanzamiento de Git y Mercurial .

BitKeeper se utilizó en el desarrollo del kernel de Linux de 2002 a 2005. ^[13] El desarrollo de Git , actualmente el sistema de control de versiones más popular del mundo, ^[4] fue impulsado por la decisión de la empresa que creó BitKeeper de rescindir el sistema gratuito licencia que Linus Torvalds y algunos otros desarrolladores del kernel de Linux habían aprovechado anteriormente. ^[13]

Ver también

Control de versiones
Lista de software de control de versiones
Comparación de software de control de versiones
Categoría: Software que utiliza control de versiones distribuidas
Clon del repositorio
Git , un DVCS de código abierto desarrollado para el desarrollo del Kernel de Linux
Mercurial , un sistema multiplataforma similar a Git
Fossil , un sistema de control de versiones distribuido, sistema de seguimiento de errores y software wiki
BitKeeper
Bazar GNU
Sistema de Versiones Concurrentes , un predecesor de los sistemas de control de versiones distribuidas
TortoiseHg , una interfaz gráfica para Mercurial
Code Co-op , un sistema de control de versiones peer-to-peer

Referencias

^ ab Chacón, Scott; Straub, Ben (2014). "Acerca del control de versiones". Pro Git (2ª ed.). Presione. Capítulo 1.1 . Consultado el 4 de junio de 2019 .
^ ab Spolsky, Joel (17 de marzo de 2010). "El control de versiones distribuidas llegó para quedarse, cariño". Joel sobre el software . Consultado el 4 de junio de 2019 .
^ "Introducción al control de versiones distribuidas (ilustrado)". www.betterexplained.com . Consultado el 7 de enero de 2018 .
^ ab "Popularidad de los sistemas de control de versiones en 2016". www.rhodecode.com . Consultado el 7 de enero de 2018 .
^ ab O'Sullivan, Bryan. «Control de revisiones distribuido con Mercurial» . Consultado el 13 de julio de 2007 .
^ Chacón, Scott; Straub, Ben (2014). "Flujos de trabajo distribuidos". Pro Git (2ª ed.). Presione. Capítulo 5.1.
^ "¿Qué es el control de versiones: centralizado frente a DVCS?". www.atlassian.com . 14 de febrero de 2012 . Consultado el 7 de enero de 2018 .
^ Jonathan Allen (8 de febrero de 2017). "Cómo Microsoft resolvió el problema de Git con repositorios grandes" . Consultado el 6 de agosto de 2019 .
^ Sijbrandij, Sytse (29 de septiembre de 2014). "Flujo de GitLab". GitLab . Consultado el 4 de agosto de 2018 .
^ ab Johnson, Mark (8 de noviembre de 2013). "¿Qué es una solicitud de extracción?". Oaawatch . Consultado el 27 de marzo de 2016 .
^ "Uso de solicitudes de extracción". GitHub . Consultado el 27 de marzo de 2016 .
^ "Realizar una solicitud de extracción". Atlassiano . Consultado el 27 de marzo de 2016 .
^ ab McAllister, Neil. "El error de BitKeeper de Linus Torvalds". InfoMundo . Consultado el 19 de marzo de 2017 .

enlaces externos

Ensayo sobre varios sistemas de control de revisiones, especialmente la sección "SCM centralizado versus descentralizado"
Introducción a los sistemas de control de versiones distribuidas: artículo de IBM Developer Works