stringtranslate.com

Sistema de archivos en clúster Blue Whale

El sistema de archivos agrupado Blue Whale ( BWFS ) es un sistema de archivos de disco compartido (también llamado sistema de archivos agrupado , sistema de archivos de almacenamiento compartido o sistema de archivos SAN ) fabricado por Tianjin Zhongke Blue Whale Information Technologies Company en China .

Descripción general

BWFS permite el acceso simultáneo a archivos en plataformas heterogéneas y la creación, el almacenamiento y el uso compartido de archivos de alto rendimiento. BWFS se instala en hosts que están conectados a la misma matriz de discos en una red de área de almacenamiento (SAN). No es necesario que los sistemas cliente ejecuten el mismo sistema operativo para acceder a un sistema de archivos compartido que contiene datos de StorNext. A partir de enero de 2010, los sistemas operativos con software de cliente disponible son Microsoft Windows , Linux y Mac OS X.

BWFS puede convertir muchas matrices de discos FibreChannel o iSCSI en un clúster de almacenamiento que admite múltiples servidores para procesamiento paralelo, proporciona un servicio de uso compartido de archivos extensible y de alto rendimiento, y admite flujos de trabajo o aplicaciones de múltiples máquinas en un entorno de clúster.

El sistema de archivos BWFS se implementa en el modo de acceso directo a los datos. Los datos de archivos compartidos acceden directamente a la matriz de discos FC o iSCSI a través de la red SAN para transferir datos omitiendo el servidor de archivos o el cabezal NAS, lo que muestra plenamente la ventaja del alto ancho de banda del entorno SAN. BWFS permite una gran mejora del sistema en la capacidad de procesamiento de archivos simultáneos sin cambiar el entorno de la aplicación front-end ni la condición SAN back-end.

BWFS respalda el MDC de estructura redundante (Meta Data Controller), brindando excelentes capacidades de rendimiento y alta disponibilidad, combinadas con infraestructura SAN para brindar confiabilidad del sistema y seguridad de datos para el almacenamiento a nivel empresarial.

Proceso de acceso a datos

BWFS es compatible con plataformas heterogéneas de múltiples sistemas operativos, lo que permite que varios servidores accedan simultáneamente al mismo conjunto de discos y archivos sin importar el tipo de sistema de archivos respectivo. Actualmente, BWFS es compatible con una variedad de plataformas Linux de clase empresarial y Windows 2000, Windows XP y Windows 2003. Apuntando a diferentes sistemas operativos, BWFS tiene diferentes programas cliente, algunos de los cuales pueden identificar y proporcionar acceso al sistema de archivos compartido de BWFS y garantizar una presentación consistente del sistema de archivos en diferentes sistemas operativos. Las solicitudes de E/S se pueden manejar correctamente.

Cuando varios servidores acceden simultáneamente al mismo sistema de archivos, se necesita un mecanismo determinado para evitar que dos servidores escriban en la misma ubicación del disco. También se debe garantizar que un servidor determinado no lea contenido diferente al leer un archivo mientras otro servidor está actualizando este archivo. En BWFS, este mecanismo y esta función los proporciona el controlador de metadatos.

El MDC es responsable de coordinar el acceso del servidor al sistema de archivos BWFS, ubicado fuera de la ruta de lectura y escritura de los datos del archivo. El cliente se comunica a través de enlaces IP separados y el MDC para obtener la ubicación de los archivos y la información de asignación de recursos del bloque de datos. Y luego, a través de la red SAN, el disco se lee y escribe directamente en modo de nivel de bloque. Este diseño de arquitectura se denomina "trama de transmisión fuera de banda" o "arquitectura asimétrica" ​​en términos técnicos:

El proceso de acceso a los datos se puede desglosar de la siguiente manera:

  1. El programa de aplicación emite una solicitud de escritura
  2. El cliente BWFS envía una solicitud operativa a MDC a través de LAN
  3. MDC procesa esta solicitud y responde al cliente para que se puedan leer bloques de disco en datos a través de LAN.
  4. El cliente BWFS escribe datos directamente en el sistema de archivos a la velocidad de la línea.

BWFS está diseñado sobre la base del entorno SAN, lo que permite que una gran cantidad de servidores o estaciones de trabajo que se conectan a FC SAN o IP SAN (iSCSI) accedan directamente al mismo sistema de archivos. BWFS FC puede utilizar uno o más enlaces FC para acceder a los recursos del disco, de modo que el rendimiento de E/S de un solo servidor se puede ampliar a varios GB/s desde más de 100 MB/s simplemente aumentando la tarjeta HBA FC.

Por supuesto, el rendimiento general de un sistema no solo es relevante para el rendimiento del host y la red, sino que también está influenciado por el rendimiento del disco que constituye el sistema de archivos. Por lo tanto, el sistema de archivos BWFS puede estructurarse por LUN a partir de múltiples matrices de discos. Equivale a otra capa de RAID estructurada entre múltiples matrices de discos, lo que maximiza el rendimiento de las matrices de discos.

Otro factor de rendimiento que se debe considerar es la ubicación de los metadatos. Un archivo consta de datos reales y metadatos. Los datos reales son el contenido de un archivo, mientras que los metadatos incluyen atributos de archivo, permisos, etc. Cuando se crea, modifica o elimina un archivo, la información de metadatos se modifica, lo que significa que un archivo se procesa leyendo tanto los datos como los metadatos del archivo. Por lo general, los archivos grandes se leen y escriben de forma continua, mientras que los metadatos se leen moviendo el cabezal del disco magnético a otra ubicación. Para el disco, su modo de lectura y escritura es mucho mayor que el grado de aleatoriedad. Si los datos y los metadatos se memorizan en el mismo disco (modo de la mayoría de los sistemas de archivos), el grado de aleatoriedad del archivo grande se mejorará en consecuencia para reducir el rendimiento de lectura y escritura. Por esta razón, el sistema de archivos BWFS memoriza los metadatos en diferentes discos o volúmenes en el diseño, de modo que la lectura y escritura continua de archivos esté separada de la aleatoriedad de los metadatos. No se influyen mutuamente, a fin de proporcionar el mayor ancho de banda de E/S posible.

Además, después de la separación de datos y metadatos, los datos y metadatos se pueden procesar de forma independiente en diferentes hosts sin ocupar el ancho de banda del canal de datos, lo que puede mejorar la concurrencia de datos y metadatos para mejorar aún más el rendimiento del sistema de archivos.

Comercialización

Una publicación de Gartner de 2006 decía:

"BWFS, un sistema de archivos en clúster (CFS) basado en protocolo de Internet (IP), ha dejado atrás el laboratorio de investigación y ha entrado en la etapa de comercialización, y ahora se ha implementado con éxito en varias industrias, entre ellas la energética, la automotriz, la militar y la de los medios de comunicación. Su éxito demuestra las fortalezas de los institutos de investigación de China en el ámbito tecnológico, a pesar de su relativa falta de experiencia comercial y recursos de inversión en comparación con muchos proveedores de tecnología occidentales. Aunque los CFS aún no son comunes en el mercado de almacenamiento convencional, para algunos usuarios que necesitan un rendimiento de entrada/salida de E/S muy alto (especialmente aplicaciones de vanguardia como petróleo y gas, biotecnología y diseño asistido por computadora [CAD]), BWFS ofrece una buena solución de precio/rendimiento. Los usuarios también deberían considerar BWFS si buscan un CFS de menor precio. Los usuarios que necesitan una solución más comercializada (o que desean tener una interfaz más "lista para usar") deberían considerar otros proveedores como Panasas, Isilon e Ibrix en lugar de BWFS". [1]

BWFS fue desarrollado en los Centros Nacionales de Investigación para Computadoras de Alto Rendimiento de la Academia China de Ciencias . En 2007, FalconStor anunció una empresa conjunta para vender el software. [2] La empresa conjunta se denominó Tianjin Zhongke Blue Whale Information Technologies Company, ubicada en Tianjin , China . [3] La firma de capital de riesgo VantagePoint Capital también realizó una inversión. [4] Se anunció que BWFS se usaría para el video de un satélite destinado a cubrir los Juegos Olímpicos de Verano de 2008. [ 5]

Véase también

Referencias

  1. ^ Jimmie Chang (28 de septiembre de 2006). "Dataquest Insight: China Research Lab Case Study Shows Benefits of 'Homegrown' Advanced Technology". Número de identificación: G00142484 . Gartner . p. 2. Archivado desde el original el 27 de septiembre de 2012.
  2. ^ James Rogers (27 de octubre de 2007). «FalconStor lanza una empresa en China». Computación en red . Archivado desde el original el 19 de marzo de 2012. Consultado el 15 de julio de 2011 .
  3. ^ "CAS une fuerzas con FalconStor". Comunicado de prensa . 26 de octubre de 2007. Archivado desde el original el 19 de marzo de 2012 . Consultado el 15 de julio de 2011 .
  4. ^ "BlueWhale". Cartera: Asia . VantagePoint Capital Partners. Archivado desde el original el 2 de octubre de 2011. Consultado el 15 de julio de 2011 .
  5. ^ "El sistema de archivos de la ballena azul se utilizará en el satélite olímpico". Academia China de Ciencias. 21 de junio de 2006. Archivado desde el original el 27 de septiembre de 2011. Consultado el 15 de julio de 2011 .

Lectura adicional

Enlaces externos