Sawzall

Esto permitirá dividir los datos complejos en más simples y, por lo tanto, facilitar el trabajo.

Utilizará Protocol Buffers para obtener un formato común , poder definir mensajes con los que se comunicarán los servidores de Google y para almacenar los registros permanentes en disco (Propósito similar a XML).

Para ello fue necesario crear una alternativa que permitiera una programación procedural donde se dividiera el trabajo.

Si se pueden distribuir los cálculos en varias máquinas y lograr rendimientos muy altos se necesitará una fase de agregación que nos permita juntar el trabajo realizado de estas.

Gracias a la infraestructura que Google utiliza para el manejo de datos con Global File System y MapReduce el sistema es fiable y tolerante a fallos.

La entrada a los trabajos de análisis a menudo incluye información personal como direcciones IP y existen reglas estricta que limitan que los analistas puedan hacer con estos datos.

Para ello, se lanzó un servicio centralizado llamado Sawmill que administraba todos los análisis de Sawzall.

Sawzall pudo continuar como un lenguaje pequeño pero fue tan útil que la gente esperaba más de él y las necesidades crecieron más de lo que el propio sistema podía proporcionar.

Sawzall permite a los usuarios llamar a funciones creadas en otros idiomas para que pueda integrarse con otros sistemas y su control de permisos se basa en Sandbox (seguridad informática) .

Para evitar que los analistas accedieran a información confidencial debieron imponer restricciones más estrictas en las tareas analizadas.

Utilizará, por ejemplo, estructuras de control como for, while, if para realizar los bucles o int y float para declarar variables igual que en los lenguajes mencionados anteriormente.

Funcionamiento de Sawzall.