Pig (herramienta de programación)

Pig[1]​ es una plataforma de alto nivel para crear programas MapReduce utilizados en Hadoop.

El lenguaje de esta plataforma es llamado Pig Latin.

Pig Latin puede ser ampliado utilizando UDF (Funciones Definidas por el Usuario) que el usuario puede escribir en Java, Python, Javascript, Ruby o Groovy[2]​ y luego llamar directamente desde el lenguaje.

Pig fue desarrollado originalmente[3]​ por Yahoo Research en torno a 2006 por los investigadores para tener una forma ad hoc de crear y ejecutar un trabajo map-reduce en conjuntos de datos muy grandes.

[5]​ A continuación se muestra un ejemplo de un programa de "Word Count" en Pig Latin: El programa anterior generarà tasques executables paral·leles que es poden distribuir a través de diverses màquines en un clúster Hadoop per comptar el nombre de paraules en un conjunt de dades com totes les pàgines web a Internet.