Michael Ralph Stonebraker (nacido el 11 de octubre de 1943 [6] ) es un informático estadounidense especializado en sistemas de bases de datos . A través de una serie de prototipos académicos y nuevas empresas comerciales, la investigación y los productos de Stonebraker son fundamentales para muchas bases de datos relacionales . También es el fundador de muchas empresas de bases de datos, incluidas Ingres Corporation , Illustra , Paradigm4, StreamBase Systems , Tamr, Vertica y VoltDB , y se desempeñó como director técnico de Informix . Por sus contribuciones a la investigación de bases de datos, Stonebraker recibió el Premio Turing 2014 , a menudo descrito como "el Premio Nobel de la informática". [7]
La carrera de Stonebraker se puede dividir en dos fases: su tiempo en la Universidad de California, Berkeley, cuando se centró en sistemas de gestión de bases de datos relacionales como Ingres y Postgres , y, a partir de 2001, en el Instituto Tecnológico de Massachusetts (MIT), donde desarrolló técnicas de gestión de datos más novedosas como C-Store , H-Store , SciDB y DBOS . [8] Stonebraker es actualmente profesor emérito en UC Berkeley y profesor adjunto en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT. [9] [10] También es conocido como editor del libro Readings in Database Systems .
Stonebraker creció en Milton, New Hampshire . [11] Obtuvo su licenciatura en ingeniería eléctrica en la Universidad de Princeton en 1965, y su maestría y doctorado en la Universidad de Michigan en 1967 y 1971 [12] respectivamente. Sus premios incluyen la Medalla John von Neumann del IEEE y el primer Premio a la Innovación Edgar F. Codd de SIGMOD . En 1994 fue incluido como miembro de la Association for Computing Machinery . [13] En 1997, fue elegido miembro de la Academia Nacional de Ingeniería por el desarrollo y comercialización de sistemas de bases de datos relacionales y relacionales de objetos . En marzo de 2015 se anunció que ganó el Premio Turing de la ACM de 2014. [7] En septiembre de 2015, ganó el Premio Commonwealth de 2015, elegido por los miembros del consejo de MassTLC. [14]
Stonebraker se incorporó a la Universidad de California, Berkeley , como profesor adjunto en 1971 y enseñó en el departamento de informática durante veintinueve años. Fue allí donde realizó su primer trabajo pionero sobre bases de datos relacionales.
En 1973, Stonebraker y su colega Eugene Wong comenzaron a investigar sistemas de bases de datos relacionales después de leer una serie de artículos fundamentales publicados por Edgar F. Codd sobre el modelo de datos relacionales . [15]
Su proyecto, conocido como Ingres (Sistema de recuperación y gráficos interactivos), [16] fue uno de los primeros sistemas (junto con System R de IBM ) en demostrar que era posible construir una implementación práctica y eficiente del modelo relacional. Varias ideas clave de INGRES todavía se utilizan ampliamente en sistemas relacionales, incluido el uso de árboles B , la replicación de copia primaria, el enfoque de reescritura de consultas para vistas y restricciones de integridad , y la idea de reglas/disparadores para la comprobación de integridad en un RDBMS. Además, se realizó mucho trabajo experimental que proporcionó información sobre cómo construir un sistema de bloqueo que pudiera proporcionar un rendimiento de transacción satisfactorio. [17]
A mediados de los años 70, el equipo de Stonebraker produjo, con la ayuda de un equipo rotativo de estudiantes programadores, un sistema de base de datos relacional utilizable. En aquel momento, Ingres se consideraba de "gama baja" en comparación con el System R de IBM, ya que funcionaba en máquinas de Digital Equipment Corporation basadas en Unix, en lugar de en los mainframes de IBM . [ cita requerida ]
Sin embargo, a principios de los años 1980, el rendimiento y las capacidades de estas máquinas de gama baja amenazaban seriamente el mercado de mainframes de IBM, y con la amenaza llegó la capacidad de Ingres de convertirse en un producto viable y "real" para una gran cantidad de aplicaciones. Ingres utilizó una variación de la licencia BSD por una tarifa nominal, y pronto varias empresas aprovecharon esto para crear versiones comerciales de Ingres. [ cita requerida ]
Entre ellos se encontraba Stonebraker, quien, junto con sus compañeros profesores de Berkeley Larry Rowe y Eugene Wong, ayudó a fundar Relational Technology, Inc. , posteriormente llamada Ingres Corporation. Posteriormente, vendida a Computer Associates , Ingres se restableció como una empresa independiente en 2005 y más tarde pasó a llamarse Actian . Otras empresas emergentes basadas en Ingres incluyen Sybase , fundada por Robert Epstein, un estudiante del proyecto, y Britton Lee, Inc. El código de Sybase se utilizó más tarde como base para Microsoft SQL Server . [18]
Después de fundar Relational Technology, Stonebraker y Rowe comenzaron un esfuerzo "post-Ingres" para abordar las limitaciones del modelo relacional. El nuevo proyecto se denominó POSTGRES (POST inGRES), [19] y fue diseñado para agregar soporte para tipos de datos complejos a los sistemas de bases de datos y mejorar el rendimiento de extremo a extremo de las aplicaciones intensivas en datos. Postgres proporcionó un modelo de programación relacional de objetos en el que los campos podían ser tipos de datos complejos y donde los usuarios podían registrar nuevos tipos, así como funciones escalares y agregadas sobre esos tipos. Postgres era extensible de varias otras maneras, lo que facilitaba a los programadores modificar o agregar elementos al optimizador, lenguaje de consulta, tiempo de ejecución y marcos de indexación. Estas características mejoraron tanto la programabilidad como el rendimiento de la base de datos, e hicieron posible impulsar grandes porciones de varias aplicaciones dentro de la base de datos, incluidos los sistemas de información geográfica y el procesamiento de series temporales . Esto tuvo el efecto de ampliar sustancialmente el mercado de bases de datos comerciales. [ cita requerida ]
Postgres también se ofrecía con una licencia similar a la de BSD, y el código forma la base del software libre PostgreSQL . Stonebraker también lideró un esfuerzo para comercializar el código, creando Illustra , que fue adquirido por Informix . PostgreSQL se ha utilizado como base para varias otras empresas emergentes, incluidas Aster Data Systems , EnterpriseDB y Greenplum . [ cita requerida ]
Informix adquirió Illustra en 1996 y Stonebraker se convirtió en el CTO de Informix, puesto que ocupó hasta septiembre de 2000. Informix integró el mapeo O–R y DataBlades de Illustra en el producto 7.x OnLine, lo que dio como resultado Informix Universal Server (IUS), o más generalmente, la Versión 9. [ cita requerida ]
Después del proyecto Postgres, Stonebraker inició el proyecto Mariposa [20] , que se convirtió en la base de Cohera Corporation. Mariposa construyó una base de datos federada sobre un modelo económico de comercio de recursos, en el que los datos distribuidos entre múltiples organizaciones podían integrarse y consultarse desde una única interfaz relacional, regida por políticas específicas de cada sitio que cobrarían por el procesamiento y el almacenamiento de datos. Estas políticas económicas permitieron que las ideas tradicionales de optimización de consultas se llevaran a cabo en sitios en competencia, y también sirvieron como base para el almacenamiento, la replicación y el movimiento de datos dentro de una federación.
La misión inicial de Cohera era comercializar Mariposa, pero finalmente se centró en una aplicación de gestión de catálogos entre empresas basada en el motor de integración de datos federados. La propiedad intelectual de Cohera fue adquirida por PeopleSoft en 2001 y se utilizó como base de la gestión de catálogos empresariales de PeopleSoft. A su vez, PeopleSoft fue adquirida por Oracle Corporation en 2004. [ cita requerida ]
Stonebraker se convirtió en profesor adjunto en el MIT en 2001, donde inició otra serie de proyectos de investigación y fundó varias empresas.
En el Proyecto Aurora, Stonebraker, junto con colegas de la Universidad Brandeis , la Universidad Brown y el MIT, se centraron en la gestión de datos para la transmisión de datos, utilizando un nuevo modelo de datos y lenguaje de consulta. A diferencia de los sistemas relacionales, que "extraen" datos y los procesan registro por registro, en Aurora, los datos se "envían" y llegan de forma asincrónica desde fuentes de datos externas (como ticks de acciones, canales de noticias o sensores). El resultado es en sí mismo un flujo de resultados (como promedios en ventanas) que se envían a los usuarios. [21]
Stonebraker cofundó StreamBase Systems en 2003 para comercializar la tecnología detrás de Aurora.
En el proyecto C-Store , iniciado en 2005, Stonebraker, junto con colegas de Brandeis, Brown, MIT y la Universidad de Massachusetts Boston , desarrolló un DBMS paralelo, sin uso compartido, orientado a columnas para el almacenamiento de datos. Al dividir y almacenar datos en columnas, C-Store puede realizar menos operaciones de E/S y obtener mejores índices de compresión que los sistemas de bases de datos convencionales que almacenan datos en filas. [22]
Stonebraker explicó que esto se debe a que hay elementos de datos similares uno al lado del otro: Nombre, Nombre, Nombre, Nombre vs. Nombre, Dirección, Código postal, Número de teléfono. En 2005, Stonebraker cofundó Vertica para comercializar la tecnología detrás de C-Store. [23]
En 2006, Stonebraker inició el proyecto Morpheus junto con investigadores de la Universidad de Florida. Morpheus es un sistema de integración de datos que se basa en una colección de "transformaciones" para mediar entre fuentes de datos. Cada transformación proporciona una interfaz de consulta a un sitio web o servicio en particular, y Morpheus permite buscar y componer múltiples transformaciones para proporcionar un nuevo servicio o una vista unificada de varios servicios.
En 2009, Stonebraker cofundó Goby, [24] una empresa de búsqueda local basada en ideas de Morfeo, para que la gente explorara nuevas cosas para hacer en su tiempo libre.
En 2007, junto con investigadores de la Universidad Brown , el MIT y la Universidad de Yale , Stonebraker inició el proyecto H-Store . H-Store es un sistema de procesamiento de transacciones en línea (OLTP) distribuido en memoria principal diseñado para proporcionar un alto rendimiento en cargas de trabajo de procesamiento de transacciones.
En 2009, Stonebraker cofundó y luego trabajó como asesor de VoltDB , una startup comercial basada en ideas del proyecto H-Store.
En 2008, junto con David DeWitt e investigadores de Brown, MIT, Portland State University , SLAC , la Universidad de Washington y la Universidad de Wisconsin-Madison , Stonebraker inició SciDB [25] [26], un DBMS de código abierto especialmente diseñado para aplicaciones de investigación científica. [27]
Fundó Paradigm4 junto con Marilyn Matz, quien se convirtió en directora ejecutiva. Paradigm4 desarrolló SciDB, que se utiliza principalmente en las ciencias biológicas y los mercados financieros. Novartis , Foundation Medicine y los Institutos Nacionales de Salud son algunos de los clientes de la empresa. [14] [28]
En 2010 y 2011, Stonebraker criticó el movimiento NoSQL . [29] [30] [31]
Stonebraker capacitó a más de 30 estudiantes, [2] entre ellos:
{{cite journal}}
: CS1 maint: multiple names: authors list (link)