Michael Ralph Stonebraker (nacido el 11 de octubre de 1943 [6] ) es un informático especializado en sistemas de bases de datos . A través de una serie de prototipos académicos y nuevas empresas comerciales, la investigación y los productos de Stonebraker son fundamentales para muchas bases de datos relacionales . También es el fundador de muchas empresas de bases de datos, incluidas Ingres Corporation , Illustra , Paradigm4, StreamBase Systems , Tamr, Vertica y VoltDB , y se desempeñó como director técnico de Informix . Por sus contribuciones a la investigación de bases de datos, Stonebraker recibió el Premio Turing 2014 , a menudo descrito como "el Premio Nobel de la informática". [7]
La carrera de Stonebraker se puede dividir en dos fases: su tiempo en la Universidad de California, Berkeley, cuando se centró en sistemas de gestión de bases de datos relacionales como Ingres y Postgres , y, a partir de 2001, en el Instituto Tecnológico de Massachusetts (MIT), donde desarrolló más Nuevas técnicas de gestión de datos como C-Store , H-Store , SciDB y DBOS . [8] Stonebraker es actualmente profesor emérito en UC Berkeley y profesor adjunto en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT. [9] [10] También es conocido como editor del libro Readings in Database Systems .
Stonebraker creció en Milton, Nueva Hampshire . [11] Obtuvo su BSE en ingeniería eléctrica de la Universidad de Princeton en 1965, y su maestría y doctorado. de la Universidad de Michigan en 1967 y 1971 [12] respectivamente. Sus premios incluyen la Medalla IEEE John von Neumann y el primer Premio a la Innovación SIGMOD Edgar F. Codd . En 1994 fue admitido como miembro de la Association for Computing Machinery . [13] En 1997, fue elegido miembro de la Academia Nacional de Ingeniería para el desarrollo y comercialización de sistemas de bases de datos relacionales y relacionales de objetos. En marzo de 2015 se anunció que ganó el Premio ACM Turing 2014 . [7] En septiembre de 2015, ganó el Premio Commonwealth 2015, elegido por los miembros del consejo de MassTLC. [14]
Stonebraker se incorporó a la Universidad de California, Berkeley, como profesor asistente en 1971 y enseñó en el departamento de informática durante veintinueve años. Fue allí donde realizó sus primeros trabajos pioneros sobre bases de datos relacionales.
En 1973, Stonebraker y su colega Eugene Wong comenzaron a investigar sistemas de bases de datos relacionales después de leer una serie de artículos fundamentales publicados por Edgar F. Codd sobre el modelo de datos relacionales . [15]
Su proyecto, conocido como Ingres (Sistema de recuperación y gráficos interactivos), [16] fue uno de los primeros sistemas (junto con System R de IBM ) en demostrar que era posible construir una implementación práctica y eficiente del modelo relacional. Varias ideas clave de INGRES todavía se usan ampliamente en sistemas relacionales, incluido el uso de árboles B , replicación de copia primaria, el enfoque de reescritura de consultas para vistas y restricciones de integridad , y la idea de reglas/desencadenantes para la verificación de integridad en un RDBMS. Además, se realizó mucho trabajo experimental que proporcionó información sobre cómo construir un sistema de bloqueo que pudiera proporcionar un rendimiento de transacción satisfactorio. [17]
A mediados de la década de 1970, el equipo de Stonebraker produjo, utilizando un equipo rotativo de estudiantes programadores, un sistema de base de datos relacional utilizable. En ese momento, Ingres se consideraba de "gama baja" en comparación con el System R de IBM, ya que se ejecutaba en máquinas de Digital Equipment Corporation basadas en Unix , a diferencia de las " grandes computadoras centrales " de IBM . [ cita necesaria ]
Sin embargo, a principios de la década de 1980, el rendimiento y las capacidades de estas máquinas de gama baja amenazaban seriamente el mercado de mainframes de IBM, y con la amenaza vino la capacidad de Ingres de convertirse en un producto viable y "real" para un gran número de aplicaciones. Ingres utilizó una variación de la licencia BSD por una tarifa nominal, y pronto varias empresas aprovecharon esto para crear versiones comerciales de Ingres. [ cita necesaria ]
Entre ellos se encontraba Stonebraker, quien junto con sus compañeros profesores de Berkeley, Larry Rowe y Eugene Wong, ayudaron a fundar Relational Technology, Inc. , más tarde llamada Ingres Corporation. Posteriormente, vendida a Computer Associates , Ingres se restableció como empresa independiente en 2005 y posteriormente pasó a llamarse Actian . Otras nuevas empresas basadas en Ingres incluyen Sybase , fundada por Robert Epstein, un estudiante del proyecto, y Britton Lee, Inc. El código de Sybase se utilizó más tarde como base para Microsoft SQL Server . [18]
Después de fundar Relational Technology, Stonebraker y Rowe comenzaron un esfuerzo "post-Ingres" para abordar las limitaciones del modelo relacional. El nuevo proyecto se denominó POSTGRES (POST inGRES) [19] y fue diseñado para agregar soporte para tipos de datos complejos a los sistemas de bases de datos y mejorar el rendimiento de un extremo a otro de las aplicaciones con uso intensivo de datos. Postgres proporcionó un modelo de programación relacional de objetos en el que los campos podían ser tipos de datos complejos y donde los usuarios podían registrar nuevos tipos, así como funciones escalares y agregadas sobre esos tipos. Postgres era extensible de muchas otras maneras, lo que facilitaba a los programadores modificar o agregar marcos de optimizador, lenguaje de consulta, tiempo de ejecución y indexación. Estas características mejoraron tanto la programabilidad como el rendimiento de la base de datos y permitieron insertar grandes porciones de una serie de aplicaciones dentro de la base de datos, incluidos los sistemas de información geográfica y el procesamiento de series de tiempo . Esto tuvo el efecto de ampliar sustancialmente el mercado de bases de datos comerciales. [ cita necesaria ]
Postgres también se ofreció utilizando una licencia similar a BSD y el código constituye la base del software gratuito PostgreSQL . Stonebraker también lideró un esfuerzo para comercializar el código, creando Illustra que fue comprada por Informix . PostgreSQL se ha utilizado como base para otras empresas emergentes, incluidas Aster Data Systems , EnterpriseDB y Greenplum . [ cita necesaria ]
Informix adquirió Illustra en 1996 y Stonebraker se convirtió en CTO de Informix, cargo que ocupó hasta septiembre de 2000. Informix integró el mapeo O–R y DataBlades de Illustra en el producto 7.x OnLine, lo que dio como resultado Informix Universal Server (IUS), o más en general, Versión 9. [ cita necesaria ]
Después del proyecto Postgres, Stonebraker inició el proyecto Mariposa [20] que se convirtió en la base de Cohera Corporation. Mariposa construyó una base de datos federada sobre un modelo económico de comercio de recursos, en el que los datos distribuidos en múltiples organizaciones podían integrarse y consultarse desde una única interfaz relacional, regida por políticas específicas del sitio que cobrarían por el procesamiento y almacenamiento de datos. Estas políticas económicas permitieron que las ideas tradicionales de optimización de consultas se llevaran a cabo en sitios competidores y también sirvieron como base para el almacenamiento, la replicación y el movimiento de datos dentro de una federación.
La misión inicial de Cohera era comercializar Mariposa, pero finalmente se centró en una aplicación de gestión de catálogos de empresa a empresa en el motor central de integración de datos federados. La propiedad intelectual de Cohera fue adquirida por PeopleSoft en 2001 y utilizada como base para Enterprise Catalog Management de PeopleSoft. PeopleSoft, a su vez, fue comprada por Oracle Corporation en 2004. [ cita necesaria ]
Stonebraker se convirtió en profesor adjunto en el MIT en 2001, donde inició otra serie de proyectos de investigación y fundó varias empresas.
En el Proyecto Aurora, Stonebraker, junto con colegas de la Universidad Brandeis , la Universidad Brown y el MIT, se centraron en la gestión de datos para la transmisión de datos, utilizando un nuevo modelo de datos y lenguaje de consulta. A diferencia de los sistemas relacionales, que "extraen" datos y los procesan registro a registro, en Aurora, los datos se "empujan" y llegan de forma asincrónica desde fuentes de datos externas (como ticks de acciones, fuentes de noticias o sensores). un flujo de resultados (como promedios en ventanas) que se envían a los usuarios. [21]
Stonebraker cofundó StreamBase Systems en 2003 para comercializar la tecnología detrás de Aurora.
En el proyecto C-Store , iniciado en 2005, Stonebraker, junto con colegas de Brandeis, Brown, MIT y la Universidad de Massachusetts Boston , desarrollaron un DBMS paralelo, no compartido y orientado a columnas para el almacenamiento de datos. Al dividir y almacenar datos en columnas, C-Store puede realizar menos E/S y obtener mejores índices de compresión que los sistemas de bases de datos convencionales que almacenan datos en filas. [22]
Stonebraker explicó que se debe a que los elementos de datos similares están uno al lado del otro: Nombre, Nombre, Nombre, Nombre vs. Nombre, Dirección, Código postal, Número de teléfono. En 2005, Stonebraker cofundó Vertica para comercializar la tecnología detrás de C-Store. [23]
En 2006, Stonebraker inició el proyecto Morpheus, junto con investigadores de la Universidad de Florida. Morpheus es un sistema de integración de datos que se basa en una colección de "transformaciones" para mediar entre fuentes de datos. Cada transformación proporciona una interfaz consultable para un sitio web o servicio en particular, y Morpheus hace posible buscar y componer múltiples transformaciones para proporcionar un nuevo servicio o una vista unificada de varios servicios.
En 2009, Stonebraker cofundó Goby, [24] una empresa de búsqueda local basada en ideas de Morfeo, para que la gente explorara nuevas cosas que hacer en su tiempo libre.
En 2007, con investigadores de la Universidad de Brown , el MIT y la Universidad de Yale , Stonebraker inició el proyecto H-Store . H-Store es un sistema distribuido de procesamiento de transacciones en línea (OLTP) de memoria principal diseñado para proporcionar un rendimiento muy alto en cargas de trabajo de procesamiento de transacciones.
En 2009, Stonebraker cofundó y luego sirvió como asesor de VoltDB , una startup comercial basada en ideas del proyecto H-Store.
En 2008, junto con David DeWitt e investigadores de Brown, MIT, la Universidad Estatal de Portland , SLAC , la Universidad de Washington y la Universidad de Wisconsin-Madison , Stonebraker inició SciDB [25] [26] , un DBMS de código abierto especialmente diseñado para Aplicaciones de la investigación científica. [27]
Fundó Paradigm4 con Marilyn Matz, quien se convirtió en directora ejecutiva. Paradigm4 desarrolló SciDB, utilizado principalmente en ciencias biológicas y mercados financieros. Novartis , Foundation Medicine y los Institutos Nacionales de Salud son algunos de los clientes de la empresa. [14] [28]
En 2010 y 2011, Stonebraker criticó el movimiento NoSQL . [29] [30] [31]
Stonebraker capacitó a más de 30 estudiantes, [2] entre ellos:
{{cite journal}}
: Mantenimiento CS1: varios nombres: lista de autores ( enlace )