stringtranslate.com

Michael Stonebraker

Michael Ralph Stonebraker (nacido el 11 de octubre de 1943 [6] ) es un informático especializado en sistemas de bases de datos . A través de una serie de prototipos académicos y nuevas empresas comerciales, la investigación y los productos de Stonebraker son fundamentales para muchas bases de datos relacionales . También es el fundador de muchas empresas de bases de datos, incluidas Ingres Corporation , Illustra , Paradigm4, StreamBase Systems , Tamr, Vertica y VoltDB , y se desempeñó como director técnico de Informix . Por sus contribuciones a la investigación de bases de datos, Stonebraker recibió el Premio Turing 2014 , a menudo descrito como "el Premio Nobel de la informática". [7]

La carrera de Stonebraker se puede dividir en dos fases: su tiempo en la Universidad de California, Berkeley, cuando se centró en sistemas de gestión de bases de datos relacionales como Ingres y Postgres , y, a partir de 2001, en el Instituto Tecnológico de Massachusetts (MIT), donde desarrolló más Nuevas técnicas de gestión de datos como C-Store , H-Store , SciDB y DBOS . [8] Stonebraker es actualmente profesor emérito en UC Berkeley y profesor adjunto en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT. [9] [10] También es conocido como editor del libro Readings in Database Systems .

Vida

Stonebraker creció en Milton, Nueva Hampshire . [11] Obtuvo su BSE en ingeniería eléctrica de la Universidad de Princeton en 1965, y su maestría y doctorado. de la Universidad de Michigan en 1967 y 1971 [12] respectivamente. Sus premios incluyen la Medalla IEEE John von Neumann y el primer Premio a la Innovación SIGMOD Edgar F. Codd . En 1994 fue admitido como miembro de la Association for Computing Machinery . [13] En 1997, fue elegido miembro de la Academia Nacional de Ingeniería para el desarrollo y comercialización de sistemas de bases de datos relacionales y relacionales de objetos. En marzo de 2015 se anunció que ganó el Premio ACM Turing 2014 . [7] En septiembre de 2015, ganó el Premio Commonwealth 2015, elegido por los miembros del consejo de MassTLC. [14]

Los años de Berkeley (1971-2000)

Stonebraker se incorporó a la Universidad de California, Berkeley, como profesor asistente en 1971 y enseñó en el departamento de informática durante veintinueve años. Fue allí donde realizó sus primeros trabajos pioneros sobre bases de datos relacionales.

Ingre

En 1973, Stonebraker y su colega Eugene Wong comenzaron a investigar sistemas de bases de datos relacionales después de leer una serie de artículos fundamentales publicados por Edgar F. Codd sobre el modelo de datos relacionales . [15]

Su proyecto, conocido como Ingres (Sistema de recuperación y gráficos interactivos), [16] fue uno de los primeros sistemas (junto con System R de IBM ) en demostrar que era posible construir una implementación práctica y eficiente del modelo relacional. Varias ideas clave de INGRES todavía se usan ampliamente en sistemas relacionales, incluido el uso de árboles B , replicación de copia primaria, el enfoque de reescritura de consultas para vistas y restricciones de integridad , y la idea de reglas/desencadenantes para la verificación de integridad en un RDBMS. Además, se realizó mucho trabajo experimental que proporcionó información sobre cómo construir un sistema de bloqueo que pudiera proporcionar un rendimiento de transacción satisfactorio. [17]

A mediados de la década de 1970, el equipo de Stonebraker produjo, utilizando un equipo rotativo de estudiantes programadores, un sistema de base de datos relacional utilizable. En ese momento, Ingres se consideraba de "gama baja" en comparación con el System R de IBM, ya que se ejecutaba en máquinas de Digital Equipment Corporation basadas en Unix , a diferencia de las " grandes computadoras centrales " de IBM . [ cita necesaria ]

Sin embargo, a principios de la década de 1980, el rendimiento y las capacidades de estas máquinas de gama baja amenazaban seriamente el mercado de mainframes de IBM, y con la amenaza vino la capacidad de Ingres de convertirse en un producto viable y "real" para un gran número de aplicaciones. Ingres utilizó una variación de la licencia BSD por una tarifa nominal, y pronto varias empresas aprovecharon esto para crear versiones comerciales de Ingres. [ cita necesaria ]

Entre ellos se encontraba Stonebraker, quien junto con sus compañeros profesores de Berkeley, Larry Rowe y Eugene Wong, ayudaron a fundar Relational Technology, Inc. , más tarde llamada Ingres Corporation. Posteriormente, vendida a Computer Associates , Ingres se restableció como empresa independiente en 2005 y posteriormente pasó a llamarse Actian . Otras nuevas empresas basadas en Ingres incluyen Sybase , fundada por Robert Epstein, un estudiante del proyecto, y Britton Lee, Inc. El código de Sybase se utilizó más tarde como base para Microsoft SQL Server . [18]

Postgres

Después de fundar Relational Technology, Stonebraker y Rowe comenzaron un esfuerzo "post-Ingres" para abordar las limitaciones del modelo relacional. El nuevo proyecto se denominó POSTGRES (POST inGRES) [19] y fue diseñado para agregar soporte para tipos de datos complejos a los sistemas de bases de datos y mejorar el rendimiento de un extremo a otro de las aplicaciones con uso intensivo de datos. Postgres proporcionó un modelo de programación relacional de objetos en el que los campos podían ser tipos de datos complejos y donde los usuarios podían registrar nuevos tipos, así como funciones escalares y agregadas sobre esos tipos. Postgres era extensible de muchas otras maneras, lo que facilitaba a los programadores modificar o agregar marcos de optimizador, lenguaje de consulta, tiempo de ejecución y indexación. Estas características mejoraron tanto la programabilidad como el rendimiento de la base de datos y permitieron insertar grandes porciones de una serie de aplicaciones dentro de la base de datos, incluidos los sistemas de información geográfica y el procesamiento de series de tiempo . Esto tuvo el efecto de ampliar sustancialmente el mercado de bases de datos comerciales. [ cita necesaria ]

Postgres también se ofreció utilizando una licencia similar a BSD y el código constituye la base del software gratuito PostgreSQL . Stonebraker también lideró un esfuerzo para comercializar el código, creando Illustra que fue comprada por Informix . PostgreSQL se ha utilizado como base para otras empresas emergentes, incluidas Aster Data Systems , EnterpriseDB y Greenplum . [ cita necesaria ]

Informix adquirió Illustra en 1996 y Stonebraker se convirtió en CTO de Informix, cargo que ocupó hasta septiembre de 2000. Informix integró el mapeo O–R y DataBlades de Illustra en el producto 7.x OnLine, lo que dio como resultado Informix Universal Server (IUS), o más en general, Versión 9. [ cita necesaria ]

Mariposa y Cohera

Después del proyecto Postgres, Stonebraker inició el proyecto Mariposa [20] que se convirtió en la base de Cohera Corporation. Mariposa construyó una base de datos federada sobre un modelo económico de comercio de recursos, en el que los datos distribuidos en múltiples organizaciones podían integrarse y consultarse desde una única interfaz relacional, regida por políticas específicas del sitio que cobrarían por el procesamiento y almacenamiento de datos. Estas políticas económicas permitieron que las ideas tradicionales de optimización de consultas se llevaran a cabo en sitios competidores y también sirvieron como base para el almacenamiento, la replicación y el movimiento de datos dentro de una federación.

La misión inicial de Cohera era comercializar Mariposa, pero finalmente se centró en una aplicación de gestión de catálogos de empresa a empresa en el motor central de integración de datos federados. La propiedad intelectual de Cohera fue adquirida por PeopleSoft en 2001 y utilizada como base para Enterprise Catalog Management de PeopleSoft. PeopleSoft, a su vez, fue comprada por Oracle Corporation en 2004. [ cita necesaria ]

Los años del MIT (2001-presente)

Stonebraker se convirtió en profesor adjunto en el MIT en 2001, donde inició otra serie de proyectos de investigación y fundó varias empresas.

Aurora y StreamBase

En el Proyecto Aurora, Stonebraker, junto con colegas de la Universidad Brandeis , la Universidad Brown y el MIT, se centraron en la gestión de datos para la transmisión de datos, utilizando un nuevo modelo de datos y lenguaje de consulta. A diferencia de los sistemas relacionales, que "extraen" datos y los procesan registro a registro, en Aurora, los datos se "empujan" y llegan de forma asincrónica desde fuentes de datos externas (como ticks de acciones, fuentes de noticias o sensores). un flujo de resultados (como promedios en ventanas) que se envían a los usuarios. [21]

Stonebraker cofundó StreamBase Systems en 2003 para comercializar la tecnología detrás de Aurora.

C-Store y Vertica

En el proyecto C-Store , iniciado en 2005, Stonebraker, junto con colegas de Brandeis, Brown, MIT y la Universidad de Massachusetts Boston , desarrollaron un DBMS paralelo, no compartido y orientado a columnas para el almacenamiento de datos. Al dividir y almacenar datos en columnas, C-Store puede realizar menos E/S y obtener mejores índices de compresión que los sistemas de bases de datos convencionales que almacenan datos en filas. [22]

Stonebraker explicó que se debe a que los elementos de datos similares están uno al lado del otro: Nombre, Nombre, Nombre, Nombre vs. Nombre, Dirección, Código postal, Número de teléfono. En 2005, Stonebraker cofundó Vertica para comercializar la tecnología detrás de C-Store. [23]

Morfeo y Gobio

En 2006, Stonebraker inició el proyecto Morpheus, junto con investigadores de la Universidad de Florida. Morpheus es un sistema de integración de datos que se basa en una colección de "transformaciones" para mediar entre fuentes de datos. Cada transformación proporciona una interfaz consultable para un sitio web o servicio en particular, y Morpheus hace posible buscar y componer múltiples transformaciones para proporcionar un nuevo servicio o una vista unificada de varios servicios.

En 2009, Stonebraker cofundó Goby, [24] una empresa de búsqueda local basada en ideas de Morfeo, para que la gente explorara nuevas cosas que hacer en su tiempo libre.

H-Store y VoltDB

En 2007, con investigadores de la Universidad de Brown , el MIT y la Universidad de Yale , Stonebraker inició el proyecto H-Store . H-Store es un sistema distribuido de procesamiento de transacciones en línea (OLTP) de memoria principal diseñado para proporcionar un rendimiento muy alto en cargas de trabajo de procesamiento de transacciones.

En 2009, Stonebraker cofundó y luego sirvió como asesor de VoltDB , una startup comercial basada en ideas del proyecto H-Store.

Ciencia DB

En 2008, junto con David DeWitt e investigadores de Brown, MIT, la Universidad Estatal de Portland , SLAC , la Universidad de Washington y la Universidad de Wisconsin-Madison , Stonebraker inició SciDB [25] [26] , un DBMS de código abierto especialmente diseñado para Aplicaciones de la investigación científica. [27]

Fundó Paradigm4 con Marilyn Matz, quien se convirtió en directora ejecutiva. Paradigm4 desarrolló SciDB, utilizado principalmente en ciencias biológicas y mercados financieros. Novartis , Foundation Medicine y los Institutos Nacionales de Salud son algunos de los clientes de la empresa. [14] [28]

No SQL

En 2010 y 2011, Stonebraker criticó el movimiento NoSQL . [29] [30] [31]

Estudiantes notables

Stonebraker capacitó a más de 30 estudiantes, [2] entre ellos:

Trabajos seleccionados

Referencias

  1. ^ ab "Disertaciones doctorales | EECS en UC Berkeley". www2.eecs.berkeley.edu .
  2. ^ ab Michael Stonebraker en el Proyecto de Genealogía de Matemáticas
  3. ^ "Agradable: o cómo era ser alumno de Mike" (PDF) .
  4. ^ Batalla, Leilani Marie (2017). "Técnicas de optimización basadas en el comportamiento para la exploración de datos escalables". Instituto de Tecnología de Massachusetts. hdl : 1721.1/111853 . Consultado el 27 de diciembre de 2023 .
  5. ^ "Michael Stonebraker - Ganador del premio AM Turing" . Consultado el 6 de febrero de 2018 .
  6. ^ "Colaboradores". Transacciones IEEE sobre sistemas, hombre y cibernética (4): 562–564. Septiembre de 1972. doi : 10.1109/TSMC.1972.4309174.
  7. ^ ab Conner-Simons, Adam (25 de marzo de 2015). "Michael Stonebraker gana el premio Turing de 1 millón de dólares". Noticias del MIT . Instituto de Tecnología de Massachusetts . Consultado el 25 de marzo de 2015 .
  8. ^ "El pionero de Postgres, Michael Stonebraker, promete cambiar la base de datos una vez más". www.theregister.com . Consultado el 27 de diciembre de 2023 .
  9. ^ "Michael Stonebraker". www2.eecs.berkeley.edu . Consultado el 16 de marzo de 2018 .
  10. ^ "Michael Stonebraker | MIT CSAIL". www.csail.mit.edu . Consultado el 16 de marzo de 2018 .
  11. ^ Historia oral de Michael Stonebraker; 23 de agosto de 2012. Consultado el 26 de agosto de 2018.
  12. ^ Stonebraker, Michael Ralph (1971). La reducción de modelos de Markov a gran escala para cadenas aleatorias (tesis doctoral). Universidad de Michigan . OCLC  634008426. ProQuest  302585708.
  13. ^ "Michael Ralph Stonebraker - página de perfil del autor de ACM" . Consultado el 27 de julio de 2011 .
  14. ^ ab Geller, Jessica. "El jefe de PTC, Heppelman, nombrado director ejecutivo del año por el consejo tecnológico de Massachusetts". betaBoston. El Boston Globe. 16 de septiembre de 2015 Archivado el 7 de enero de 2016 en Wayback Machine.
  15. ^ Bacalao, EF (1970). "Un modelo relacional de datos para grandes bancos de datos compartidos" (PDF) . Comunicaciones de la ACM . 13 (6): 377–387. doi :10.1145/362384.362685. S2CID  207549016.
  16. ^ Stonebraker, M.; Celebrado, G.; Wong, E.; Kreps, P. (1976). "El diseño e implementación de INGRES". Transacciones ACM en sistemas de bases de datos . 1 (3): 189. CiteSeerX 10.1.1.109.957 . doi :10.1145/320473.320476. S2CID  1514658. 
  17. ^ "Raíces relacionales". José Hellerstein. 1998 . Consultado el 24 de noviembre de 2009 .
  18. ^ "Descripción general de la arquitectura DBMS y motivación". José Hellerstein. 1998 . Consultado el 24 de noviembre de 2009 .
  19. ^ Stonebraker, M.; Rowe, Luisiana (1986). "El diseño de POSTGRES". Registro ACM SIGMOD . 15 (2): 340. doi : 10.1145/16856.16888 .
  20. ^ Stonebraker, M.; Aoki, PM; Litwin, W.; Pfeffer, A.; Sah, A.; Sidell, J.; Staelin, C.; Yu, A. (1996). "Mariposa: un sistema de base de datos distribuida de área amplia". The VLDB Journal, la revista internacional sobre bases de datos muy grandes . 5 : 48–63. CiteSeerX 10.1.1.68.5480 . doi :10.1007/s007780050015. S2CID  5062284. 
  21. ^ Abadi, DJ; Carney, D.; Etintemel, U.; Cherniack, M.; Transmitir, C.; Lee, S.; Stonebraker, M.; Tatbul, N.; Zdonik, S. (2003). "Aurora: un nuevo modelo y arquitectura para la gestión del flujo de datos". The VLDB Journal, la revista internacional sobre bases de datos muy grandes . 12 (2): 120. CiteSeerX 10.1.1.6.1187 . doi :10.1007/s00778-003-0095-z. S2CID  8101432. 
  22. ^ (Título de la edición impresa: El pionero de las bases de datos reconsidera cómo se organizan los datos. Charles Babcock (21 de febrero de 2008). "El pionero de las bases de datos reconsidera la mejor manera de organizar los datos". InformationWeek .
  23. ^ "La base de datos analítica de Vertica: C-Store 7 años después" (PDF)" (PDF) . VLDB.org . 28 de agosto de 2012.
  24. ^ Gobio.
  25. ^ Marrón, PG (2010). "Descripción general de sciDB". Actas de la conferencia internacional de 2010 sobre Gestión de datos - SIGMOD '10 . págs. 963–968. doi :10.1145/1807167.1807271. ISBN 9781450300322. S2CID  14544985.
  26. ^ Stonebraker, M.; Marrón, P.; Poliakov, A.; Raman, S. (2011). "La arquitectura de SciDB". Gestión de Bases de Datos Científicas y Estadísticas . Apuntes de conferencias sobre informática. vol. 6809, págs. 1-16. doi :10.1007/978-3-642-22351-8_1. ISBN 978-3-642-22350-1.
  27. ^ "SciDB: papá relacional responde a Google, Hadoop, NoSQL". El registro . 2010-09-13 . Consultado el 11 de enero de 2012 .
  28. ^ Alspach, Kyle. "Dinero nuevo: el alumno de MassChallenge obtiene una inversión en fondos para dormitorios; Drone Co. recauda una ronda inicial". BostInno. 30 de noviembre de 2015 Archivado el 7 de febrero de 2016 en Wayback Machine.
  29. ^ Stonebraker, M. (2010). "Bases de datos SQL frente a bases de datos NoSQL". Comunicaciones de la ACM . 53 (4): 10–11. doi :10.1145/1721654.1721659. S2CID  13959501.
  30. ^ Stonebraker, M. (2011). "Stonebraker sobre NoSQL y empresas". Comunicaciones de la ACM . 54 (8): 10–11. doi :10.1145/1978542.1978546. S2CID  36572502.
  31. ^ Stonebraker, M.; Abadi, D.; Dewitt, DJ; Madden, S.; Paulson, E.; Pavlo, A.; Rasin, A. (2010). "MapReduce y DBMS paralelos". Comunicaciones de la ACM . 53 : 64–71. doi :10.1145/1629175.1629197. S2CID  61484899.

enlaces externos