stringtranslate.com

Michael Stonebraker

Michael Ralph Stonebraker (nacido el 11 de octubre de 1943 [6] ) es un informático estadounidense especializado en sistemas de bases de datos . A través de una serie de prototipos académicos y nuevas empresas comerciales, la investigación y los productos de Stonebraker son fundamentales para muchas bases de datos relacionales . También es el fundador de muchas empresas de bases de datos, incluidas Ingres Corporation , Illustra , Paradigm4, StreamBase Systems , Tamr, Vertica y VoltDB , y se desempeñó como director técnico de Informix . Por sus contribuciones a la investigación de bases de datos, Stonebraker recibió el Premio Turing 2014 , a menudo descrito como "el Premio Nobel de la informática". [7]

La carrera de Stonebraker se puede dividir en dos fases: su tiempo en la Universidad de California, Berkeley, cuando se centró en sistemas de gestión de bases de datos relacionales como Ingres y Postgres , y, a partir de 2001, en el Instituto Tecnológico de Massachusetts (MIT), donde desarrolló técnicas de gestión de datos más novedosas como C-Store , H-Store , SciDB y DBOS . [8] Stonebraker es actualmente profesor emérito en UC Berkeley y profesor adjunto en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT. [9] [10] También es conocido como editor del libro Readings in Database Systems .

Vida

Stonebraker creció en Milton, New Hampshire . [11] Obtuvo su licenciatura en ingeniería eléctrica en la Universidad de Princeton en 1965, y su maestría y doctorado en la Universidad de Michigan en 1967 y 1971 [12] respectivamente. Sus premios incluyen la Medalla John von Neumann del IEEE y el primer Premio a la Innovación Edgar F. Codd de SIGMOD . En 1994 fue incluido como miembro de la Association for Computing Machinery . [13] En 1997, fue elegido miembro de la Academia Nacional de Ingeniería por el desarrollo y comercialización de sistemas de bases de datos relacionales y relacionales de objetos . En marzo de 2015 se anunció que ganó el Premio Turing de la ACM de 2014. [7] En septiembre de 2015, ganó el Premio Commonwealth de 2015, elegido por los miembros del consejo de MassTLC. [14]

Los años en Berkeley (1971-2000)

Stonebraker se incorporó a la Universidad de California, Berkeley , como profesor adjunto en 1971 y enseñó en el departamento de informática durante veintinueve años. Fue allí donde realizó su primer trabajo pionero sobre bases de datos relacionales.

Ingreso

En 1973, Stonebraker y su colega Eugene Wong comenzaron a investigar sistemas de bases de datos relacionales después de leer una serie de artículos fundamentales publicados por Edgar F. Codd sobre el modelo de datos relacionales . [15]

Su proyecto, conocido como Ingres (Sistema de recuperación y gráficos interactivos), [16] fue uno de los primeros sistemas (junto con System R de IBM ) en demostrar que era posible construir una implementación práctica y eficiente del modelo relacional. Varias ideas clave de INGRES todavía se utilizan ampliamente en sistemas relacionales, incluido el uso de árboles B , la replicación de copia primaria, el enfoque de reescritura de consultas para vistas y restricciones de integridad , y la idea de reglas/disparadores para la comprobación de integridad en un RDBMS. Además, se realizó mucho trabajo experimental que proporcionó información sobre cómo construir un sistema de bloqueo que pudiera proporcionar un rendimiento de transacción satisfactorio. [17]

A mediados de los años 70, el equipo de Stonebraker produjo, con la ayuda de un equipo rotativo de estudiantes programadores, un sistema de base de datos relacional utilizable. En aquel momento, Ingres se consideraba de "gama baja" en comparación con el System R de IBM, ya que funcionaba en máquinas de Digital Equipment Corporation basadas en Unix, en lugar de en los mainframes de IBM . [ cita requerida ]

Sin embargo, a principios de los años 1980, el rendimiento y las capacidades de estas máquinas de gama baja amenazaban seriamente el mercado de mainframes de IBM, y con la amenaza llegó la capacidad de Ingres de convertirse en un producto viable y "real" para una gran cantidad de aplicaciones. Ingres utilizó una variación de la licencia BSD por una tarifa nominal, y pronto varias empresas aprovecharon esto para crear versiones comerciales de Ingres. [ cita requerida ]

Entre ellos se encontraba Stonebraker, quien, junto con sus compañeros profesores de Berkeley Larry Rowe y Eugene Wong, ayudó a fundar Relational Technology, Inc. , posteriormente llamada Ingres Corporation. Posteriormente, vendida a Computer Associates , Ingres se restableció como una empresa independiente en 2005 y más tarde pasó a llamarse Actian . Otras empresas emergentes basadas en Ingres incluyen Sybase , fundada por Robert Epstein, un estudiante del proyecto, y Britton Lee, Inc. El código de Sybase se utilizó más tarde como base para Microsoft SQL Server . [18]

Postgres

Después de fundar Relational Technology, Stonebraker y Rowe comenzaron un esfuerzo "post-Ingres" para abordar las limitaciones del modelo relacional. El nuevo proyecto se denominó POSTGRES (POST inGRES), [19] y fue diseñado para agregar soporte para tipos de datos complejos a los sistemas de bases de datos y mejorar el rendimiento de extremo a extremo de las aplicaciones intensivas en datos. Postgres proporcionó un modelo de programación relacional de objetos en el que los campos podían ser tipos de datos complejos y donde los usuarios podían registrar nuevos tipos, así como funciones escalares y agregadas sobre esos tipos. Postgres era extensible de varias otras maneras, lo que facilitaba a los programadores modificar o agregar elementos al optimizador, lenguaje de consulta, tiempo de ejecución y marcos de indexación. Estas características mejoraron tanto la programabilidad como el rendimiento de la base de datos, e hicieron posible impulsar grandes porciones de varias aplicaciones dentro de la base de datos, incluidos los sistemas de información geográfica y el procesamiento de series temporales . Esto tuvo el efecto de ampliar sustancialmente el mercado de bases de datos comerciales. [ cita requerida ]

Postgres también se ofrecía con una licencia similar a la de BSD, y el código forma la base del software libre PostgreSQL . Stonebraker también lideró un esfuerzo para comercializar el código, creando Illustra , que fue adquirido por Informix . PostgreSQL se ha utilizado como base para varias otras empresas emergentes, incluidas Aster Data Systems , EnterpriseDB y Greenplum . [ cita requerida ]

Informix adquirió Illustra en 1996 y Stonebraker se convirtió en el CTO de Informix, puesto que ocupó hasta septiembre de 2000. Informix integró el mapeo O–R y DataBlades de Illustra en el producto 7.x OnLine, lo que dio como resultado Informix Universal Server (IUS), o más generalmente, la Versión 9. [ cita requerida ]

Mariposa y Cohera

Después del proyecto Postgres, Stonebraker inició el proyecto Mariposa [20] , que se convirtió en la base de Cohera Corporation. Mariposa construyó una base de datos federada sobre un modelo económico de comercio de recursos, en el que los datos distribuidos entre múltiples organizaciones podían integrarse y consultarse desde una única interfaz relacional, regida por políticas específicas de cada sitio que cobrarían por el procesamiento y el almacenamiento de datos. Estas políticas económicas permitieron que las ideas tradicionales de optimización de consultas se llevaran a cabo en sitios en competencia, y también sirvieron como base para el almacenamiento, la replicación y el movimiento de datos dentro de una federación.

La misión inicial de Cohera era comercializar Mariposa, pero finalmente se centró en una aplicación de gestión de catálogos entre empresas basada en el motor de integración de datos federados. La propiedad intelectual de Cohera fue adquirida por PeopleSoft en 2001 y se utilizó como base de la gestión de catálogos empresariales de PeopleSoft. A su vez, PeopleSoft fue adquirida por Oracle Corporation en 2004. [ cita requerida ]

Los años en el MIT (2001-actualidad)

Stonebraker se convirtió en profesor adjunto en el MIT en 2001, donde inició otra serie de proyectos de investigación y fundó varias empresas.

Aurora y StreamBase

En el Proyecto Aurora, Stonebraker, junto con colegas de la Universidad Brandeis , la Universidad Brown y el MIT, se centraron en la gestión de datos para la transmisión de datos, utilizando un nuevo modelo de datos y lenguaje de consulta. A diferencia de los sistemas relacionales, que "extraen" datos y los procesan registro por registro, en Aurora, los datos se "envían" y llegan de forma asincrónica desde fuentes de datos externas (como ticks de acciones, canales de noticias o sensores). El resultado es en sí mismo un flujo de resultados (como promedios en ventanas) que se envían a los usuarios. [21]

Stonebraker cofundó StreamBase Systems en 2003 para comercializar la tecnología detrás de Aurora.

C-Store y Vertica

En el proyecto C-Store , iniciado en 2005, Stonebraker, junto con colegas de Brandeis, Brown, MIT y la Universidad de Massachusetts Boston , desarrolló un DBMS paralelo, sin uso compartido, orientado a columnas para el almacenamiento de datos. Al dividir y almacenar datos en columnas, C-Store puede realizar menos operaciones de E/S y obtener mejores índices de compresión que los sistemas de bases de datos convencionales que almacenan datos en filas. [22]

Stonebraker explicó que esto se debe a que hay elementos de datos similares uno al lado del otro: Nombre, Nombre, Nombre, Nombre vs. Nombre, Dirección, Código postal, Número de teléfono. En 2005, Stonebraker cofundó Vertica para comercializar la tecnología detrás de C-Store. [23]

Morfeo y Gobio

En 2006, Stonebraker inició el proyecto Morpheus junto con investigadores de la Universidad de Florida. Morpheus es un sistema de integración de datos que se basa en una colección de "transformaciones" para mediar entre fuentes de datos. Cada transformación proporciona una interfaz de consulta a un sitio web o servicio en particular, y Morpheus permite buscar y componer múltiples transformaciones para proporcionar un nuevo servicio o una vista unificada de varios servicios.

En 2009, Stonebraker cofundó Goby, [24] una empresa de búsqueda local basada en ideas de Morfeo, para que la gente explorara nuevas cosas para hacer en su tiempo libre.

H-Store y VoltDB

En 2007, junto con investigadores de la Universidad Brown , el MIT y la Universidad de Yale , Stonebraker inició el proyecto H-Store . H-Store es un sistema de procesamiento de transacciones en línea (OLTP) distribuido en memoria principal diseñado para proporcionar un alto rendimiento en cargas de trabajo de procesamiento de transacciones.

En 2009, Stonebraker cofundó y luego trabajó como asesor de VoltDB , una startup comercial basada en ideas del proyecto H-Store.

Base de datos científica

En 2008, junto con David DeWitt e investigadores de Brown, MIT, Portland State University , SLAC , la Universidad de Washington y la Universidad de Wisconsin-Madison , Stonebraker inició SciDB [25] [26], un DBMS de código abierto especialmente diseñado para aplicaciones de investigación científica. [27]

Fundó Paradigm4 junto con Marilyn Matz, quien se convirtió en directora ejecutiva. Paradigm4 desarrolló SciDB, que se utiliza principalmente en las ciencias biológicas y los mercados financieros. Novartis , Foundation Medicine y los Institutos Nacionales de Salud son algunos de los clientes de la empresa. [14] [28]

No SQL

En 2010 y 2011, Stonebraker criticó el movimiento NoSQL . [29] [30] [31]

Estudiantes notables

Stonebraker capacitó a más de 30 estudiantes, [2] entre ellos:

Obras seleccionadas

Referencias

  1. ^ ab "Tesis doctorales | EECS en UC Berkeley". www2.eecs.berkeley.edu .
  2. ^ de Michael Stonebraker en el Proyecto de Genealogía Matemática
  3. ^ "Nice: o cómo fue ser alumno de Mike" (PDF) .
  4. ^ Battle, Leilani Marie (2017). "Técnicas de optimización basadas en el comportamiento para la exploración de datos escalables". Instituto Tecnológico de Massachusetts. hdl :1721.1/111853 . Consultado el 27 de diciembre de 2023 .
  5. ^ "Michael Stonebraker - Ganador del premio AM Turing" . Consultado el 6 de febrero de 2018 .
  6. ^ "Colaboradores". IEEE Transactions on Systems, Man, and Cybernetics (4): 562–564. Septiembre de 1972. doi :10.1109/TSMC.1972.4309174.
  7. ^ ab Conner-Simons, Adam (25 de marzo de 2015). «Michael Stonebraker gana el premio Turing de un millón de dólares». MIT News . Instituto Tecnológico de Massachusetts . Consultado el 25 de marzo de 2015 .
  8. ^ "El pionero de Postgres, Michael Stonebraker, promete revolucionar las bases de datos una vez más". www.theregister.com . Consultado el 27 de diciembre de 2023 .
  9. ^ "Michael Stonebraker". www2.eecs.berkeley.edu . Consultado el 16 de marzo de 2018 .
  10. ^ "Michael Stonebraker | MIT CSAIL". www.csail.mit.edu . Consultado el 16 de marzo de 2018 .
  11. ^ Historia oral de Michael Stonebraker; 23 de agosto de 2012. Consultado el 26 de agosto de 2018.
  12. ^ Stonebraker, Michael Ralph (1971). La reducción de modelos de Markov a gran escala para cadenas aleatorias (tesis doctoral). Universidad de Michigan . OCLC  634008426. ProQuest  302585708.
  13. ^ "Michael Ralph Stonebraker - Página de perfil del autor de ACM" . Consultado el 27 de julio de 2011 .
  14. ^ ab Geller, Jessica. "El director ejecutivo de PTC, Heppelman, nombrado director ejecutivo del año por el consejo tecnológico de Massachusetts". betaBoston. The Boston Globe. 16 de septiembre de 2015. Archivado el 7 de enero de 2016 en Wayback Machine.
  15. ^ Codd, EF (1970). "Un modelo relacional de datos para grandes bancos de datos compartidos" (PDF) . Comunicaciones de la ACM . 13 (6): 377–387. doi :10.1145/362384.362685. S2CID  207549016.
  16. ^ Stonebraker, M.; Held, G.; Wong, E.; Kreps, P. (1976). "El diseño y la implementación de INGRES". ACM Transactions on Database Systems . 1 (3): 189. CiteSeerX 10.1.1.109.957 . doi :10.1145/320473.320476. S2CID  1514658. 
  17. ^ "Raíces relacionales". Joseph Hellerstein. 1998. Consultado el 24 de noviembre de 2009 .
  18. ^ "Motivación y descripción general de la arquitectura de DBMS". Joseph Hellerstein. 1998. Consultado el 24 de noviembre de 2009 .
  19. ^ Stonebraker, M.; Rowe, LA (1986). "El diseño de POSTGRES". ACM SIGMOD Record . 15 (2): 340. doi : 10.1145/16856.16888 .
  20. ^ Stonebraker, M.; Aoki, PM; Litwin, W.; Pfeffer, A.; Sah, A.; Sidell, J.; Staelin, C.; Yu, A. (1996). "Mariposa: Un sistema de base de datos distribuida de área amplia". The VLDB Journal, la revista internacional sobre bases de datos muy grandes . 5 : 48–63. CiteSeerX 10.1.1.68.5480 . doi :10.1007/s007780050015. S2CID  5062284. 
  21. ^ Abadi, DJ; Carney, D.; Etintemel, U.; Cherniack, M.; Convey, C.; Lee, S.; Stonebraker, M.; Tatbul, N.; Zdonik, S. (2003). "Aurora: Un nuevo modelo y arquitectura para la gestión de flujos de datos". The VLDB Journal, la revista internacional sobre bases de datos muy grandes . 12 (2): 120. CiteSeerX 10.1.1.6.1187 . doi :10.1007/s00778-003-0095-z. S2CID  8101432. 
  22. ^ (Título de la edición impresa: Un pionero de las bases de datos replantea cómo se organizan los datos. Charles Babcock (21 de febrero de 2008). "Un pionero de las bases de datos replantea la mejor manera de organizar los datos". InformationWeek .
  23. ^ "La base de datos analítica de Vertica: C-Store 7 años después" (PDF)" (PDF) . VLDB.org . 28 de agosto de 2012.
  24. ^ Gobio.
  25. ^ Brown, PG (2010). "Descripción general de sciDB". Actas de la conferencia internacional de 2010 sobre gestión de datos - SIGMOD '10 . págs. 963–968. doi :10.1145/1807167.1807271. ISBN 9781450300322.S2CID14544985  .​
  26. ^ Stonebraker, M.; Brown, P.; Poliakov, A.; Raman, S. (2011). "La arquitectura de SciDB". Gestión de bases de datos científicas y estadísticas . Apuntes de clase en informática. Vol. 6809. págs. 1–16. doi :10.1007/978-3-642-22351-8_1. ISBN 978-3-642-22350-1.
  27. ^ "SciDB: el padre relacional responde a Google, Hadoop y NoSQL". The Register . 13 de septiembre de 2010 . Consultado el 11 de enero de 2012 .
  28. ^ Alspach, Kyle. "Nuevo dinero: un ex alumno de MassChallenge obtiene una inversión en un fondo para dormitorios; Drone Co. recauda una ronda de capital semilla". BostInno. 30 de noviembre de 2015 Archivado el 7 de febrero de 2016 en Wayback Machine.
  29. ^ Stonebraker, M. (2010). "Bases de datos SQL frente a bases de datos NoSQL". Comunicaciones de la ACM . 53 (4): 10–11. doi :10.1145/1721654.1721659. S2CID  13959501.
  30. ^ Stonebraker, M. (2011). "Stonebraker sobre NoSQL y empresas". Comunicaciones de la ACM . 54 (8): 10–11. doi :10.1145/1978542.1978546. S2CID  36572502.
  31. ^ Stonebraker, M.; Abadi, D.; Dewitt, DJ; Madden, S.; Paulson, E.; Pavlo, A.; Rasin, A. (2010). "MapReduce y DBMS paralelos". Comunicaciones de la ACM . 53 : 64–71. doi :10.1145/1629175.1629197. S2CID  61484899.

Enlaces externos