Google Brain fue un equipo de investigación de inteligencia artificial de aprendizaje profundo que sirvió como la única rama de IA de Google antes de ser incorporada bajo el paraguas más nuevo de Google AI , una división de investigación de Google dedicada a la inteligencia artificial. Formada en 2011, combinó la investigación de aprendizaje automático de final abierto con sistemas de información y recursos informáticos a gran escala. [1] Creó herramientas como TensorFlow , que permiten que el público utilice redes neuronales, y múltiples proyectos internos de investigación en IA, [2] y tenía como objetivo crear oportunidades de investigación en aprendizaje automático y procesamiento del lenguaje natural . [2] Se fusionó con la antigua empresa hermana de Google, DeepMind, para formar Google DeepMind en abril de 2023.
El proyecto Google Brain comenzó en 2011 como una colaboración de investigación a tiempo parcial entre Jeff Dean, miembro de Google , y Greg Corrado, investigador de Google. [3] Google Brain comenzó como un proyecto de Google X y tuvo tanto éxito que volvió a Google: Astro Teller ha dicho que Google Brain pagó el costo total de Google X. [ 4]
En junio de 2012, el New York Times informó que un grupo de 16.000 procesadores en 1.000 computadoras dedicadas a imitar algunos aspectos de la actividad cerebral humana se había entrenado con éxito para reconocer un gato basándose en 10 millones de imágenes digitales tomadas de videos de YouTube . [3] La historia también fue cubierta por la Radio Pública Nacional . [5]
En marzo de 2013, Google contrató a Geoffrey Hinton , un destacado investigador en el campo del aprendizaje profundo , y adquirió la empresa DNNResearch Inc. dirigida por Hinton. Hinton dijo que dividiría su tiempo futuro entre su investigación universitaria y su trabajo en Google. [6]
En abril de 2023, Google Brain se fusionó con la empresa hermana de Google, DeepMind, para formar Google DeepMind , como parte de los esfuerzos continuos de la empresa para acelerar el trabajo en IA. [7]
Google Brain fue creado inicialmente por el Google Fellow Jeff Dean y el profesor visitante de Stanford Andrew Ng . En 2014, el equipo incluía a Jeff Dean , Quoc Le , Ilya Sutskever , Alex Krizhevsky , Samy Bengio y Vincent Vanhoucke. En 2017, los miembros del equipo incluían a Anelia Angelova, Samy Bengio , Greg Corrado, George Dahl, Michael Isard, Anjuli Kannan, Hugo Larochelle, Chris Olah, Salih Edneer, Benoit Steiner, Vincent Vanhoucke, Vijay Vasudevan y Fernanda Viegas . [8] Chris Lattner , quien creó el lenguaje de programación Swift de Apple y luego dirigió el equipo de autonomía de Tesla durante seis meses, se unió al equipo de Google Brain en agosto de 2017. [9] Lattner dejó el equipo en enero de 2020 y se unió a SiFive . [10]
En 2021 [actualizar], Google Brain estaba dirigido por Jeff Dean , Geoffrey Hinton y Zoubin Ghahramani . Otros miembros incluyen a Katherine Heller, Pi-Chuan Chang, Ian Simon, Jean-Philippe Vert, Nevena Lazic, Anelia Angelova, Lukasz Kaiser, Carrie Jun Cai, Eric Breck, Ruoming Pang, Carlos Riquelme, Hugo Larochelle y David Ha. [8] Samy Bengio dejó el equipo en abril de 2021, [11] y Zoubin Ghahramani asumió sus responsabilidades.
Google Research incluye Google Brain y tiene su sede en Mountain View, California . También tiene grupos satélite en Accra , Ámsterdam , Atlanta , Pekín , Berlín , Cambridge (Massachusetts) , Israel , Los Ángeles , Londres , Montreal , Múnich , Nueva York , París , Pittsburgh , Princeton , San Francisco , Seattle , Tokio , Toronto y Zúrich . [12]
En octubre de 2016, Google Brain diseñó un experimento para determinar que las redes neuronales son capaces de aprender cifrado simétrico seguro . [13] En este experimento, se crearon tres redes neuronales : Alice, Bob y Eve. [14] Siguiendo la idea de una red generativa antagónica (GAN), el objetivo del experimento era que Alice enviara un mensaje cifrado a Bob que Bob pudiera descifrar, pero el adversario, Eve, no. [14] Alice y Bob mantuvieron una ventaja sobre Eve, ya que compartían una clave utilizada para el cifrado y descifrado . [13] Al hacerlo, Google Brain demostró la capacidad de las redes neuronales para aprender el cifrado seguro . [13]
En febrero de 2017, Google Brain determinó un método probabilístico para convertir imágenes con una resolución de 8x8 a una resolución de 32x32. [15] [16] El método se basó en un modelo probabilístico ya existente llamado pixelCNN para generar traducciones de píxeles. [17] [18]
El software propuesto utiliza dos redes neuronales para realizar aproximaciones de la composición de píxeles de las imágenes traducidas. [16] [19] La primera red, conocida como la "red de acondicionamiento", reduce el tamaño de las imágenes de alta resolución a 8x8 e intenta crear asignaciones de la imagen original de 8x8 a estas imágenes de mayor resolución. [16] La otra red, conocida como la "red anterior", utiliza las asignaciones de la red anterior para agregar más detalles a la imagen original. [16] La imagen traducida resultante no es la misma imagen en mayor resolución, sino más bien una estimación de resolución de 32x32 basada en otras imágenes de alta resolución existentes. [16] Los resultados de Google Brain indican la posibilidad de que las redes neuronales mejoren las imágenes. [20]
El equipo de Google Brain contribuyó al proyecto Google Translate empleando un nuevo sistema de aprendizaje profundo que combina redes neuronales artificiales con vastas bases de datos de textos multilingües . [21] En septiembre de 2016, se lanzó Google Neural Machine Translation (GNMT), un marco de aprendizaje de extremo a extremo, capaz de aprender de una gran cantidad de ejemplos. [21] Anteriormente, el enfoque de traducción automática basada en frases (PBMT) de Google Translate analizaría estadísticamente palabra por palabra e intentaría hacer coincidir las palabras correspondientes en otros idiomas sin considerar las frases circundantes en la oración. [22] Pero en lugar de elegir un reemplazo para cada palabra individual en el idioma deseado, GNMT evalúa segmentos de palabras en el contexto del resto de la oración para elegir reemplazos más precisos. [2] En comparación con los modelos PBMT más antiguos, el modelo GNMT obtuvo una mejora del 24% en la similitud con la traducción humana, con una reducción del 60% en los errores. [2] [21] El GNMT también ha mostrado una mejora significativa para traducciones notoriamente difíciles, como del chino al inglés . [21]
Si bien la introducción del GNMT ha aumentado la calidad de las traducciones de Google Translate para los idiomas piloto, fue muy difícil crear tales mejoras para todos sus 103 idiomas. Para abordar este problema, el equipo de Google Brain pudo desarrollar un sistema GNMT multilingüe , que amplió el anterior al permitir traducciones entre múltiples idiomas. Además, permite traducciones Zero-Shot, que son traducciones entre dos idiomas que el sistema nunca había visto explícitamente antes. [23] Google anunció que Google Translate ahora también puede traducir sin transcribir, utilizando redes neuronales. Esto significa que es posible traducir el habla en un idioma directamente a texto en otro idioma, sin transcribirlo primero a texto.
Según los investigadores de Google Brain, este paso intermedio se puede evitar utilizando redes neuronales. Para que el sistema aprendiera esto, lo expusieron a muchas horas de audio en español junto con el texto correspondiente en inglés. Las diferentes capas de redes neuronales, replicando el cerebro humano, fueron capaces de unir las partes correspondientes y posteriormente manipular la forma de onda del audio hasta transformarla en texto en inglés. [24] Otro inconveniente del modelo GNMT es que hace que el tiempo de traducción aumente exponencialmente con el número de palabras de la oración. [2] Esto hizo que el equipo de Google Brain añadiera 2000 procesadores más para garantizar que el nuevo proceso de traducción siguiera siendo rápido y fiable. [22]
Con el objetivo de mejorar los algoritmos de control robótico tradicionales donde las nuevas habilidades de un robot necesitan ser programadas manualmente , los investigadores de robótica de Google Brain están desarrollando técnicas de aprendizaje automático para permitir que los robots aprendan nuevas habilidades por sí mismos. [25] También intentan desarrollar formas de compartir información entre robots para que los robots puedan aprender unos de otros durante su proceso de aprendizaje, también conocido como robótica en la nube . [26] Como resultado, Google lanzó la Plataforma de Robótica en la Nube de Google para desarrolladores en 2019, un esfuerzo por combinar la robótica , la IA y la nube para permitir una automatización robótica eficiente a través de robots colaborativos conectados a la nube. [26]
La investigación en robótica en Google Brain se ha centrado principalmente en mejorar y aplicar algoritmos de aprendizaje profundo para permitir que los robots completen tareas aprendiendo de la experiencia, la simulación, las demostraciones humanas y/o las representaciones visuales. [27] [28] [29] [30] Por ejemplo, los investigadores de Google Brain demostraron que los robots pueden aprender a recoger y lanzar objetos rígidos en cajas seleccionadas experimentando en un entorno sin estar preprogramados para hacerlo. [27] En otra investigación, los investigadores entrenaron a los robots para que aprendieran comportamientos como verter líquido de una taza; los robots aprendieron de videos de demostraciones humanas grabadas desde múltiples puntos de vista. [29]
Los investigadores de Google Brain han colaborado con otras empresas e instituciones académicas en la investigación sobre robótica. En 2016, el equipo de Google Brain colaboró con investigadores de X en una investigación sobre el aprendizaje de la coordinación mano-ojo para el agarre robótico. [31] Su método permitió el control del robot en tiempo real para agarrar objetos nuevos con autocorrección. [31] En 2020, investigadores de Google Brain, Intel AI Lab y UC Berkeley crearon un modelo de IA para que los robots aprendieran tareas relacionadas con la cirugía, como suturar, a partir del entrenamiento con videos de cirugía. [30]
En 2020, el equipo de Google Brain y la Universidad de Lille presentaron un modelo de reconocimiento automático de hablantes al que llamaron Interactive Speaker Recognition. El módulo ISR reconoce a un hablante de una lista determinada de hablantes solo solicitando unas pocas palabras específicas del usuario. [32] El modelo se puede modificar para elegir segmentos de voz en el contexto del entrenamiento de texto a voz . [32] También puede evitar que los generadores de voz maliciosos accedan a los datos. [32]
TensorFlow es una biblioteca de software de código abierto impulsada por Google Brain que permite a cualquier persona utilizar el aprendizaje automático al proporcionar las herramientas para entrenar su propia red neuronal. [2] La herramienta se ha utilizado para desarrollar software que utiliza modelos de aprendizaje profundo que los agricultores utilizan para reducir la cantidad de trabajo manual necesario para clasificar su producción, entrenándolo con un conjunto de datos de imágenes clasificadas por humanos. [2]
Magenta es un proyecto que utiliza Google Brain para crear nueva información en forma de arte y música en lugar de clasificar y ordenar datos existentes. [2] TensorFlow se actualizó con un conjunto de herramientas para que los usuarios guíen a la red neuronal para crear imágenes y música. [2] Sin embargo, el equipo de la Universidad Estatal de Valdosta descubrió que la IA tiene dificultades para replicar perfectamente la intención humana en el arte , de forma similar a los problemas que se enfrentan en la traducción . [2]
Las capacidades de clasificación de imágenes de Google Brain se han utilizado para ayudar a detectar ciertas afecciones médicas mediante la búsqueda de patrones que los médicos humanos pueden no notar para proporcionar un diagnóstico más temprano. [2] Durante la detección del cáncer de mama, se descubrió que este método tenía una cuarta parte de la tasa de falsos positivos de los patólogos humanos, que necesitan más tiempo para revisar cada foto y no pueden concentrarse por completo en esta única tarea. [2] Debido al entrenamiento muy específico de la red neuronal para una sola tarea, no puede identificar otras afecciones presentes en una foto que un humano podría detectar fácilmente. [2]
La arquitectura de aprendizaje profundo del transformador fue inventada por los investigadores de Google Brain en 2017 y explicada en el artículo científico Attention Is All You Need . [33] Google posee una patente sobre esta arquitectura ampliamente utilizada, pero no la ha aplicado. [34] [35]
Google Brain anunció en 2022 que creó dos tipos diferentes de modelos de texto a imagen llamados Imagen y Parti que compiten con DALL-E de OpenAI . [36] [37]
Más tarde, en 2022, el proyecto se amplió a texto a vídeo. [38]
La tecnología de los proyectos Google Brain se utiliza actualmente en varios otros productos de Google, como el sistema de reconocimiento de voz del sistema operativo Android , la búsqueda de fotografías de Google Photos , la respuesta inteligente en Gmail y las recomendaciones de vídeos en YouTube . [39] [40] [41]
Google Brain ha recibido cobertura en Wired , [42] [43] [44] NPR , [5] y Big Think . [45] Estos artículos han contenido entrevistas con miembros clave del equipo Ray Kurzweil y Andrew Ng, y se centran en explicaciones de los objetivos y aplicaciones del proyecto. [42] [5] [45]
En diciembre de 2020, la especialista en ética de la IA Timnit Gebru dejó Google. [46] Si bien se discute la naturaleza exacta de su renuncia o su despido, la causa de su salida fue su negativa a retractarse de un artículo titulado " Sobre los peligros de los loros estocásticos: ¿pueden los modelos lingüísticos ser demasiado grandes? " y un ultimátum relacionado que hizo, estableciendo condiciones que se cumplirían de lo contrario se iría. [46] Este artículo exploró los riesgos potenciales del crecimiento de la IA como Google Brain, incluido el impacto ambiental, los sesgos en los datos de entrenamiento y la capacidad de engañar al público. [46] [47] La solicitud de retractarse del artículo fue realizada por Megan Kacholia, vicepresidenta de Google Brain. [48] En abril de 2021, casi 7000 empleados actuales o anteriores de Google y partidarios de la industria han firmado una carta abierta acusando a Google de "censura de la investigación" y condenando el trato a Gebru en la empresa. [49 ]
En febrero de 2021, Google despidió a una de las líderes del equipo de ética de IA de la empresa, Margaret Mitchell . [48] La declaración de la empresa alegó que Mitchell había infringido la política de la empresa al utilizar herramientas automatizadas para encontrar apoyo para Gebru. [48] En el mismo mes, los ingenieros ajenos al equipo de ética empezaron a dimitir, citando el despido de Gebru como motivo de su marcha. [50] En abril de 2021, el cofundador de Google Brain , Samy Bengio, anunció su dimisión de la empresa. [11] A pesar de ser el manager de Gebru, Bengio no fue notificado antes de su despido, y publicó en línea su apoyo tanto a ella como a Mitchell. [11] Aunque el anuncio de Bengio se centró en el crecimiento personal como motivo de su marcha, fuentes anónimas indicaron a Reuters que la agitación dentro del equipo de ética de la IA influyó en sus consideraciones. [11]
En marzo de 2022, Google despidió al investigador de IA Satrajit Chatterjee después de que cuestionara los hallazgos de un artículo publicado en Nature , por los miembros del equipo de IA de Google, Anna Goldie y Azalia Mirhoseini. [51] [52] Este artículo informó buenos resultados del uso de técnicas de IA (en particular, aprendizaje de refuerzo) para el problema de colocación de circuitos integrados . [53] Sin embargo, este resultado es bastante controvertido, [54] [55] [56] ya que el artículo no contiene comparaciones directas con colocadores existentes y es difícil de replicar debido al contenido propietario. Al menos un comentario inicialmente favorable ha sido retractado tras una revisión adicional, [57] y el artículo está siendo investigado por Nature. [58]
{{cite news}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite web}}
: |first=
tiene nombre genérico ( ayuda ){{cite news}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite book}}
: CS1 maint: varios nombres: lista de autores ( enlace )