Michael J. Black es un informático nacido en Estados Unidos que trabaja en Tübingen , Alemania. Es director fundador del Instituto Max Planck de Sistemas Inteligentes , donde dirige el Departamento de Sistemas de Percepción en una investigación centrada en la visión artificial, el aprendizaje automático y los gráficos por ordenador. También es profesor honorario de la Universidad de Tübingen .
Black ha ganado los tres premios más importantes en el campo de la visión artificial: el Premio Koenderink en la Conferencia Europea sobre Visión Artificial (ECCV) en 2010 y 2022, el Premio Helmholtz en la Conferencia Internacional sobre Visión Artificial (ICCV) en 2013 y el Premio Longuet-Higgins en la Conferencia IEEE sobre Visión Artificial y Reconocimiento de Patrones (CVPR) en 2022. En 2023 recibió el Premio al Investigador Distinguido de PAMI.
La tesis de Black [1] reformuló la estimación del flujo óptico como un problema de estimación M robusto . La observación principal fue que las discontinuidades espaciales en el movimiento de la imagen y las violaciones del supuesto de constancia del brillo estándar podrían tratarse como valores atípicos . La reformulación del problema de optimización clásico como un problema de estimación robusta produjo resultados más precisos.
Este algoritmo de flujo óptico "Black and Anandan" se ha utilizado ampliamente, por ejemplo, en efectos especiales. [2] El método se utilizó para calcular el flujo óptico para los efectos pictóricos en What Dreams May Come y para registrar escaneos faciales 3D en The Matrix Reloaded .
Una versión de este trabajo recibió el premio IEEE Outstanding Paper Award en CVPR 1991 [3] y el premio Helmholtz en ICCV 2013 por un trabajo que "ha resistido la prueba del tiempo". [4]
Su interés inicial por el modelado estadístico del movimiento, en particular en las discontinuidades del movimiento, dio lugar a otros dos artículos premiados. Su trabajo con David Fleet sobre "Detección y seguimiento probabilísticos de límites de movimiento" recibió una mención honorífica del Premio Marr en el ICCV '99. [5] El trabajo de Black con Stefan Roth "Sobre las estadísticas espaciales del flujo óptico" recibió una mención honorífica del Premio Marr en el ICCV 2005. [6]
Su trabajo con Deqing Sun y Stefan Roth sobre los "Secretos del flujo óptico" recibió el premio Longuet-Higgins 2020. El premio lo otorga anualmente el Comité Técnico de Análisis de Patrones e Inteligencia Artificial (PAMI) del IEEE por "Contribuciones en Visión por Computadora que han resistido la Prueba del Tiempo". El artículo sobre los "secretos" ayudó a establecer el estado del arte en el campo y condujo al algoritmo de flujo Classic+NL ampliamente utilizado.
El método de "Black y Anandan" ayudó a popularizar las estadísticas robustas en la visión por computadora. Esto fue facilitado por varios artículos que conectaban las funciones de penalización robustas con los "procesos lineales" clásicos utilizados en los campos aleatorios de Markov (MRF) en ese momento. Black y Rangarajan [7] caracterizaron las propiedades formales de las funciones robustas que tienen una forma de proceso lineal equivalente y proporcionaron un proceso para convertir entre estas formulaciones (conocido ahora como "Dualidad Black-Rangarajan" [8] ). Black y sus colegas aplicaron estas ideas a la eliminación de ruido de imágenes, [9] la difusión anisotrópica [10] y el análisis de componentes principales (PCA). [11] [12]
La formulación robusta fue elaborada a mano y utilizó pequeños vecindarios espaciales. El trabajo en Campos de Expertos con Stefan Roth eliminó estas restricciones. [13] Aprendieron las funciones potenciales de una MRF con grandes camarillas espaciales modelando los potenciales de campo como un producto de expertos . Su formulación puede verse como una red neuronal convolucional superficial .
En 1993, Black y Jepson utilizaron modelos de mezcla para representar campos de flujo óptico con múltiples movimientos [14] (también llamado flujo óptico "en capas"). Esto introdujo el uso de la maximización de expectativas (EM) en el campo de la visión por computadora.
En la década de 2000, Black trabajó con John Donoghue y otros en la Universidad Brown para crear la tecnología detrás de la tecnología de prótesis neuronales BrainGate . Black y sus colegas desarrollaron métodos bayesianos para decodificar señales neuronales de la corteza motora . El equipo fue el primero en utilizar el filtrado de Kalman [15] [16] [17] y el filtrado de partículas [18] para decodificar la actividad del conjunto cortical motor. Con estos métodos de decodificación bayesianos, el equipo demostró el control exitoso de apuntar y hacer clic de un cursor de computadora por parte de un humano con parálisis [19] [20] y la decodificación del movimiento completo del brazo y la mano en primates no humanos. [21]
Black es más conocido por su trabajo sobre el movimiento humano y la estimación de la forma. Junto con Hedvig Sidenbladh y David Fleet, introdujo el uso del filtrado de partículas para el seguimiento del movimiento humano articulado en 3D. [22] Este trabajo recibió el Premio Koenderink por Contribuciones Fundamentales en Visión por Computadora en la ECCV 2000.
Su trabajo actual se centra en el modelado y la estimación de la forma y la postura humanas a partir de imágenes y vídeos. Su equipo fue el primero en adaptar un modelo de cuerpo humano en 3D aprendido a datos de imágenes de múltiples cámaras en CVPR 2007, [23] debajo de la ropa en ECCV 2008, [24] a partir de una sola imagen en ICCV 2009, [25] y a partir de datos RGB-D en ICCV 2011. [26]
Su grupo produjo el popular modelo corporal 3D SMPL [27] (y varias extensiones como FLAME [28] para rostros humanos en 3D, MANO [29] para manos en 3D y SMPL-X, [30] un expresivo modelo corporal 3D con manos y rostros) y popularizó métodos para estimar la forma corporal en 3D a partir de imágenes. [31] [32] SMPL se usa ampliamente tanto en el ámbito académico como en la industria y fue una de las principales tecnologías licenciadas por Body Labs Inc.
Loper y Black popularizaron la "representación diferenciable", [33] que se ha convertido en un componente importante del entrenamiento autosupervisado de redes neuronales para problemas como el análisis facial. Los métodos clásicos de análisis por síntesis formulan una función objetivo y luego la diferencian. El método OpenDR [34] era más genérico en el sentido de que diferenciaba (aproximadamente) un motor de representación de gráficos mediante la diferenciación automática . Esto proporcionó un marco para plantear un problema de síntesis hacia adelante y obtener automáticamente un método de optimización para resolver el problema inverso.
Black ha contribuido a la creación de varios conjuntos de datos importantes. El conjunto de datos de flujo de Middlebury proporcionó el primer punto de referencia integral para el campo. [35] El conjunto de datos de flujo MPI-Sintel demostró que los datos sintéticos eran lo suficientemente ricos y similares a los datos reales como para proporcionar un punto de referencia riguroso y ser útiles para el aprendizaje del flujo óptico. [36]
El conjunto de datos HumanEva [37] fue el primer conjunto de datos con poses humanas en 3D en correspondencia con videos RGB de personas en movimiento. El enfoque utilizó una combinación de captura de movimiento óptico y captura de video con múltiples cámaras. Este conjunto de datos permitió que el campo evaluara la precisión y comparara el rendimiento por primera vez.
En relación con la postura, la forma y la actividad humanas, Black ha contribuido al conjunto de datos SURREAL de movimientos humanos, [38] al conjunto de datos JHMDB de acciones humanas, [39] y al conjunto de datos FAUST de formas corporales en 3D. [40] FAUST recibió el Premio al Conjunto de Datos del Simposio Eurographics sobre Procesamiento de Geometría (SGP) , 2016. [41]
1985–1989 : Después de obtener su licenciatura, Black se mudó al Área de la Bahía y trabajó como ingeniero de software en GTE Government Systems y Advanced Decision Systems (ADS) desarrollando sistemas expertos en las máquinas Xerox y Symbolics Lisp . Durante este tiempo, completó su Maestría en Ciencias de la Computación en Computación Simbólica y Heurística a través del Programa Cooperativo de Honores en Stanford. Su asesor fue John McCarthy .
1989–1992 : Durante este período, Black realizó su doctorado en Yale y recibió el apoyo de una beca de posgrado de la NASA. Completó su doctorado en el Centro de Investigación Ames de la NASA en la División de Investigación de Factores Humanos dirigida por Andrew (Beau) Watson. En Yale, fue asesorado por P. Anandan y Drew McDermott .
1992–1993 : Black realizó un trabajo posdoctoral en la Universidad de Toronto como profesor adjunto de Ciencias de la Computación (nombramiento por tiempo limitado). Fue supervisado por Allan Jepson. Durante su estancia allí, recibió el premio de enseñanza de la Unión de Estudiantes de Ciencias de la Computación.
1993-2000 : En 1993, Black se incorporó al Centro de Investigación de Palo Alto (PARC) de Xerox como miembro del personal de investigación. Trabajó en el Área de Comprensión de Imágenes, dirigida por Daniel Huttenlocher . En 1996, asumió la dirección de Huttenlocher. Comenzó el Área de Análisis de Vídeo Digital en 1998.
2000–2011 : En 2000, Black se incorporó a la facultad de la Universidad Brown como profesor asociado de informática (con titularidad). En 2004, fue ascendido a profesor titular.
2017–2021 : En 2017, con la adquisición de Body Labs por parte de Amazon, Black se unió a Amazon como académico distinguido de Amazon (VP) a tiempo parcial.
2011-presente : En 2011, Black se convirtió en miembro científico de la Sociedad Max Planck y uno de los directores fundadores del nuevo MPI para Sistemas Inteligentes .
Además de cofundar el MPI para Sistemas Inteligentes, Black lideró la fundación de la Escuela Internacional de Investigación Max Planck (IMPRS) para Sistemas Inteligentes.
En 2015, propuso una iniciativa que desde entonces se ha convertido en Cyber Valley, cuyo objetivo es convertir a la región de Stuttgart-Tübingen (Alemania) en un líder mundial en investigación y aplicaciones de IA. Forma parte del Comité Ejecutivo del consorcio de investigación y actúa como portavoz.
En 2013, un equipo del grupo de Black creó Body Labs, que comercializaba tecnología de modelos corporales en 3D para la industria de la ropa y los juegos. Black fue cofundador e inversor. Body Labs fue adquirida por Amazon.com en 2017. [42]
En 2018, Meshcapade GmbH se separó de su grupo. La start-up se centra en la concesión de licencias de tecnología desarrollada en MPI-IS y en la prestación de servicios. [43]