stringtranslate.com

Michael J. Negro

Michael J. Black es un informático nacido en Estados Unidos que trabaja en Tübingen , Alemania. Es director fundador del Instituto Max Planck de Sistemas Inteligentes , donde dirige el Departamento de Sistemas de Percepción en una investigación centrada en la visión artificial, el aprendizaje automático y los gráficos por ordenador. También es profesor honorario de la Universidad de Tübingen .

Black ha ganado los tres premios más importantes en el campo de la visión artificial: el Premio Koenderink en la Conferencia Europea sobre Visión Artificial (ECCV) en 2010 y 2022, el Premio Helmholtz en la Conferencia Internacional sobre Visión Artificial (ICCV) en 2013 y el Premio Longuet-Higgins en la Conferencia IEEE sobre Visión Artificial y Reconocimiento de Patrones (CVPR) en 2022. En 2023 recibió el Premio al Investigador Distinguido de PAMI.

Investigación

Flujo óptico

La tesis de Black [1] reformuló la estimación del flujo óptico como un problema de estimación M robusto . La observación principal fue que las discontinuidades espaciales en el movimiento de la imagen y las violaciones del supuesto de constancia del brillo estándar podrían tratarse como valores atípicos . La reformulación del problema de optimización clásico como un problema de estimación robusta produjo resultados más precisos.

Este algoritmo de flujo óptico "Black and Anandan" se ha utilizado ampliamente, por ejemplo, en efectos especiales. [2] El método se utilizó para calcular el flujo óptico para los efectos pictóricos en What Dreams May Come y para registrar escaneos faciales 3D en The Matrix Reloaded .

Una versión de este trabajo recibió el premio IEEE Outstanding Paper Award en CVPR 1991 [3] y el premio Helmholtz en ICCV 2013 por un trabajo que "ha resistido la prueba del tiempo". [4]

Su interés inicial por el modelado estadístico del movimiento, en particular en las discontinuidades del movimiento, dio lugar a otros dos artículos premiados. Su trabajo con David Fleet sobre "Detección y seguimiento probabilísticos de límites de movimiento" recibió una mención honorífica del Premio Marr en el ICCV '99. [5] El trabajo de Black con Stefan Roth "Sobre las estadísticas espaciales del flujo óptico" recibió una mención honorífica del Premio Marr en el ICCV 2005. [6]

Su trabajo con Deqing Sun y Stefan Roth sobre los "Secretos del flujo óptico" recibió el premio Longuet-Higgins 2020. El premio lo otorga anualmente el Comité Técnico de Análisis de Patrones e Inteligencia Artificial (PAMI) del IEEE por "Contribuciones en Visión por Computadora que han resistido la Prueba del Tiempo". El artículo sobre los "secretos" ayudó a establecer el estado del arte en el campo y condujo al algoritmo de flujo Classic+NL ampliamente utilizado.

Estadísticas robustas y estadísticas de imágenes

El método de "Black y Anandan" ayudó a popularizar las estadísticas robustas en la visión por computadora. Esto fue facilitado por varios artículos que conectaban las funciones de penalización robustas con los "procesos lineales" clásicos utilizados en los campos aleatorios de Markov (MRF) en ese momento. Black y Rangarajan [7] caracterizaron las propiedades formales de las funciones robustas que tienen una forma de proceso lineal equivalente y proporcionaron un proceso para convertir entre estas formulaciones (conocido ahora como "Dualidad Black-Rangarajan" [8] ). Black y sus colegas aplicaron estas ideas a la eliminación de ruido de imágenes, [9] la difusión anisotrópica [10] y el análisis de componentes principales (PCA). [11] [12]

La formulación robusta fue elaborada a mano y utilizó pequeños vecindarios espaciales. El trabajo en Campos de Expertos con Stefan Roth eliminó estas restricciones. [13] Aprendieron las funciones potenciales de una MRF con grandes camarillas espaciales modelando los potenciales de campo como un producto de expertos . Su formulación puede verse como una red neuronal convolucional superficial .

Estimación de movimiento por capas

En 1993, Black y Jepson utilizaron modelos de mezcla para representar campos de flujo óptico con múltiples movimientos [14] (también llamado flujo óptico "en capas"). Esto introdujo el uso de la maximización de expectativas (EM) en el campo de la visión por computadora.

Descodificación neuronal y prótesis neuronales

En la década de 2000, Black trabajó con John Donoghue y otros en la Universidad Brown para crear la tecnología detrás de la tecnología de prótesis neuronales BrainGate . Black y sus colegas desarrollaron métodos bayesianos para decodificar señales neuronales de la corteza motora . El equipo fue el primero en utilizar el filtrado de Kalman [15] [16] [17] y el filtrado de partículas [18] para decodificar la actividad del conjunto cortical motor. Con estos métodos de decodificación bayesianos, el equipo demostró el control exitoso de apuntar y hacer clic de un cursor de computadora por parte de un humano con parálisis [19] [20] y la decodificación del movimiento completo del brazo y la mano en primates no humanos. [21]

Movimiento y forma humana

Black es más conocido por su trabajo sobre el movimiento humano y la estimación de la forma. Junto con Hedvig Sidenbladh y David Fleet, introdujo el uso del filtrado de partículas para el seguimiento del movimiento humano articulado en 3D. [22] Este trabajo recibió el Premio Koenderink por Contribuciones Fundamentales en Visión por Computadora en la ECCV 2000.

Su trabajo actual se centra en el modelado y la estimación de la forma y la postura humanas a partir de imágenes y vídeos. Su equipo fue el primero en adaptar un modelo de cuerpo humano en 3D aprendido a datos de imágenes de múltiples cámaras en CVPR 2007, [23] debajo de la ropa en ECCV 2008, [24] a partir de una sola imagen en ICCV 2009, [25] y a partir de datos RGB-D en ICCV 2011. [26]

Su grupo produjo el popular modelo corporal 3D SMPL [27] (y varias extensiones como FLAME [28] para rostros humanos en 3D, MANO [29] para manos en 3D y SMPL-X, [30] un expresivo modelo corporal 3D con manos y rostros) y popularizó métodos para estimar la forma corporal en 3D a partir de imágenes. [31] [32] SMPL se usa ampliamente tanto en el ámbito académico como en la industria y fue una de las principales tecnologías licenciadas por Body Labs Inc.

Representación diferenciable

Loper y Black popularizaron la "representación diferenciable", [33] que se ha convertido en un componente importante del entrenamiento autosupervisado de redes neuronales para problemas como el análisis facial. Los métodos clásicos de análisis por síntesis formulan una función objetivo y luego la diferencian. El método OpenDR [34] era más genérico en el sentido de que diferenciaba (aproximadamente) un motor de representación de gráficos mediante la diferenciación automática . Esto proporcionó un marco para plantear un problema de síntesis hacia adelante y obtener automáticamente un método de optimización para resolver el problema inverso.

Conjuntos de datos

Black ha contribuido a la creación de varios conjuntos de datos importantes. El conjunto de datos de flujo de Middlebury proporcionó el primer punto de referencia integral para el campo. [35] El conjunto de datos de flujo MPI-Sintel demostró que los datos sintéticos eran lo suficientemente ricos y similares a los datos reales como para proporcionar un punto de referencia riguroso y ser útiles para el aprendizaje del flujo óptico. [36]

El conjunto de datos HumanEva [37] fue el primer conjunto de datos con poses humanas en 3D en correspondencia con videos RGB de personas en movimiento. El enfoque utilizó una combinación de captura de movimiento óptico y captura de video con múltiples cámaras. Este conjunto de datos permitió que el campo evaluara la precisión y comparara el rendimiento por primera vez.

En relación con la postura, la forma y la actividad humanas, Black ha contribuido al conjunto de datos SURREAL de movimientos humanos, [38] al conjunto de datos JHMDB de acciones humanas, [39] y al conjunto de datos FAUST de formas corporales en 3D. [40] FAUST recibió el Premio al Conjunto de Datos del Simposio Eurographics sobre Procesamiento de Geometría (SGP) , 2016. [41]

Empleo

1985–1989 : Después de obtener su licenciatura, Black se mudó al Área de la Bahía y trabajó como ingeniero de software en GTE Government Systems y Advanced Decision Systems (ADS) desarrollando sistemas expertos en las máquinas Xerox y Symbolics Lisp . Durante este tiempo, completó su Maestría en Ciencias de la Computación en Computación Simbólica y Heurística a través del Programa Cooperativo de Honores en Stanford. Su asesor fue John McCarthy .

1989–1992 : Durante este período, Black realizó su doctorado en Yale y recibió el apoyo de una beca de posgrado de la NASA. Completó su doctorado en el Centro de Investigación Ames de la NASA en la División de Investigación de Factores Humanos dirigida por Andrew (Beau) Watson. En Yale, fue asesorado por P. Anandan y Drew McDermott .

1992–1993 : Black realizó un trabajo posdoctoral en la Universidad de Toronto como profesor adjunto de Ciencias de la Computación (nombramiento por tiempo limitado). Fue supervisado por Allan Jepson. Durante su estancia allí, recibió el premio de enseñanza de la Unión de Estudiantes de Ciencias de la Computación.

1993-2000 : En 1993, Black se incorporó al Centro de Investigación de Palo Alto (PARC) de Xerox como miembro del personal de investigación. Trabajó en el Área de Comprensión de Imágenes, dirigida por Daniel Huttenlocher . En 1996, asumió la dirección de Huttenlocher. Comenzó el Área de Análisis de Vídeo Digital en 1998.  

2000–2011 : En 2000, Black se incorporó a la facultad de la Universidad Brown como profesor asociado de informática (con titularidad). En 2004, fue ascendido a profesor titular.

2017–2021 : En 2017, con la adquisición de Body Labs por parte de Amazon, Black se unió a Amazon como académico distinguido de Amazon (VP) a tiempo parcial.

2011-presente : En 2011, Black se convirtió en miembro científico de la Sociedad Max Planck y uno de los directores fundadores del nuevo MPI para Sistemas Inteligentes .

Administración

Además de cofundar el MPI para Sistemas Inteligentes, Black lideró la fundación de la Escuela Internacional de Investigación Max Planck (IMPRS) para Sistemas Inteligentes.

En 2015, propuso una iniciativa que desde entonces se ha convertido en Cyber ​​Valley, cuyo objetivo es convertir a la región de Stuttgart-Tübingen (Alemania) en un líder mundial en investigación y aplicaciones de IA. Forma parte del Comité Ejecutivo del consorcio de investigación y actúa como portavoz.

Emprendimiento

En 2013, un equipo del grupo de Black creó Body Labs, que comercializaba tecnología de modelos corporales en 3D para la industria de la ropa y los juegos. Black fue cofundador e inversor. Body Labs fue adquirida por Amazon.com en 2017. [42]

En 2018, Meshcapade GmbH se separó de su grupo. La start-up se centra en la concesión de licencias de tecnología desarrollada en MPI-IS y en la prestación de servicios. [43]

Referencias

  1. ^ Black, MJ (1992). "Flujo óptico incremental robusto". Universidad de Yale, Departamento de Ciencias de la Computación .
  2. ^ "El arte del flujo óptico, guía de efectos especiales". 28 de febrero de 2006. Archivado desde el original el 16 de enero de 2020. Consultado el 2 de marzo de 2020 .
  3. ^ Black, MJ; Anandan, P. (junio de 1991). "Estimación robusta de movimiento dinámico a lo largo del tiempo". Conferencia IEEE sobre visión artificial y reconocimiento de patrones (CVPR) . CVPR. Maui, Hawái. págs. 296–302. Black:CVPR:1991.
  4. ^ Black, MJ; Anandan, P. (mayo de 1993). "Un marco para la estimación robusta del flujo óptico". Conferencia Internacional sobre Visión por Computador (ICCV) . ICCV. Berlín, Alemania. págs. 231–236. Black:ICCV:1993.
  5. ^ Black, MJ; Fleet, DJ (septiembre de 1999). "Detección probabilística y seguimiento de discontinuidades de movimiento". Conferencia Internacional sobre Visión por Computador (ICCV) . ICCV. Corfú, Grecia: ICCV. págs. 551–558. Black:ICCV:1999.
  6. ^ Roth, R.; Black, MJ (2005). "Sobre las estadísticas espaciales del flujo óptico". Conferencia Internacional sobre Visión por Computador (ICCV) . ICCV. págs. 42–49. Roth:ICCV:05.
  7. ^ Black, MJ; Rangarajan, A. (julio de 1996). "Sobre la unificación de procesos lineales, rechazo de valores atípicos y estadísticas robustas con aplicaciones en visión temprana". Revista internacional de visión por computadora . 19 : 57–92. CiteSeerX 10.1.1.75.6656 . doi :10.1007/BF00131148. S2CID  7510079. 
  8. ^ Barron, Jonathan T. (2017). "Una función de pérdida robusta general y adaptativa". arXiv : 1701.03077 [cs.CV].
  9. ^ Black, MJ; Rangarajan, A. (1996). "Sobre la unificación de procesos lineales, rechazo de valores atípicos y estadísticas robustas con aplicaciones en visión temprana". Revista internacional de visión por computadora . 19 : 57–92. doi :10.1007/BF00131148. S2CID  7510079.
  10. ^ Black, MJ; Sapiro, G.; Marimont, D.; Heeger, D. (marzo de 1998). "Difusión anisotrópica robusta". IEEE Transactions on Image Processing . 7 (3): 421–432. Bibcode :1998ITIP....7..421B. doi :10.1109/83.661192. PMID  18276262.
  11. ^ De la Torre, F.; Black, MJ (2001). "Análisis robusto de componentes principales para visión artificial". Conferencia Internacional sobre Visión Artificial (ICCV) . ICCV. Vancouver, BC, EE. UU., págs. 362–369. Torre:ICCV:2001.
  12. ^ Black, MJ; Jepson, A. (1998). "EigenTracking: correspondencia y seguimiento robustos de objetos articulados utilizando una representación basada en vistas". Revista internacional de visión artificial . 26 : 63–84. doi :10.1023/A:1007939232436. S2CID  572947.
  13. ^ Roth, S.; Black, MJ (abril de 2009). "Campos de expertos". Revista internacional de visión por computadora . 82 (2): 205–29. doi :10.1007/s11263-008-0197-6. ​​S2CID  13058320.
  14. ^ Jepson, A.; Black, MJ (junio de 1992). "Modelos de mezcla para el cálculo de flujo óptico". Conferencia IEEE sobre visión artificial y reconocimiento de patrones (CVPR) . CVPR. Nueva York, NY. págs. 760–761. Black:IEEE:1993.
  15. ^ Wu, W.; Black, MJ; Gao, y.; Bienenstock, E.; Serruya, M.; Shaikhouni, A.; Donoghue, JP (2003). "Decodificación neuronal del movimiento del cursor utilizando un filtro Kalman". Advances in Neural Information Processing Systems 15 (NIPS) . MIT Press. págs. 133–140. Black:ANIPS:2003.
  16. ^ Wu, W.; Gao, Y.; Bienenstock, E.; Donoghue, JP; Black, MJ (2006). "Decodificación poblacional bayesiana de la actividad cortical motora utilizando un filtro de Kalman". Neural Computation . 18 (1): 80–118. CiteSeerX 10.1.1.218.2370 . doi :10.1162/089976606774841585. PMID  16354382. S2CID  1679756. 
  17. ^ Kim, S.-P.; Simeral, J.; Hochberg, L.; Donoghue, JP; Black, MJ (2008). "Control neuronal de la velocidad del cursor de la computadora mediante la decodificación de la actividad motora cortical en humanos con tetraplejia". Journal of Neural Engineering . 5 (4): 455–476. Bibcode :2008JNEng...5..455K. doi :10.1088/1741-2560/5/4/010. PMC 2911243 . PMID  19015583. 
  18. ^ Gao, Y.; Black, MJ; Bienenstock, E.; Shoham, S.; Donoghue, J. (2002). "Inferencia probabilística del movimiento de la mano a partir de la actividad neuronal en la corteza motora". Advances in Neural Information Processing Systems 14 (NIPS) . NIPS. MIT Press. págs. 221–228. Black:ANIPS:2002.
  19. ^ Kim, S.-P.; Simeral, J.; Hochberg, L.; Donoghue, JP; Friehs, GM; Black, MJ (abril de 2011). "Control del cursor mediante apuntar y hacer clic con un sistema de interfaz neuronal intracortical por parte de humanos con tetraplejia". IEEE Transactions on Neural Systems and Rehabilitation Engineering . 19 (2): 193–203. doi :10.1109/TNSRE.2011.2107750. PMC 3294291 . PMID  21278024. 
  20. ^ Simeral, JD; Kim, S.-P.; Black, MJ; Donoghue, JP; Hochberg, LR (2011). "Control neuronal de la trayectoria del cursor y el clic por parte de un humano con tetraplejia 1000 días después del implante de una matriz de microelectrodos intracorticales". Journal of Neural Engineering . 8 (2): 025027. Bibcode :2011JNEng...8b5027S. doi :10.1088/1741-2560/8/2/025027. PMC 3715131 . PMID  21436513. 
  21. ^ Vargas-Irwin, CE; Shakhnarovich, G.; Yadollahpour, P.; Mislow, JMK; Black, MJ; Donoghue, JP (julio de 2010). "Decodificación de acciones completas de alcance y agarre a partir de poblaciones locales de la corteza motora primaria". Journal of Neuroscience . 39 (29): 9659–9669. doi :10.1523/JNEUROSCI.5443-09.2010. PMC 2921895 . PMID  20660249. 
  22. ^ Sidenbladh, H.; Black, MJ; Fleet, DJ (junio de 2000). "Seguimiento estocástico de figuras humanas en 3D mediante el movimiento de imágenes en 2D". Conferencia Europea sobre Visión por Computador (ECCV) . ECCV. Dublín, Irlanda: Springer Verlag. págs. 702–718. Black:ECCV:2000.
  23. ^ Balan, A.; Black, MJ; Davis, J.; Haussecker, H. (junio de 2007). "Forma y pose humana detallada a partir de imágenes". Conferencia IEEE sobre visión artificial y reconocimiento de patrones (CVPR) . CVPR. Minneapolis. págs. 1–8. Balan:CVPR:2007.
  24. ^ Balan, A; Black, MJ (octubre de 2008). "La verdad desnuda: estimación de la forma del cuerpo bajo la ropa". Conferencia Europea sobre Visión por Computador (ECCV) . ECCV. Marsella, Francia: Springer-Verlag. págs. 15–29. Balan:ECCV.
  25. ^ Guan, P.; Weiss, A.; Balan, A.; Black, MJ (2009). "Estimación de la forma y la pose humana a partir de una sola imagen". Conferencia Internacional sobre Visión por Computador (ICCV) . ICCV. págs. 1381–1388. Guan:ICCV:2009.
  26. ^ Weiss, A.; Hirshberg, D; Black, MJ (noviembre de 2011). "Escaneos corporales 3D caseros a partir de imágenes ruidosas y datos de rango". Int. Conf. on Computer Vision (ICCV) . ICCV. Barcelona: IEEE. pp. 1951–1958. Weiss:ICCV:11.
  27. ^ Loper, M.; Mahmood, N.; Romero, J.; Pons-Moll, G.; Black, MJ (octubre de 2017). "SMPL: Un modelo lineal multipersonal de piel". ACM Trans. Graphics . 34 : 248:1–248:16. doi :10.1145/2816795.2818013. S2CID  229365481.
  28. ^ Li, T.; Bolkart, T.; Negro, MJ; Li, H.; Romero, J. (2017). "Aprendizaje de un modelo de forma y expresión facial a partir de escaneos 4D". ACM Trans. Graphics . 36 (6): 194:1–194:17. doi : 10.1145/3130800.3130813 .
  29. ^ Romero, J.; Tzionas, D.; Black, MJ (2017). "Manos encarnadas: modelado y captura de manos y cuerpos juntos". ACM Trans. Graphics . 36 : 245:1–245:17. arXiv : 2201.02610 . doi : 10.1145/3130800.3130883 .
  30. ^ Pavlakos, G.; Choutas, V.; Ghorbani, N.; Bolkart, T.; Osman, AAA; Tzionas, D.; Black, MJ (2019). "Captura corporal expresiva: manos, rostro y cuerpo en 3D a partir de una sola imagen". Conferencia IEEE sobre visión artificial y reconocimiento de patrones (CVPR) . Vol. 36. págs. 10975–10985. arXiv : 1904.05866 .
  31. ^ Bogo, F.; Kanazawa, A.; Lassner, C.; Gehler, P.; Romero, J.; Black, MJ (octubre de 2016). "Keep it SMPL: Automatic Estimation of 3D Human Pose and Shape from a Single Image" (Manténgalo SMPL: estimación automática de la forma y la pose humanas en 3D a partir de una sola imagen). Conferencia Europea sobre Visión por Computador (ECCV) . ECCV. Ámsterdam, Países Bajos: Springer International Publishing. págs. 561–578. Bogo:ECCV:2016.
  32. ^ Kanazawa, A.; Black, MJ; Jacobs, DW; Malik, J. (2018). "Recuperación de extremo a extremo de la forma y la postura humanas". Conferencia IEEE sobre visión artificial y reconocimiento de patrones (CVPR) . CVPR. Salt Lake City, EE. UU.: IEEE Computer Society. págs. 7122–7131. Kanazawa:CVPR:2018.
  33. ^ Loper, M.; Black, MJ (septiembre de 2014). "OpenDR: un renderizador diferenciable aproximado". Conferencia Europea sobre Visión Artificial (ECCV) . ECCV. Zúrich, Suiza: Springer International Publishing. págs. 154–169. Loper:ECCV:2014.
  34. ^ "Renderizador diferenciable abierto". GitHub . 16 de febrero de 2020. Archivado desde el original el 24 de julio de 2017 . Consultado el 2 de marzo de 2020 .
  35. ^ "Una base de datos y una metodología de evaluación para el flujo óptico". Archivado desde el original el 27 de julio de 2019. Consultado el 2 de marzo de 2020 .
  36. ^ "Conjunto de datos de flujo de MPI Sintel". Archivado desde el original el 29 de julio de 2019. Consultado el 2 de marzo de 2020 .
  37. ^ "Conjunto de datos de HumanEva". Archivado desde el original el 10 de septiembre de 2019. Consultado el 2 de marzo de 2020 .
  38. ^ "Conjunto de datos SURREAL". Archivado desde el original el 16 de enero de 2020. Consultado el 2 de marzo de 2020 .
  39. ^ "Base de datos de movimiento humano anotada por conjuntos". Archivado desde el original el 24 de julio de 2019. Consultado el 2 de marzo de 2020 .
  40. ^ "Conjunto de datos MPI FAUST". Archivado desde el original el 11 de agosto de 2019. Consultado el 2 de marzo de 2020 .
  41. ^ "Programas de premios de procesamiento de geometría". Archivado desde el original el 29 de julio de 2014. Consultado el 2 de marzo de 2020 .
  42. ^ "Amazon ha adquirido la startup de modelos corporales en 3D, Body Labs, por entre 50 y 70 millones de dólares". 3 de octubre de 2017. Archivado desde el original el 17 de diciembre de 2019. Consultado el 2 de marzo de 2020 .
  43. ^ "Meshcapade". Archivado desde el original el 16 de enero de 2020. Consultado el 2 de marzo de 2020 .

Enlaces externos