stringtranslate.com

Juan Tukey

John Wilder Tukey ( 16 de junio de 1915 - 26 de julio de 2000) fue un matemático y estadístico estadounidense , más conocido por el desarrollo del algoritmo de la transformada rápida de Fourier (FFT) y el diagrama de caja . [ 2 ] La prueba de rango de Tukey , la distribución lambda de Tukey , la prueba de aditividad de Tukey y el lema de Teichmüller-Tukey llevan su nombre. También se le atribuye la invención del término bit y el primer uso publicado de la palabra software .

Biografía

Tukey nació en New Bedford, Massachusetts , en 1915, hijo de un profesor de latín y de un tutor privado. Recibió principalmente clases de su madre y asistió a clases regulares solo para ciertas materias como francés. [3] Tukey obtuvo una licenciatura en 1936 y una maestría en 1937 en química, de la Universidad de Brown , antes de trasladarse a la Universidad de Princeton , donde en 1939 recibió un doctorado en matemáticas después de completar una disertación doctoral titulada "Sobre la denumerabilidad en topología ". [4] [5] [6]

Durante la Segunda Guerra Mundial , Tukey trabajó en la Oficina de Investigación de Control de Fuego y colaboró ​​con Samuel Wilks y William Cochran . Se dice que ayudó a diseñar el avión espía U-2. Después de la guerra, regresó a Princeton, dividiendo su tiempo entre la universidad y los Laboratorios Bell de AT&T . En 1962, Tukey fue elegido miembro de la Sociedad Filosófica Estadounidense . [7] Se convirtió en profesor titular a los 35 años y presidente fundador del departamento de estadísticas de Princeton en 1965. [3]

Entre sus muchas contribuciones a la sociedad civil , Tukey formó parte de un comité de la Asociación Estadounidense de Estadística que produjo un informe que criticaba la metodología estadística del Informe Kinsey , Problemas estadísticos del Informe Kinsey sobre el comportamiento sexual en el varón humano , que resumía: "Una selección aleatoria de tres personas habría sido mejor que un grupo de 300 elegidos por el Sr. Kinsey".

Entre 1960 y 1980, Tukey colaboró ​​en el diseño de las encuestas de la cadena de televisión NBC utilizadas para predecir y analizar las elecciones. También fue consultor del Educational Testing Service, de la Xerox Corporation y de Merck & Company.

Durante la década de 1970 y principios de la de 1980, Tukey jugó un papel clave en el diseño y la realización de la Evaluación Nacional del Progreso Educativo .

Fue galardonado con la Medalla Nacional de Ciencias por el presidente Nixon en 1973. [3] Fue galardonado con la Medalla de Honor IEEE en 1982 "por sus contribuciones al análisis espectral de procesos aleatorios y el algoritmo de transformada rápida de Fourier (FFT) ".

Tukey se retiró en 1985. Murió en New Brunswick, Nueva Jersey , el 26 de julio de 2000.

Contribuciones científicas

Al principio de su carrera, Tukey trabajó en el desarrollo de métodos estadísticos para computadoras en Bell Labs , donde inventó el término bit en 1947. [8] [9] [10]

Sus intereses estadísticos eran muchos y variados. Se le recuerda especialmente por su desarrollo, junto con James Cooley, del algoritmo Cooley–Tukey FFT . En 1970, contribuyó significativamente a lo que hoy se conoce como jackknife (también denominado Quenouille–Tukey jackknife). Introdujo el diagrama de cajas en su libro de 1977, "Exploratory Data Analysis".

La prueba de rango de Tukey , la distribución lambda de Tukey , la prueba de aditividad de Tukey , el lema de Tukey y la ventana de Tukey llevan su nombre. También es el creador de varios métodos poco conocidos, como la trimeana y la línea mediana-mediana , una alternativa más sencilla a la regresión lineal .

En 1974, desarrolló, junto con Jerome H. Friedman , el concepto de búsqueda de proyección . [11]

Análisis de datos y fundamentos de la ciencia de datos

John Tukey contribuyó enormemente a la práctica estadística y al análisis de datos en general. De hecho, algunos consideran a John Tukey como el padre de la ciencia de datos. Como mínimo, fue pionero en muchos de los fundamentos clave de lo que luego se conocería como ciencia de datos. [12]

La interpretación de los datos tiene una larga historia y ha sido abordada por estadísticos, matemáticos, científicos y otros durante muchos años. Durante la década de 1960, Tukey desafió el predominio en ese momento de lo que él llamó "análisis confirmatorio de datos", análisis estadísticos impulsados ​​por configuraciones matemáticas rígidas. [13] Tukey enfatizó la importancia de tener una actitud más flexible hacia el análisis de datos y de explorar los datos cuidadosamente para ver qué estructuras e información podrían contener. A esto lo llamó "análisis exploratorio de datos" (EDA). En muchos sentidos, el EDA fue un precursor de la ciencia de datos.

Tukey también se dio cuenta de la importancia de la informática para el análisis de datos mediante ecuaciones diferenciales. Los gráficos son una parte integral de la metodología de análisis de datos mediante ecuaciones diferenciales y, si bien gran parte del trabajo de Tukey se centró en presentaciones estáticas (como diagramas de cajas) que se podían dibujar a mano, se dio cuenta de que los gráficos de computadora serían mucho más efectivos para estudiar datos multivariados. PRIM-9, el primer programa para visualizar datos multivariados, fue concebido por él a principios de la década de 1970. [14]

Esta combinación de análisis de datos y ciencia informática es lo que ahora se llama ciencia de datos.

Tukey articuló la importante distinción entre análisis exploratorio de datos y análisis confirmatorio de datos , creyendo que gran parte de la metodología estadística ponía demasiado énfasis en este último. Aunque creía en la utilidad de separar los dos tipos de análisis, señaló que a veces, especialmente en las ciencias naturales , esto era problemático y calificó esas situaciones como ciencia incómoda .

AD Gordon ofreció el siguiente resumen de los principios de Tukey para la práctica estadística: [15]

... la utilidad y limitación de las estadísticas matemáticas; la importancia de tener métodos de análisis estadístico que sean robustos a las violaciones de los supuestos que subyacen a su uso; la necesidad de acumular experiencia sobre el comportamiento de métodos específicos de análisis para proporcionar orientación sobre su uso; la importancia de permitir la posibilidad de que los datos influyan en la elección del método por el cual se analizan; la necesidad de que los estadísticos rechacen el papel de "guardián de la verdad probada" y resistan los intentos de proporcionar soluciones de una vez por todas y sobreunificaciones ordenadas del tema; la naturaleza iterativa del análisis de datos; las implicaciones del aumento del poder, la disponibilidad y el bajo costo de las instalaciones informáticas; la formación de los estadísticos.

Las conferencias de Tukey fueron descritas como inusuales. McCullagh describió su conferencia dada en Londres en 1977: [15] [16]

Tukey se acercó al podio, un hombre enorme vestido con pantalones anchos y una camisa de punto negra. En algún momento podrían haber sido un par a juego, pero la antigüedad era tal que era difícil saberlo. ... Cuidadosa y deliberadamente, se escribió una lista de títulos en la pizarra. Las palabras también llegaron, no muchas, como paquetes con exceso de peso, entregados a un ritmo lento y constante. ... Cuando terminó, Tukey se volvió hacia el público y el podio... "¿Comentarios, preguntas, sugerencias?", preguntó al público... Mientras esperaba una respuesta, trepó al podio y maniobró hasta que estuvo sentado con las piernas cruzadas frente al público. ... Nosotros, en el público, nos sentamos como espectadores en el zoológico esperando que el gran oso se moviera o dijera algo. Pero el gran oso parecía estar haciendo lo mismo, y la sensación no era cómoda.

Acuñación del términopoco

Mientras trabajaba con John von Neumann en los primeros diseños de computadoras, Tukey introdujo la palabra bit como un acrónimo de dígito binario . [17] El término bit fue utilizado por primera vez en un artículo de Claude Shannon en 1948.

Véase también

Publicaciones

Obras completas de John W. Tukey , editadas por William S. Cleveland
Acerca de John Tukey

Referencias

  1. ^ de John Tukey en el Proyecto de Genealogía Matemática
  2. ^ Sande, Gordon (julio de 2001). "Obituario: John Wilder Tukey". Physics Today . 54 (7): 80–81. doi : 10.1063/1.1397408 .
  3. ^ abc Leonhardt, David (28 de julio de 2000). "John Tukey, 85, estadístico; acuñó la palabra 'software'". New York Times . Consultado el 24 de septiembre de 2012 .
  4. ^ "John Tukey". Proyecto de genealogía matemática . Consultado el 2 de julio de 2022 .
  5. ^ Tukey, John W. (1939). Sobre la numerabilidad en topología.
  6. ^ "John Tukey". IEEE Global History Network . IEEE . Consultado el 18 de julio de 2011 .
  7. ^ "Historial de miembros de la APS". search.amphilsoc.org . Consultado el 28 de enero de 2021 .
  8. ^ Shannon, Claude Elwood (julio de 1948). "Una teoría matemática de la comunicación" (PDF) . Bell System Technical Journal . 27 (3): 379–423. doi :10.1002/j.1538-7305.1948.tb01338.x. hdl : 11858/00-001M-0000-002C-4314-2 . Archivado desde el original (PDF) el 15 de julio de 1998. La elección de una base logarítmica corresponde a la elección de una unidad para medir la información. Si se utiliza la base 2, las unidades resultantes pueden llamarse dígitos binarios o, más brevemente, bits , una palabra sugerida por JW Tukey.
  9. ^ Shannon, Claude Elwood (octubre de 1948). "Una teoría matemática de la comunicación". Bell System Technical Journal . 27 (4): 623–666. doi :10.1002/j.1538-7305.1948.tb00917.x. hdl : 11858/00-001M-0000-002C-4314-2 .
  10. ^ Shannon, Claude Elwood ; Weaver, Warren (1949). Una teoría matemática de la comunicación (PDF) . University of Illinois Press . ISBN 0-252-72548-4. Archivado desde el original (PDF) el 15 de julio de 1998.
  11. ^ Friedman, Jerome H. ; Tukey, John Wilder (septiembre de 1974). "Un algoritmo de búsqueda de proyección para el análisis exploratorio de datos". IEEE Transactions on Computers . C-23 (9): 881–890. doi :10.1109/TC.1974.224051. ISSN  0018-9340. OSTI  1442925. S2CID  7997450.
  12. ^ David Donoho (2017), 50 años de ciencia de datos, Journal of Computational and Graphical Statistics, 2017, https://doi.org/10.1080/10618600.2017.1384734
  13. ^ John W. Tukey (1962) El futuro del análisis de datos. Ann. Math. Statist. 33(1): 1-67. DOI: 10.1214/aoms/1177704711.
  14. ^ Friedman, JH y Stuetzle, W. (2002). El trabajo de John W. Tukey sobre gráficos interactivos. Annals of Statistics, 30(6), 1629-1639. http://www.jstor.org/stable/1558733
  15. ^ ab "John Tukey - Biografía". Historia de las matemáticas . Consultado el 18 de febrero de 2022 .
  16. ^ P McCullagh, John Wilder Tukey, Memorias biográficas de miembros de la Royal Society 49 (2003), 538-559.
  17. ^ "Definición de bit por The Linux Information Project (LINFO)". www.linfo.org .
  18. ^ Talbot, M. (junio de 2000). Biometrics . 56 (2): 649–650. doi :10.1111/j.0006-341X.2000.00647.x. JSTOR  2677019.{{cite journal}}: CS1 maint: publicación periódica sin título ( enlace )
  19. ^ Cooper, Mark (julio-agosto de 2000). Crop Science . 40 (4): 1184. doi :10.2135/cropsci2000.0015br.{{cite journal}}: CS1 maint: publicación periódica sin título ( enlace )
  20. ^ Heckler, Charles E. (febrero de 2001). Technometrics . 43 (1): 97–98. doi :10.1198/tech.2001.s547. JSTOR  1270862. S2CID  26430218.{{cite journal}}: CS1 maint: publicación periódica sin título ( enlace )
  21. ^ Broadfoot, L. (junio de 2001). The Journal of Agricultural Science . 136 (4): 471–475. doi :10.1017/s002185960124893x. S2CID  86230606.{{cite journal}}: CS1 maint: publicación periódica sin título ( enlace )

Enlaces externos