stringtranslate.com

John Tukey

John Wilder Tukey ( / ˈt k i / ; 16 de junio de 1915 - 26 de julio de 2000) fue un matemático y estadístico estadounidense , mejor conocido por el desarrollo del algoritmo de transformada rápida de Fourier (FFT) y el diagrama de caja . [2] La prueba de rango de Tukey , la distribución lambda de Tukey , la prueba de aditividad de Tukey y el lema de Teichmüller-Tukey llevan su nombre. También se le atribuye haber acuñado el término bit y el primer uso publicado de la palabra software .

Biografía

Tukey nació en New Bedford, Massachusetts , en 1915, de padre profesor de latín y tutor privado. Su madre le enseñaba principalmente y asistía a clases regulares sólo para determinadas materias como el francés. [3] Tukey obtuvo una licenciatura en 1936 y una maestría en química en 1937, de la Universidad de Brown , antes de trasladarse a la Universidad de Princeton , donde en 1939 recibió un doctorado en matemáticas después de completar una tesis doctoral titulada "Sobre la numerabilidad en topología ". [4] [5] [6]

Durante la Segunda Guerra Mundial , Tukey trabajó en la Oficina de Investigación de Control de Incendios y colaboró ​​con Samuel Wilks y William Cochran . Se afirma que ayudó a diseñar el avión espía U-2. Después de la guerra, regresó a Princeton, dividiendo su tiempo entre la universidad y los Laboratorios AT&T Bell . En 1962, Tukey fue elegido miembro de la Sociedad Filosófica Estadounidense . [7] Se convirtió en profesor titular a los 35 años y presidente fundador del departamento de estadística de Princeton en 1965. [3]

Entre muchas contribuciones a la sociedad civil , Tukey formó parte de un comité de la Asociación Estadounidense de Estadística que produjo un informe criticando la metodología estadística del Informe Kinsey , Problemas estadísticos del Informe Kinsey sobre el comportamiento sexual en el hombre humano , que resumió "Una selección aleatoria de tres personas hubiera sido mejor que un grupo de 300 elegidos por el Sr. Kinsey".

De 1960 a 1980, Tukey ayudó a diseñar las encuestas de la cadena de televisión NBC utilizadas para predecir y analizar elecciones. También fue consultor del Educational Testing Service, Xerox Corporation y Merck & Company.

Durante la década de 1970 y principios de la de 1980, Tukey jugó un papel clave en el diseño y realización de la Evaluación Nacional del Progreso Educativo .

El presidente Nixon le concedió la Medalla Nacional de Ciencias en 1973. [3] Le concedieron la Medalla de Honor del IEEE en 1982 "Por sus contribuciones al análisis espectral de procesos aleatorios y al algoritmo de transformada rápida de Fourier (FFT) ".

Tukey se jubiló en 1985. Murió en New Brunswick, Nueva Jersey , el 26 de julio de 2000.

Contribuciones científicas

Al principio de su carrera, Tukey trabajó en el desarrollo de métodos estadísticos para computadoras en Bell Labs , donde inventó el término bit en 1947. [8] [9] [10]

Sus intereses estadísticos eran muchos y variados. Es particularmente recordado por su desarrollo con James Cooley del algoritmo Cooley-Tukey FFT . En 1970, contribuyó significativamente a lo que hoy se conoce como la navaja , también denominada navaja Quenouille-Tukey. Introdujo el diagrama de caja en su libro de 1977, "Análisis de datos exploratorios".

La prueba de rango de Tukey , la distribución lambda de Tukey , la prueba de aditividad de Tukey , el lema de Tukey y la ventana de Tukey llevan su nombre. También es el creador de varios métodos poco conocidos como el trimean y la línea mediana-mediana , una alternativa más sencilla a la regresión lineal .

En 1974 desarrolló, con Jerome H. Friedman , el concepto de búsqueda de proyección . [11]

Análisis de datos y fundamentos de la ciencia de datos.

John Tukey contribuyó en gran medida a la práctica estadística y al análisis de datos en general. De hecho, algunos consideran a John Tukey como el padre de la ciencia de datos. Como mínimo, fue pionero en muchos de los fundamentos clave de lo que más tarde se conocería como ciencia de datos. [12]

Dar sentido a los datos tiene una larga historia y ha sido abordado por estadísticos, matemáticos, científicos y otros durante muchos años. Durante la década de 1960, Tukey desafió el dominio en ese momento de lo que llamó "análisis de datos confirmatorios", análisis estadísticos impulsados ​​por configuraciones matemáticas rígidas. [13] Tukey enfatizó la importancia de tener una actitud más flexible hacia el análisis de datos y de explorar los datos cuidadosamente para ver qué estructuras e información podrían contener. A esto lo llamó "análisis de datos exploratorios" (EDA). En muchos sentidos, EDA fue un precursor de la ciencia de datos.

Tukey también se dio cuenta de la importancia de la informática para EDA. Los gráficos son una parte integral de la metodología EDA y, si bien gran parte del trabajo de Tukey se centró en presentaciones estáticas (como diagramas de caja) que podían dibujarse a mano, se dio cuenta de que los gráficos por computadora serían mucho más efectivos para estudiar datos multivariados. PRIM-9, el primer programa para visualizar datos multivariados, fue concebido por él a principios de los años 1970. [14]

Esta combinación de análisis de datos e informática es lo que ahora se llama ciencia de datos.

Tukey articuló la importante distinción entre análisis de datos exploratorios y análisis de datos confirmatorios , creyendo que gran parte de la metodología estadística ponía demasiado énfasis en este último. Aunque creía en la utilidad de separar los dos tipos de análisis, señaló que a veces, especialmente en las ciencias naturales , esto era problemático y denominó tales situaciones ciencia incómoda .

AD Gordon ofreció el siguiente resumen de los principios de Tukey para la práctica estadística: [15]

... la utilidad y limitación de la estadística matemática; la importancia de contar con métodos de análisis estadístico que sean resistentes a las violaciones de los supuestos subyacentes a su uso; la necesidad de acumular experiencia sobre el comportamiento de métodos de análisis específicos para proporcionar orientación sobre su uso; la importancia de permitir la posibilidad de que los datos influyan en la elección del método mediante el cual se analizan; la necesidad de que los estadísticos rechacen el papel de "guardianes de la verdad comprobada" y se resistan a los intentos de proporcionar soluciones únicas y sobreunificaciones ordenadas del tema; la naturaleza iterativa del análisis de datos; implicaciones del creciente poder, disponibilidad y bajo costo de las instalaciones informáticas; la formación de estadísticos.

Las conferencias de Tukey fueron descritas como inusuales. McCullagh describió su conferencia pronunciada en Londres en 1977: [15] [16]

Tukey subió al podio, un hombre enorme y oso vestido con pantalones holgados y una camisa de punto negra. Es posible que alguna vez hayan sido un par a juego, pero la antigüedad era tal que era difícil saberlo. ... Cuidadosa y deliberadamente se escribió con tiza una lista de títulos en la pizarra. Las palabras también llegaron, no muchas, como paquetes con sobrepeso, entregados a un ritmo lento e inquebrantable. ... Cuando estuvo completo, Tukey se volvió hacia el público y el podio... "¿Comentarios, consultas, sugerencias?" preguntó al público... Mientras esperaba una respuesta, subió al podio y maniobró hasta quedar sentado con las piernas cruzadas frente al público. ... Nosotros, entre el público, estábamos sentados como espectadores en el zoológico, esperando que el gran oso se moviera o dijera algo. Pero el gran oso parecía estar haciendo lo mismo y la sensación no era cómoda.

Acuñando el término bit

Mientras trabajaba con John von Neumann en los primeros diseños de computadoras, Tukey introdujo la palabra bit como un acrónimo de dígito binario . [17] El término bit se utilizó por primera vez en un artículo de Claude Shannon en 1948.

Ver también

Publicaciones

Las obras completas de John W Tukey , editadas por William S. Cleveland
Acerca de John Tukey

Referencias

  1. ^ ab John Tukey en el Proyecto de genealogía de matemáticas
  2. ^ Sande, Gordon (julio de 2001). "Obituario: John Wilder Tukey". Física hoy . 54 (7): 80–81. doi : 10.1063/1.1397408 .
  3. ^ abc Leonhardt, David (28 de julio de 2000). "John Tukey, 85 años, estadístico; acuñó la palabra 'software'". New York Times . Consultado el 24 de septiembre de 2012 .
  4. ^ "John Tukey". Proyecto Genealogía Matemática . Consultado el 2 de julio de 2022 .
  5. ^ Tukey, John W. (1939). Sobre la numerabilidad en topología.
  6. ^ "John Tukey". Red de Historia Global IEEE . IEEE . Consultado el 18 de julio de 2011 .
  7. ^ "Historial de miembros de APS". búsqueda.amphilsoc.org . Consultado el 28 de enero de 2021 .
  8. ^ Shannon, Claude Elwood (julio de 1948). "Una teoría matemática de la comunicación" (PDF) . Revista técnica del sistema Bell . 27 (3): 379–423. doi :10.1002/j.1538-7305.1948.tb01338.x. hdl : 11858/00-001M-0000-002C-4314-2 . Archivado desde el original (PDF) el 15 de julio de 1998. La elección de una base logarítmica corresponde a la elección de una unidad para medir la información. Si se utiliza la base 2, las unidades resultantes pueden denominarse dígitos binarios o, más brevemente, bits , palabra sugerida por JW Tukey.
  9. ^ Shannon, Claude Elwood (octubre de 1948). "Una teoría matemática de la comunicación". Revista técnica del sistema Bell . 27 (4): 623–666. doi :10.1002/j.1538-7305.1948.tb00917.x. hdl : 11858/00-001M-0000-002C-4314-2 .
  10. ^ Shannon, Claude Elwood ; Tejedor, Warren (1949). Una teoría matemática de la comunicación (PDF) . Prensa de la Universidad de Illinois . ISBN 0-252-72548-4. Archivado desde el original (PDF) el 15 de julio de 1998.
  11. ^ Friedman, Jerome H .; Tukey, John Wilder (septiembre de 1974). "Un algoritmo de búsqueda de proyección para el análisis de datos exploratorios". Transacciones IEEE en computadoras . C-23 (9): 881–890. doi :10.1109/TC.1974.224051. ISSN  0018-9340. OSTI  1442925. S2CID  7997450.
  12. ^ David Donoho (2017), 50 años de ciencia de datos, Revista de estadística gráfica y computacional, 2017, https://doi.org/10.1080/10618600.2017.1384734
  13. ^ John W. Tukey (1962) El futuro del análisis de datos. Ana. Matemáticas. Estadístico. 33(1): 1-67. DOI: 10.1214/aoms/1177704711.
  14. ^ Friedman, JH y Stuetzle, W. (2002). Trabajo de John W. Tukey sobre gráficos interactivos. Anales de estadística, 30 (6), 1629-1639. http://www.jstor.org/stable/1558733
  15. ^ ab "John Tukey - Biografía". Historia de las Matemáticas . Consultado el 18 de febrero de 2022 .
  16. ^ P McCullagh, John Wilder Tukey, Memorias biográficas de miembros de la Royal Society 49 (2003), 538-559.
  17. ^ "Definición de bits por The Linux Information Project (LINFO)". www.linfo.org .
  18. ^ Talbot, M. (junio de 2000). Biometría . 56 (2): 649–650. doi :10.1111/j.0006-341X.2000.00647.x. JSTOR  2677019.{{cite journal}}: Mantenimiento CS1: publicación periódica sin título ( enlace )
  19. ^ Cooper, Mark (julio-agosto de 2000). Ciencia de los cultivos . 40 (4): 1184. doi :10.2135/cropsci2000.0015br.{{cite journal}}: Mantenimiento CS1: publicación periódica sin título ( enlace )
  20. ^ Heckler, Charles E. (febrero de 2001). Tecnometría . 43 (1): 97–98. doi :10.1198/tech.2001.s547. JSTOR  1270862. S2CID  26430218.{{cite journal}}: Mantenimiento CS1: publicación periódica sin título ( enlace )
  21. ^ Broadfoot, L. (junio de 2001). La Revista de Ciencias Agrícolas . 136 (4): 471–475. doi :10.1017/s002185960124893x. S2CID  86230606.{{cite journal}}: Mantenimiento CS1: publicación periódica sin título ( enlace )

enlaces externos