John Wilder Tukey ( / ˈt uː k i / ; 16 de junio de 1915 - 26 de julio de 2000) fue un matemático y estadístico estadounidense , mejor conocido por el desarrollo del algoritmo de transformada rápida de Fourier (FFT) y el diagrama de caja . [2] La prueba de rango de Tukey , la distribución lambda de Tukey , la prueba de aditividad de Tukey y el lema de Teichmüller-Tukey llevan su nombre. También se le atribuye haber acuñado el término bit y el primer uso publicado de la palabra software .
Tukey nació en New Bedford, Massachusetts , en 1915, de padre profesor de latín y tutor privado. Su madre le enseñaba principalmente y asistía a clases regulares sólo para determinadas materias como el francés. [3] Tukey obtuvo una licenciatura en 1936 y una maestría en 1937 en química, de la Universidad de Brown , antes de trasladarse a la Universidad de Princeton , donde en 1939 recibió un doctorado en matemáticas después de completar una tesis doctoral titulada "Sobre la numerabilidad en topología ". [4] [5] [6]
Durante la Segunda Guerra Mundial , Tukey trabajó en la Oficina de Investigación de Control de Incendios y colaboró con Samuel Wilks y William Cochran . Se afirma que ayudó a diseñar el avión espía U-2. Después de la guerra, regresó a Princeton, dividiendo su tiempo entre la universidad y los Laboratorios AT&T Bell . En 1962, Tukey fue elegido miembro de la Sociedad Filosófica Estadounidense . [7] Se convirtió en profesor titular a los 35 años y presidente fundador del departamento de estadística de Princeton en 1965. [3]
Entre muchas contribuciones a la sociedad civil , Tukey formó parte de un comité de la Asociación Estadounidense de Estadística que produjo un informe criticando la metodología estadística del Informe Kinsey , Problemas estadísticos del Informe Kinsey sobre el comportamiento sexual en el hombre humano , que resumió "Una selección aleatoria de tres personas hubiera sido mejor que un grupo de 300 elegidos por el Sr. Kinsey".
De 1960 a 1980, Tukey ayudó a diseñar las encuestas de la cadena de televisión NBC utilizadas para predecir y analizar elecciones. También fue consultor del Educational Testing Service, Xerox Corporation y Merck & Company.
Durante la década de 1970 y principios de la de 1980, Tukey jugó un papel clave en el diseño y realización de la Evaluación Nacional del Progreso Educativo .
El presidente Nixon le concedió la Medalla Nacional de Ciencias en 1973. [3] Fue galardonado con la Medalla de Honor del IEEE en 1982 "Por sus contribuciones al análisis espectral de procesos aleatorios y al algoritmo de transformada rápida de Fourier (FFT) ".
Tukey se jubiló en 1985. Murió en New Brunswick, Nueva Jersey , el 26 de julio de 2000.
Al principio de su carrera, Tukey trabajó en el desarrollo de métodos estadísticos para computadoras en Bell Labs , donde inventó el término bit en 1947. [8] [9] [10]
Sus intereses estadísticos eran muchos y variados. Es particularmente recordado por su desarrollo con James Cooley del algoritmo Cooley-Tukey FFT . En 1970, contribuyó significativamente a lo que hoy se conoce como la navaja , también denominada navaja Quenouille-Tukey. Introdujo el diagrama de caja en su libro de 1977, "Análisis de datos exploratorios".
La prueba de rango de Tukey , la distribución lambda de Tukey , la prueba de aditividad de Tukey , el lema de Tukey y la ventana de Tukey llevan su nombre. También es el creador de varios métodos poco conocidos como el trimean y la línea mediana-mediana , una alternativa más sencilla a la regresión lineal .
En 1974 desarrolló, con Jerome H. Friedman , el concepto de búsqueda de proyección . [11]
John Tukey contribuyó en gran medida a la práctica estadística y al análisis de datos en general. De hecho, algunos consideran a John Tukey como el padre de la ciencia de datos. Como mínimo, fue pionero en muchos de los fundamentos clave de lo que más tarde se conocería como ciencia de datos. [12]
Dar sentido a los datos tiene una larga historia y ha sido abordado por estadísticos, matemáticos, científicos y otros durante muchos años. Durante la década de 1960, Tukey desafió el dominio en ese momento de lo que llamó "análisis de datos confirmatorios", análisis estadísticos impulsados por configuraciones matemáticas rígidas. [13] Tukey enfatizó la importancia de tener una actitud más flexible hacia el análisis de datos y de explorar los datos cuidadosamente para ver qué estructuras e información podrían contener. A esto lo llamó "análisis de datos exploratorios" (EDA). En muchos sentidos, EDA fue un precursor de la ciencia de datos.
Tukey también se dio cuenta de la importancia de la informática para EDA. Los gráficos son una parte integral de la metodología EDA y, si bien gran parte del trabajo de Tukey se centró en presentaciones estáticas (como diagramas de caja) que podían dibujarse a mano, se dio cuenta de que los gráficos por computadora serían mucho más efectivos para estudiar datos multivariados. PRIM-9, el primer programa para visualizar datos multivariados, fue concebido por él a principios de los años 1970. [14]
Esta combinación de análisis de datos e informática es lo que ahora se llama ciencia de datos.
Tukey articuló la importante distinción entre análisis de datos exploratorios y análisis de datos confirmatorios , creyendo que gran parte de la metodología estadística ponía demasiado énfasis en este último. Aunque creía en la utilidad de separar los dos tipos de análisis, señaló que a veces, especialmente en las ciencias naturales , esto era problemático y denominó tales situaciones ciencia incómoda .
AD Gordon ofreció el siguiente resumen de los principios de Tukey para la práctica estadística: [15]
... la utilidad y limitación de la estadística matemática; la importancia de contar con métodos de análisis estadístico que sean resistentes a las violaciones de los supuestos subyacentes a su uso; la necesidad de acumular experiencia sobre el comportamiento de métodos de análisis específicos para proporcionar orientación sobre su uso; la importancia de permitir la posibilidad de que los datos influyan en la elección del método mediante el cual se analizan; la necesidad de que los estadísticos rechacen el papel de "guardianes de la verdad comprobada" y se resistan a los intentos de proporcionar soluciones únicas y sobreunificaciones ordenadas del tema; la naturaleza iterativa del análisis de datos; implicaciones del creciente poder, disponibilidad y bajo costo de las instalaciones informáticas; la formación de estadísticos.
Las conferencias de Tukey fueron descritas como inusuales. McCullagh describió su conferencia pronunciada en Londres en 1977: [15] [16]
Tukey subió al podio, un hombre enorme y oso vestido con pantalones holgados y una camisa de punto negra. Es posible que alguna vez hayan sido un par a juego, pero la antigüedad era tal que era difícil saberlo. ... Cuidadosa y deliberadamente se escribió con tiza en la pizarra una lista de títulos. Las palabras también llegaron, no muchas, como paquetes con sobrepeso, entregados a un ritmo lento e inquebrantable. ... Cuando estuvo completo, Tukey se volvió hacia el público y el podio... "¿Comentarios, consultas, sugerencias?" preguntó al público... Mientras esperaba una respuesta, subió al podio y maniobró hasta quedar sentado con las piernas cruzadas frente al público. ... Nosotros, entre el público, estábamos sentados como espectadores en el zoológico, esperando que el gran oso se moviera o dijera algo. Pero el gran oso parecía estar haciendo lo mismo y la sensación no era cómoda.
Mientras trabajaba con John von Neumann en los primeros diseños de computadoras, Tukey introdujo la palabra bit como un acrónimo de dígito binario . [17] El término bit se utilizó por primera vez en un artículo de Claude Shannon en 1948.
La elección de una base logarítmica corresponde a la elección de una unidad para medir la información. Si se utiliza la base 2, las unidades resultantes pueden denominarse dígitos binarios, o más brevemente
bits
, palabra sugerida por JW Tukey.
{{cite journal}}
: Mantenimiento CS1: publicación periódica sin título ( enlace ){{cite journal}}
: Mantenimiento CS1: publicación periódica sin título ( enlace ){{cite journal}}
: Mantenimiento CS1: publicación periódica sin título ( enlace ){{cite journal}}
: Mantenimiento CS1: publicación periódica sin título ( enlace )