John Wilder Tukey ( 16 de junio de 1915 - 26 de julio de 2000) fue un matemático y estadístico estadounidense , más conocido por el desarrollo del algoritmo de la transformada rápida de Fourier (FFT) y el diagrama de caja . [ 2 ] La prueba de rango de Tukey , la distribución lambda de Tukey , la prueba de aditividad de Tukey y el lema de Teichmüller-Tukey llevan su nombre. También se le atribuye la invención del término bit y el primer uso publicado de la palabra software .
Tukey nació en New Bedford, Massachusetts , en 1915, hijo de un profesor de latín y de un tutor privado. Recibió principalmente clases de su madre y asistió a clases regulares solo para ciertas materias como francés. [3] Tukey obtuvo una licenciatura en 1936 y una maestría en 1937 en química, de la Universidad de Brown , antes de trasladarse a la Universidad de Princeton , donde en 1939 recibió un doctorado en matemáticas después de completar una disertación doctoral titulada "Sobre la denumerabilidad en topología ". [4] [5] [6]
Durante la Segunda Guerra Mundial , Tukey trabajó en la Oficina de Investigación de Control de Fuego y colaboró con Samuel Wilks y William Cochran . Se dice que ayudó a diseñar el avión espía U-2. Después de la guerra, regresó a Princeton, dividiendo su tiempo entre la universidad y los Laboratorios Bell de AT&T . En 1962, Tukey fue elegido miembro de la Sociedad Filosófica Estadounidense . [7] Se convirtió en profesor titular a los 35 años y presidente fundador del departamento de estadísticas de Princeton en 1965. [3]
Entre sus muchas contribuciones a la sociedad civil , Tukey formó parte de un comité de la Asociación Estadounidense de Estadística que produjo un informe que criticaba la metodología estadística del Informe Kinsey , Problemas estadísticos del Informe Kinsey sobre el comportamiento sexual en el varón humano , que resumía: "Una selección aleatoria de tres personas habría sido mejor que un grupo de 300 elegidos por el Sr. Kinsey".
Entre 1960 y 1980, Tukey colaboró en el diseño de las encuestas de la cadena de televisión NBC utilizadas para predecir y analizar las elecciones. También fue consultor del Educational Testing Service, de la Xerox Corporation y de Merck & Company.
Durante la década de 1970 y principios de la de 1980, Tukey jugó un papel clave en el diseño y la realización de la Evaluación Nacional del Progreso Educativo .
Fue galardonado con la Medalla Nacional de Ciencias por el presidente Nixon en 1973. [3] Fue galardonado con la Medalla de Honor IEEE en 1982 "por sus contribuciones al análisis espectral de procesos aleatorios y el algoritmo de transformada rápida de Fourier (FFT) ".
Tukey se retiró en 1985. Murió en New Brunswick, Nueva Jersey , el 26 de julio de 2000.
Al principio de su carrera, Tukey trabajó en el desarrollo de métodos estadísticos para computadoras en Bell Labs , donde inventó el término bit en 1947. [8] [9] [10]
Sus intereses estadísticos eran muchos y variados. Se le recuerda especialmente por su desarrollo, junto con James Cooley, del algoritmo Cooley–Tukey FFT . En 1970, contribuyó significativamente a lo que hoy se conoce como jackknife (también denominado Quenouille–Tukey jackknife). Introdujo el diagrama de cajas en su libro de 1977, "Exploratory Data Analysis".
La prueba de rango de Tukey , la distribución lambda de Tukey , la prueba de aditividad de Tukey , el lema de Tukey y la ventana de Tukey llevan su nombre. También es el creador de varios métodos poco conocidos, como la trimeana y la línea mediana-mediana , una alternativa más sencilla a la regresión lineal .
En 1974, desarrolló, junto con Jerome H. Friedman , el concepto de búsqueda de proyección . [11]
John Tukey contribuyó enormemente a la práctica estadística y al análisis de datos en general. De hecho, algunos consideran a John Tukey como el padre de la ciencia de datos. Como mínimo, fue pionero en muchos de los fundamentos clave de lo que luego se conocería como ciencia de datos. [12]
La interpretación de los datos tiene una larga historia y ha sido abordada por estadísticos, matemáticos, científicos y otros durante muchos años. Durante la década de 1960, Tukey desafió el predominio en ese momento de lo que él llamó "análisis confirmatorio de datos", análisis estadísticos impulsados por configuraciones matemáticas rígidas. [13] Tukey enfatizó la importancia de tener una actitud más flexible hacia el análisis de datos y de explorar los datos cuidadosamente para ver qué estructuras e información podrían contener. A esto lo llamó "análisis exploratorio de datos" (EDA). En muchos sentidos, el EDA fue un precursor de la ciencia de datos.
Tukey también se dio cuenta de la importancia de la informática para el análisis de datos mediante ecuaciones diferenciales. Los gráficos son una parte integral de la metodología de análisis de datos mediante ecuaciones diferenciales y, si bien gran parte del trabajo de Tukey se centró en presentaciones estáticas (como diagramas de cajas) que se podían dibujar a mano, se dio cuenta de que los gráficos de computadora serían mucho más efectivos para estudiar datos multivariados. PRIM-9, el primer programa para visualizar datos multivariados, fue concebido por él a principios de la década de 1970. [14]
Esta combinación de análisis de datos y ciencia informática es lo que ahora se llama ciencia de datos.
Tukey articuló la importante distinción entre análisis exploratorio de datos y análisis confirmatorio de datos , creyendo que gran parte de la metodología estadística ponía demasiado énfasis en este último. Aunque creía en la utilidad de separar los dos tipos de análisis, señaló que a veces, especialmente en las ciencias naturales , esto era problemático y calificó esas situaciones como ciencia incómoda .
AD Gordon ofreció el siguiente resumen de los principios de Tukey para la práctica estadística: [15]
... la utilidad y limitación de las estadísticas matemáticas; la importancia de tener métodos de análisis estadístico que sean robustos a las violaciones de los supuestos que subyacen a su uso; la necesidad de acumular experiencia sobre el comportamiento de métodos específicos de análisis para proporcionar orientación sobre su uso; la importancia de permitir la posibilidad de que los datos influyan en la elección del método por el cual se analizan; la necesidad de que los estadísticos rechacen el papel de "guardián de la verdad probada" y resistan los intentos de proporcionar soluciones de una vez por todas y sobreunificaciones ordenadas del tema; la naturaleza iterativa del análisis de datos; las implicaciones del aumento del poder, la disponibilidad y el bajo costo de las instalaciones informáticas; la formación de los estadísticos.
Las conferencias de Tukey fueron descritas como inusuales. McCullagh describió su conferencia dada en Londres en 1977: [15] [16]
Tukey se acercó al podio, un hombre enorme vestido con pantalones anchos y una camisa de punto negra. En algún momento podrían haber sido un par a juego, pero la antigüedad era tal que era difícil saberlo. ... Cuidadosa y deliberadamente, se escribió una lista de títulos en la pizarra. Las palabras también llegaron, no muchas, como paquetes con exceso de peso, entregados a un ritmo lento y constante. ... Cuando terminó, Tukey se volvió hacia el público y el podio... "¿Comentarios, preguntas, sugerencias?", preguntó al público... Mientras esperaba una respuesta, trepó al podio y maniobró hasta que estuvo sentado con las piernas cruzadas frente al público. ... Nosotros, en el público, nos sentamos como espectadores en el zoológico esperando que el gran oso se moviera o dijera algo. Pero el gran oso parecía estar haciendo lo mismo, y la sensación no era cómoda.
Mientras trabajaba con John von Neumann en los primeros diseños de computadoras, Tukey introdujo la palabra bit como un acrónimo de dígito binario . [17] El término bit fue utilizado por primera vez en un artículo de Claude Shannon en 1948.
La elección de una base logarítmica corresponde a la elección de una unidad para medir la información. Si se utiliza la base 2, las unidades resultantes pueden llamarse dígitos binarios o, más brevemente,
bits
, una palabra sugerida por JW Tukey.
{{cite journal}}
: CS1 maint: publicación periódica sin título ( enlace ){{cite journal}}
: CS1 maint: publicación periódica sin título ( enlace ){{cite journal}}
: CS1 maint: publicación periódica sin título ( enlace ){{cite journal}}
: CS1 maint: publicación periódica sin título ( enlace )