Hipótesis nula

En la investigación científica , la hipótesis nula (a menudo denominada H ₀ ) ^[1] es la afirmación de que el efecto que se está estudiando no existe. Tenga en cuenta que el término "efecto" aquí no implica una relación causal.

La hipótesis nula también puede describirse como la hipótesis en la que no existe relación entre dos conjuntos de datos o variables que se analizan. Si la hipótesis nula es cierta, cualquier efecto observado experimentalmente se debe únicamente al azar, de ahí el término "nulo". En contraste con la hipótesis nula, se desarrolla una hipótesis alternativa , que afirma que existe una relación entre dos variables.

Definiciones basicas

La hipótesis nula y la hipótesis alternativa son tipos de conjeturas utilizadas en pruebas estadísticas para hacer inferencias estadísticas , que son métodos formales para llegar a conclusiones y separar las afirmaciones científicas del ruido estadístico.

La afirmación que se prueba en una prueba de significancia estadística se llama hipótesis nula. La prueba de significancia está diseñada para evaluar la solidez de la evidencia frente a la hipótesis nula, o una afirmación de "ningún efecto" o "ninguna diferencia". ^[2] A menudo se simboliza como H ₀ .

La afirmación que se contrasta con la hipótesis nula es la hipótesis alternativa. ^[2] Los símbolos pueden incluir H ₁ y H _a .

Una prueba de significación estadística comienza con una muestra aleatoria de una población. Si los datos de la muestra son consistentes con la hipótesis nula, entonces no se rechaza la hipótesis nula; Si los datos de la muestra son inconsistentes con la hipótesis nula, entonces se rechaza la hipótesis nula y se concluye que la hipótesis alternativa es verdadera. ^[3]

Lo siguiente añade contexto y matices a las definiciones básicas.

Dadas las puntuaciones de las pruebas de dos muestras aleatorias , una de hombres y otra de mujeres, ¿un grupo obtiene una puntuación mejor que el otro? Una posible hipótesis nula es que la puntuación media masculina es la misma que la puntuación media femenina:

H ₀ : μ ₁ = μ ₂

dónde

H ₀ = la hipótesis nula,

μ ₁ = la media de la población 1, y

μ ₂ = la media de la población 2.

Una hipótesis nula más fuerte es que las dos muestras tienen varianzas y formas iguales de sus respectivas distribuciones.

Terminología

Hipótesis simple: Cualquier hipótesis que especifique completamente la distribución de la población. Para tal hipótesis, la distribución muestral de cualquier estadística es función únicamente del tamaño de la muestra.
Hipótesis compuesta: Cualquier hipótesis que no especifique completamente la distribución de la población. ^[4] Ejemplo: una hipótesis que especifica una distribución normal con una media especificada y una varianza no especificada.

La distinción simple/compuesta fue hecha por Neyman y Pearson. ^[5]

Hipótesis exacta: Cualquier hipótesis que especifique un valor de parámetro exacto. ^[6] Ejemplo: μ = 100. Sinónimo: hipótesis puntual .
Hipótesis inexacta: Aquellos que especifican un rango o intervalo de parámetros. Ejemplos: μ ≤ 100; 95 ≤ μ ≤ 105.

Fisher requería una hipótesis nula exacta para realizar la prueba (véanse las citas a continuación).

Una hipótesis de una cola (probada mediante una prueba unilateral) ^[2] es una hipótesis inexacta en la que el valor de un parámetro se especifica como:

superior o igual a un cierto valor, o
inferior o igual a un determinado valor.

Se dice que una hipótesis de una cola tiene direccionalidad .

El ejemplo original de Fisher ( señora probando té ) era una prueba de una cola. La hipótesis nula era asimétrica. La probabilidad de adivinar todas las tazas correctamente era la misma que adivinar todas las tazas incorrectamente, pero Fisher notó que sólo adivinar correctamente era compatible con la afirmación de la dama.

Descripción técnica

La hipótesis nula es una hipótesis predeterminada de que una cantidad a medir es cero (nula). Normalmente, la cantidad a medir es la diferencia entre dos situaciones. Por ejemplo, intentar determinar si hay pruebas positivas de que se ha producido un efecto o de que las muestras provienen de lotes diferentes. ^[7]^[8]

Generalmente se supone que la hipótesis nula sigue siendo posiblemente cierta. Se pueden realizar múltiples análisis para mostrar cómo se debe rechazar o excluir la hipótesis, por ejemplo, teniendo un alto nivel de confianza, demostrando así una diferencia estadísticamente significativa. Esto se demuestra mostrando que el cero está fuera del intervalo de confianza especificado de la medición en cualquier lado, normalmente dentro de los números reales . ^[8] No excluir la hipótesis nula (con algún grado de confianza) no confirma ni apoya lógicamente la hipótesis nula (no demostrable). (Cuando se demuestra que algo es, por ejemplo, mayor que x , no implica necesariamente que sea plausible que sea menor o igual que x ; en cambio, puede ser una medición de mala calidad con baja precisión. Confirmar la hipótesis nula sería bilateral equivale a demostrar positivamente que es mayor o igual que 0 y a demostrar positivamente que es menor o igual que 0; esto es algo para lo cual se necesita una precisión infinita así como un efecto exactamente cero, ninguno de los cuales normalmente es realista. Además, las mediciones nunca serán indicar una probabilidad distinta de cero de una diferencia exactamente cero). Por lo tanto, el fracaso de una exclusión de una hipótesis nula equivale a un "no sé" en el nivel de confianza especificado; no implica inmediatamente nulo de alguna manera, ya que es posible que los datos ya muestren una indicación (menos fuerte) de no nulo. El nivel de confianza utilizado no corresponde en absoluto a la probabilidad de nulo al no excluir; de hecho, en este caso, un alto nivel de confianza utilizado amplía el rango aún plausible.

Una hipótesis no nula puede tener los siguientes significados, dependiendo del autor a) se utiliza un valor distinto de cero, b) se utiliza algún margen distinto de cero y c) la hipótesis "alternativa" . ^[9]^[10]

Probar (excluir o no excluir) la hipótesis nula proporciona evidencia de que hay (o no hay) bases estadísticamente suficientes para creer que existe una relación entre dos fenómenos (por ejemplo, que un tratamiento potencial tiene un efecto distinto de cero, en cualquier caso). . Probar la hipótesis nula es una tarea central en la prueba de hipótesis estadísticas en la práctica moderna de la ciencia. Existen criterios precisos para excluir o no excluir una hipótesis nula en un determinado nivel de confianza. El nivel de confianza debería indicar la probabilidad de que muchos más y mejores datos aún pudieran excluir la hipótesis nula del mismo lado. ^[8]

El concepto de hipótesis nula se utiliza de manera diferente en dos enfoques de la inferencia estadística. En el enfoque de prueba de significancia de Ronald Fisher , se rechaza una hipótesis nula si es significativamente improbable que los datos observados hubieran ocurrido si la hipótesis nula fuera cierta. En este caso se rechaza la hipótesis nula y se acepta en su lugar una hipótesis alternativa . Si los datos son consistentes con la hipótesis nula y estadísticamente posiblemente sean verdaderos, entonces la hipótesis nula no se rechaza. En ningún caso se prueba la hipótesis nula o su alternativa; con mejores o más datos, la nula aún puede rechazarse. Esto es análogo al principio legal de presunción de inocencia , en el que se supone que un sospechoso o acusado es inocente (no se rechaza la nulidad) hasta que se demuestra su culpabilidad (se rechaza la nulidad) más allá de toda duda razonable (en un grado estadísticamente significativo). ^[8]

En el enfoque de prueba de hipótesis de Jerzy Neyman y Egon Pearson , se contrasta una hipótesis nula con una hipótesis alternativa , y las dos hipótesis se distinguen sobre la base de datos, con ciertas tasas de error. Se utiliza para formular respuestas en investigaciones.

La inferencia estadística se puede realizar sin una hipótesis nula, especificando un modelo estadístico correspondiente a cada hipótesis candidata y utilizando técnicas de selección de modelos para elegir el modelo más apropiado. ^[11] (Las técnicas de selección más comunes se basan en el criterio de información de Akaike o en el factor Bayes ).

Principio

La prueba de hipótesis requiere la construcción de un modelo estadístico de cómo se verían los datos si el azar o los procesos aleatorios fueran los únicos responsables de los resultados. La hipótesis de que el azar es el único responsable de los resultados se denomina hipótesis nula . El modelo del resultado del proceso aleatorio se llama distribución bajo la hipótesis nula . Los resultados obtenidos se comparan con la distribución bajo la hipótesis nula y de este modo se determina la probabilidad de encontrar los resultados obtenidos. ^[12]

La prueba de hipótesis funciona recopilando datos y midiendo la probabilidad de que un conjunto particular de datos sea cierto (suponiendo que la hipótesis nula sea verdadera), cuando el estudio se realiza sobre una muestra representativa seleccionada al azar. La hipótesis nula supone que no hay relación entre las variables de la población de la que se selecciona la muestra . ^[13]

Si el conjunto de datos de una muestra representativa seleccionada al azar es muy improbable en relación con la hipótesis nula (definida como parte de una clase de conjuntos de datos que rara vez se observarán), el experimentador rechaza la hipótesis nula y concluye que (probablemente) ) Es falso. Esta clase de conjuntos de datos generalmente se especifica mediante una estadística de prueba , que está diseñada para medir el grado de desviación aparente de la hipótesis nula. El procedimiento funciona evaluando si la desviación observada, medida por el estadístico de prueba, es mayor que un valor definido, de modo que la probabilidad de que ocurra un valor más extremo sea pequeña bajo la hipótesis nula (generalmente menos del 5% o del 1%). % de conjuntos de datos similares en los que la hipótesis nula sí se cumple).

Si los datos no contradicen la hipótesis nula, entonces sólo se puede llegar a una conclusión débil: a saber, que el conjunto de datos observados proporciona evidencia insuficiente contra la hipótesis nula. En este caso, debido a que la hipótesis nula podría ser verdadera o falsa, en algunos contextos esto se interpreta en el sentido de que los datos no proporcionan evidencia suficiente para llegar a una conclusión, mientras que en otros contextos, se interpreta en el sentido de que no hay evidencia suficiente para apoyar el cambio de un régimen actualmente útil a otro diferente. Sin embargo, si en este punto el efecto parece probable y/o suficientemente grande, puede haber un incentivo para investigar más a fondo, como ejecutar una muestra más grande.

Por ejemplo, un determinado medicamento puede reducir el riesgo de sufrir un ataque cardíaco. Las posibles hipótesis nulas son "este fármaco no reduce el riesgo de sufrir un infarto" o "este fármaco no tiene ningún efecto sobre el riesgo de sufrir un infarto". La prueba de hipótesis consiste en administrar el fármaco a la mitad de las personas de un grupo de estudio a modo de experimento controlado . Si los datos muestran un cambio estadísticamente significativo en las personas que reciben el fármaco, se rechaza la hipótesis nula.

Objetivos de las pruebas de hipótesis nula

Existen muchos tipos de pruebas de significancia para una, dos o más muestras, para medias, varianzas y proporciones, datos pareados o no pareados, para diferentes distribuciones, para muestras grandes y pequeñas; todos tienen hipótesis nulas. También hay al menos cuatro objetivos de hipótesis nulas para las pruebas de significancia: ^[14]

Se utilizan hipótesis técnicas nulas para verificar supuestos estadísticos. Por ejemplo, los residuos entre los datos y un modelo estadístico no se pueden distinguir del ruido aleatorio. De ser cierto, no hay justificación para complicar el modelo.
Los supuestos científicos nulos se utilizan para avanzar directamente en una teoría. Por ejemplo, el momento angular del universo es cero. Si no es cierta, es posible que sea necesario revisar la teoría del universo primitivo.
Se utilizan hipótesis nulas de homogeneidad para verificar que múltiples experimentos produzcan resultados consistentes. Por ejemplo, el efecto de un medicamento en las personas mayores es consistente con el de la población adulta general. De ser cierto, esto refuerza la conclusión general sobre la eficacia y simplifica las recomendaciones de uso.
Las hipótesis nulas que afirman la igualdad de efectos de dos o más tratamientos alternativos, por ejemplo, un fármaco y un placebo, se utilizan para reducir las afirmaciones científicas basadas en ruido estadístico. Ésta es la hipótesis nula más popular; Es tan popular que muchas afirmaciones sobre pruebas significativas asumen hipótesis nulas.

El rechazo de la hipótesis nula no es necesariamente el objetivo real de un evaluador de significancia. Un modelo estadístico adecuado puede estar asociado con la imposibilidad de rechazar la nula; el modelo se ajusta hasta que no se rechaza la nula. Fisher conocía bien los numerosos usos de las pruebas de significancia y analizó muchos de ellos en su libro escrito una década antes de definir la hipótesis nula. ^[15]

Una prueba de significación estadística comparte muchas matemáticas con un intervalo de confianza . Son mutuamente esclarecedores . Un resultado suele ser significativo cuando hay confianza en el signo de una relación (el intervalo no incluye 0). Siempre que el signo de una relación es importante, la significación estadística es un objetivo digno. Esto también revela debilidades en las pruebas de significancia: un resultado puede ser significativo sin una buena estimación de la fortaleza de una relación; La importancia puede ser una meta modesta. Una relación débil también puede adquirir importancia con suficientes datos. Generalmente se recomienda informar tanto la significación como los intervalos de confianza.

Los variados usos de las pruebas de significancia reducen el número de generalizaciones que se pueden hacer sobre todas las aplicaciones.

Elección de la hipótesis nula

La elección de la hipótesis nula se asocia con un asesoramiento escaso e inconsistente. Fisher mencionó pocas restricciones a la elección y afirmó que se deben considerar muchas hipótesis nulas y que son posibles muchas pruebas para cada una. La variedad de aplicaciones y la diversidad de objetivos sugieren que la elección puede resultar complicada. En muchas aplicaciones la formulación de la prueba es tradicional. La familiaridad con la variedad de pruebas disponibles puede sugerir una hipótesis y una prueba nulas en particular. La formulación de la hipótesis nula no está automatizada (aunque los cálculos de las pruebas de significación sí suelen estarlo). Sir David Cox dijo: "La forma en que se realiza [la] traducción del problema temático al modelo estadístico es a menudo la parte más crítica de un análisis". ^[dieciséis]

Una prueba de significación estadística tiene como objetivo probar una hipótesis. Si la hipótesis resume un conjunto de datos, no tiene ningún valor probar la hipótesis en ese conjunto de datos. Ejemplo: si un estudio de los informes meteorológicos del año pasado indica que la lluvia en una región cae principalmente los fines de semana, solo es válido probar esa hipótesis nula en informes meteorológicos de cualquier otro año . Probar hipótesis sugeridas por los datos es un razonamiento circular que no prueba nada; Es una limitación especial a la elección de la hipótesis nula.

Un procedimiento de rutina es el siguiente: Partir de la hipótesis científica. Traduzca esto a una hipótesis estadística alternativa y proceda: "Debido a que H _a expresa el efecto del que deseamos encontrar evidencia, a menudo comenzamos con Ha _y luego establecemos H ₀ como la afirmación de que el efecto esperado no está presente. " ^[2] Este consejo se invierte para aplicaciones de modelado donde esperamos no encontrar evidencia en contra de la nulidad.

Un ejemplo de caso complejo es el siguiente: ^[17] El estándar de oro en la investigación clínica es el ensayo clínico aleatorio , controlado con placebo , doble ciego . Pero probar un nuevo fármaco frente a un placebo (médicamente ineficaz) puede no ser ético en el caso de una enfermedad grave. Probar un fármaco nuevo frente a un fármaco más antiguo y eficaz desde el punto de vista médico plantea cuestiones filosóficas fundamentales en relación con el objetivo de la prueba y la motivación de los experimentadores. La hipótesis nula estándar de "no hay diferencia" puede recompensar a la compañía farmacéutica por recopilar datos inadecuados. La "diferencia" es una hipótesis nula mejor en este caso, pero la significación estadística no es un criterio adecuado para llegar a una conclusión matizada que requiere una buena estimación numérica de la eficacia del fármaco. Un cambio propuesto "menor" o "simple" en la hipótesis nula ((nuevo versus antiguo) en lugar de (nuevo versus placebo)) puede tener un efecto dramático en la utilidad de una prueba por razones complejas no estadísticas.

Direccionalidad

La elección de la hipótesis nula ( H ₀ ) y la consideración de la direccionalidad (ver " prueba de una cola ") es crítica.

Cola de la prueba de hipótesis nula

Considere la cuestión de si una moneda lanzada es justa (es decir, que en promedio sale cara el 50% de las veces) y un experimento en el que se lanza la moneda 5 veces. Un posible resultado del experimento que consideramos aquí es 5 cabezas. Consideremos que los resultados son improbables con respecto a una distribución supuesta si su probabilidad es inferior a un umbral de significancia de 0,05.

Una posible hipótesis nula que implica una prueba de una cola es "esta moneda no está sesgada hacia la cara". Tenga en cuenta que, en este contexto, el término "una cola" no se refiere al resultado de un solo lanzamiento de moneda (es decir, si la moneda sale "cruz" en lugar de "cara"); El término " de una cola " se refiere a una forma específica de probar la hipótesis nula en la que la región crítica (también conocida como " región de rechazo ") termina en un solo lado de la distribución de probabilidad.

De hecho, con una moneda justa, la probabilidad de que el resultado de este experimento sea 1/2 ⁵ = 0,031, que sería aún menor si la moneda estuviera sesgada a favor de las cruces. Por lo tanto, las observaciones no son lo suficientemente probables como para que se cumpla la hipótesis nula y la prueba la refuta. Dado que la moneda aparentemente no es justa ni está sesgada hacia la cruz, la conclusión del experimento es que la moneda está sesgada hacia la cara.

Alternativamente, una hipótesis nula que implica una prueba de dos colas es "esta moneda es justa". Esta hipótesis nula podría examinarse buscando demasiadas colas o demasiadas caras en los experimentos. Los resultados que tenderían a refutar esta hipótesis nula son aquellos con un gran número de caras o un gran número de cruces, y nuestro experimento con 5 caras parecería pertenecer a esta clase.

Sin embargo, la probabilidad de que se produzcan 5 lanzamientos del mismo tipo, independientemente de si son cara o cruz, es el doble que la de un resultado de 5 caras considerado individualmente. Por tanto, bajo esta hipótesis nula de dos colas, la observación recibe un valor de probabilidad de 0,063. Por lo tanto, nuevamente, con el mismo umbral de significancia utilizado para la prueba unilateral (0,05), el mismo resultado no es estadísticamente significativo. Por lo tanto, en este caso se preservará la hipótesis nula de dos colas, no apoyando la conclusión alcanzada con la hipótesis nula de una cola, de que la moneda está sesgada hacia cara.

Este ejemplo ilustra que la conclusión alcanzada a partir de una prueba estadística puede depender de la formulación precisa de las hipótesis nula y alternativa.

Discusión

Fisher dijo que "la hipótesis nula debe ser exacta, es decir libre de vaguedad y ambigüedad, porque debe proporcionar la base del 'problema de distribución', del cual la prueba de significancia es la solución", implicando un dominio más restrictivo para H0 . _{_}^[18] Según este punto de vista, la hipótesis nula debe ser numéricamente exacta: debe afirmar que una cantidad o diferencia particular es igual a un número particular. En la ciencia clásica, lo más habitual es afirmar que un tratamiento particular no produce ningún efecto ; En las observaciones, lo habitual es que no haya diferencia entre el valor de una variable medida particular y el de una predicción.

La mayoría de los estadísticos creen que es válido establecer la dirección como parte de una hipótesis nula o como parte de un par de hipótesis nula/hipótesis alternativa. ^[19] Sin embargo, los resultados no son una descripción completa de todos los resultados de un experimento, sino simplemente un resultado único adaptado a un propósito particular. Por ejemplo, considere una H ₀ que afirma que la media poblacional para un nuevo tratamiento es una mejora con respecto a un tratamiento bien establecido con una media poblacional = 10 (conocida por una larga experiencia), siendo la alternativa de una cola que la media del nuevo tratamiento > 10 . Si la evidencia de la muestra obtenida a través de x -bar es igual a −200 y el estadístico de la prueba t correspondiente es igual a −50, la conclusión de la prueba sería que no hay evidencia de que el nuevo tratamiento sea mejor que el existente: no informaría que es notablemente peor, pero eso no es lo que busca esta prueba en particular. Para superar cualquier posible ambigüedad al informar el resultado de la prueba de una hipótesis nula, es mejor indicar si la prueba fue bilateral y, si es unilateral, incluir la dirección del efecto que se está probando.

La teoría estadística necesaria para abordar los casos simples de direccionalidad tratados aquí, y los más complicados, hace uso del concepto de prueba insesgada .

La direccionalidad de las hipótesis no siempre es obvia. La hipótesis nula explícita del ejemplo de la Dama de Fisher probando té fue que la Dama no tenía tal habilidad, lo que condujo a una distribución de probabilidad simétrica. La naturaleza de una cola de la prueba resultó de la hipótesis alternativa de una cola (un término no utilizado por Fisher). La hipótesis nula se volvió implícitamente unilateral. La negación lógica de la afirmación unilateral de la Dama también lo era. (Afirmación: Habilidad > 0; Nulo declarado: Habilidad = 0; Nulo implícito: Habilidad ≤ 0).

Los argumentos puros sobre el uso de pruebas de una cola se complican por la variedad de pruebas. Algunas pruebas (por ejemplo, la prueba de bondad de ajuste de χ ² ) son inherentemente de una cola. Algunas distribuciones de probabilidad son asimétricas. Las pruebas tradicionales de 3 o más grupos son de dos colas.

Los consejos sobre el uso de hipótesis de una cola han sido inconsistentes y la práctica aceptada varía según los campos. ^[20] La mayor objeción a las hipótesis de una cola es su subjetividad potencial. En ocasiones, un resultado no significativo puede convertirse en un resultado significativo mediante el uso de una hipótesis de una cola (como la prueba de la moneda justa, a voluntad del analista). La otra cara del argumento: es menos probable que las pruebas unilaterales ignoren un efecto real. Las pruebas de una cola pueden suprimir la publicación de datos que difieren en signo de las predicciones. La objetividad era un objetivo de los desarrolladores de pruebas estadísticas.

Es una práctica común utilizar una hipótesis de una cola por defecto. Sin embargo, "si no se tiene una dirección concreta definida de antemano, se debe utilizar una alternativa bilateral. Además, algunos usuarios de estadísticas sostienen que siempre deberíamos trabajar con la alternativa bilateral". ^[2]^[21]

Una alternativa a este consejo es utilizar pruebas de tres resultados. Elimina los problemas relacionados con la direccionalidad de las hipótesis al probar dos veces, una en cada dirección y combinar los resultados para producir tres resultados posibles. ^[22] Las variaciones de este enfoque tienen una historia, ya que se han sugerido quizás 10 veces desde 1950. ^[23]

Los desacuerdos sobre las pruebas unilaterales surgen de la filosofía de la ciencia. Si bien Fisher estaba dispuesto a ignorar el improbable caso de que la Dama adivinara incorrectamente todas las tazas de té (lo que podría haber sido apropiado para las circunstancias), la medicina cree que un tratamiento propuesto que mata a los pacientes es significativo en todos los sentidos y debería informarse y tal vez explicarse. . Las malas prácticas de presentación de informes estadísticos han contribuido a los desacuerdos sobre las pruebas de una cola. La significación estadística resultante de pruebas de dos colas es insensible al signo de la relación; Informar sobre la importancia por sí solo es inadecuado. "El tratamiento tiene un efecto" es el resultado poco informativo de una prueba de dos colas. "El tratamiento tiene un efecto beneficioso" es el resultado más informativo de una prueba de una cola. "El tratamiento tiene un efecto, reduciendo la duración media de la hospitalización en 1,5 días" es el informe más informativo, que combina el resultado de una prueba de significación de dos colas con una estimación numérica de la relación entre tratamiento y efecto. Informar explícitamente un resultado numérico elimina una ventaja filosófica de una prueba de una cola. Una cuestión subyacente es la forma apropiada de una ciencia experimental sin teorías predictivas numéricas: un modelo de resultados numéricos es más informativo que un modelo de signos de efectos (positivos, negativos o desconocidos), que es más informativo que un modelo de significación simple (no cero o desconocido); en ausencia de teoría numérica, los signos pueden ser suficientes.

Historia de las pruebas estadísticas.

La historia de las hipótesis nula y alternativa tiene mucho que ver con la historia de las pruebas estadísticas. ^[24]^[25]

Antes de 1925: hay rastros transitorios ocasionales de pruebas estadísticas en siglos pasados, que fueron ejemplos tempranos de hipótesis nulas. A finales del siglo XIX se definió la significación estadística. A principios del siglo XX se definieron importantes distribuciones de probabilidad . Gossett y Pearson trabajaron en casos específicos de pruebas de significancia.
1925: Fisher publicó la primera edición de Métodos estadísticos para trabajadores de investigación , que definió la prueba de significación estadística y la convirtió en un método de análisis convencional para gran parte de la ciencia experimental. El texto carecía de pruebas y carecía de explicaciones, pero estaba lleno de ejemplos reales. Colocó la práctica estadística en las ciencias mucho antes que la teoría estadística publicada.
1933: En una serie de artículos (publicados durante una década a partir de 1928), Neyman y Pearson definieron la prueba de hipótesis estadística como una mejora propuesta de la prueba de Fisher. Los artículos proporcionaron gran parte de la terminología para pruebas estadísticas, incluidas hipótesis alternativas y H ₀ como hipótesis a probar utilizando datos de observación (con H ₁ , H ₂ ... como alternativas). ^[5]
1935: Fisher publicó la primera edición del libro The Design of Experiments , que introdujo la hipótesis nula ^[26] (por ejemplo más que por definición) y explicó cuidadosamente la justificación de las pruebas de significancia en el contexto de la interpretación de los resultados experimentales.
Fisher y Neyman discutieron sobre los méritos relativos de sus formulaciones rivales hasta la muerte de Fisher en 1962. Los cambios de carrera y la Segunda Guerra Mundial pusieron fin a la asociación de Neyman y Pearson. Las formulaciones fueron fusionadas por escritores de libros de texto, experimentadores (editores de revistas) y estadísticos matemáticos relativamente anónimos sin la participación de Fisher o Neyman. ^[24] El tema hoy combina gran parte de la terminología y el poder explicativo de Neyman & Pearson con la filosofía científica y los cálculos proporcionados por Fisher. Si las pruebas estadísticas son propiamente uno o dos temas sigue siendo una fuente de desacuerdo. ^[27] Muestra de dos: un texto se refiere al tema como prueba de hipótesis (sin mencionar la prueba de significancia en el índice) mientras que otro dice prueba de significancia (con una sección sobre inferencia como decisión). Fisher desarrolló pruebas de significancia como una herramienta flexible para que los investigadores sopesen su evidencia. En cambio, las pruebas se han institucionalizado. La significancia estadística se ha convertido en un criterio rígidamente definido y aplicado para la publicación de resultados experimentales en muchas revistas científicas. En algunos campos, las pruebas de significación se han convertido en la forma dominante y casi exclusiva de análisis estadístico. Como consecuencia se han estudiado exhaustivamente las limitaciones de las pruebas. Los libros se han llenado de críticas recopiladas sobre las pruebas de significación .

Ver también

Referencias

^ Helmenstine, Anne Marie. "¿Qué es la hipótesis nula? Definición y ejemplos". PensamientoCo . Consultado el 10 de diciembre de 2019 .
^ abcde Moore, David; McCabe, George (2003). Introducción a la práctica de la estadística (4 ed.). Nueva York: WH Freeman and Co. p. 438.ISBN _ 978-0716796572.
^ Weiss, Neil A. (1999). Estadística introductoria (5ª ed.). Addison Wesley. pag. 494.ISBN _ 978-0201598773.
^ Rossi, RJ (2018), Estadística matemática , Wiley , p. 281.
^ ab Neyman, J; Pearson, ES (1 de enero de 1933). "Sobre el problema de las pruebas de hipótesis estadísticas más eficientes". Transacciones filosóficas de la Royal Society A. 231 (694–706): 289–337. Código Bib : 1933RSPTA.231..289N. doi : 10.1098/rsta.1933.0009 .
^ Winkler, Robert L; Hays, William L. (1975). Estadística: probabilidad, inferencia y decisión. Nueva York: Holt, Rinehart y Winston. pag. 403.ISBN _ 978-0-03-014011-2.
^ Everitt, Brian (1998). El Diccionario de Estadística de Cambridge . Cambridge y Nueva York: Cambridge University Press. ISBN 978-0521593465.
^ abcd Hayes, Adán. "Definición de hipótesis nula". Investopedia . Consultado el 10 de diciembre de 2019 .
^ Zhao, Guolong (18 de abril de 2015). "Una prueba de hipótesis no nula para tendencias lineales en proporciones". Comunicaciones en estadística: teoría y métodos . 44 (8): 1621-1639. doi :10.1080/03610926.2013.776687. ISSN 0361-0926. S2CID 120030713.
^ "Glosario de términos estadísticos de la OCDE: definición de hipótesis no nula". stats.oecd.org . Consultado el 5 de diciembre de 2020 .
^ Burnham, KP; Anderson, DR (2002), Selección de modelos e inferencia multimodelo: un enfoque teórico de la información práctico (2ª ed.), Springer-Verlag, ISBN 978-0-387-95364-9.
^ Stockburger DW (2007), "Hipótesis y prueba de hipótesis", Enciclopedia de medición y estadística (editor: Salkind NJ), Publicaciones SAGE .
^ Chiang, I. -Chant A.; Jhangiani, Rajiv S.; Price, Paul C. (13 de octubre de 2015). "Comprensión de las pruebas de hipótesis nulas: métodos de investigación en psicología". opentextbc.ca . Consultado el 10 de diciembre de 2019 .
^ Cox, DR (1982). "Pruebas de significación estadística". Hno. J.Clin. Farmacéutico . 14 (3): 325–331. doi :10.1111/j.1365-2125.1982.tb01987.x. PMC 1427620 . PMID 6751362.
^ Métodos estadísticos para investigadores (11.ª edición): Capítulo IV: Pruebas de bondad de ajuste, independencia y homogeneidad; Con Tabla de χ ² . Con respecto a una prueba de significancia que respalda la bondad del ajuste: si la probabilidad calculada es alta, entonces "ciertamente no hay razón para sospechar que se prueba la hipótesis [nula]. Si es [baja], indica claramente que la hipótesis [nula] falla dar cuenta de la totalidad de los hechos."
^ Cox, DR (2006). Principios de inferencia estadística . Prensa de la Universidad de Cambridge. pag. 197.ISBN _ 978-0-521-68567-2.
^ Jones, B; P Jarvis; JA Lewis; AF Ebbutt (6 de julio de 1996). "Ensayos para evaluar la equivalencia: la importancia de los métodos rigurosos". BMJ . 313 (7048): 36–39. doi :10.1136/bmj.313.7048.36. PMC 2351444 . PMID 8664772. Se sugiere que la posición por defecto (la hipótesis nula) debería ser que los tratamientos no son equivalentes. Las conclusiones deben sacarse sobre la base de intervalos de confianza más que de significancia.
^ Pescador, RA (1966). El diseño de experimentos (8ª ed.). Edimburgo: Hafner.
^ Por ejemplo, ver Hipótesis nula
^ Lombardi, Celia M.; Hurlbert, Stuart H. (2009). "Mal prescripción y uso indebido de pruebas de una cola". Ecología Austral . 34 (4): 447–468. doi : 10.1111/j.1442-9993.2009.01946.x . Analiza detalladamente los méritos y el uso histórico de las pruebas de una cola en biología.
^ Suave, J Martín; Altman, Douglas G (23 de julio de 1994). "Pruebas de significancia de una y dos caras". BMJ . 309 (6949): 248. doi :10.1136/bmj.309.6949.248. PMC 2540725 . PMID 8069143. Con respecto a las estadísticas médicas: "En general, una prueba unilateral es apropiada cuando una gran diferencia en una dirección conduciría a la misma acción que si no hubiera ninguna diferencia. La expectativa de una diferencia en una dirección particular no es una justificación adecuada". "Se deben utilizar pruebas bilaterales a menos que exista una muy buena razón para hacer lo contrario. Si se van a utilizar pruebas unilaterales, la dirección de la prueba debe especificarse de antemano. Las pruebas unilaterales nunca deben usarse simplemente como un dispositivo para hacer una diferencia convencionalmente no significativa."
^ Jones, Lyle V.; Tukey, John W. (2000). "Una formulación sensata de la prueba de significancia". Métodos psicológicos . 5 (4): 411–414. doi :10.1037/1082-989X.5.4.411. PMID 11194204. S2CID 14553341. Los resultados de la prueba están firmados: efecto positivo significativo, efecto negativo significativo o efecto insignificante de signo desconocido. Ésta es una conclusión más matizada que la de la prueba de dos colas. Tiene las ventajas de las pruebas de una cola sin las desventajas.
^ Hurlbert, SH; Lombardi, CM (2009). "Colapso final del marco teórico de la decisión de Neyman-Pearson y ascenso del neofisheriano". Ana. Zoológico. Fennici . 46 (5): 311–349. doi :10.5735/086.046.0501. ISSN 1797-2450. S2CID 9688067.
^ ab Gigerenzer, Gerd; Zenón Swijtink; Teodoro Porter; Lorena Daston; John Beatty; Lorenz Kruger (1989). "Parte 3: Los expertos en inferencias". El imperio del azar: cómo la probabilidad cambió la ciencia y la vida cotidiana . Prensa de la Universidad de Cambridge. págs. 70-122. ISBN 978-0-521-39838-1.
^ Lehmann, EL (2011). Fisher, Neyman y la creación de la estadística clásica . Nueva York: Springer. ISBN 978-1441994998.
^ Aldrich, Juan. "Primeros usos conocidos de algunas de las palabras de probabilidad y estadística" . Consultado el 30 de junio de 2014 .Última actualización el 12 de marzo de 2003. De Jeff Miller.
^ Lehmann, EL (diciembre de 1993). "Las teorías de Fisher, Neyman-Pearson sobre la prueba de hipótesis: ¿una teoría o dos?". Revista de la Asociación Estadounidense de Estadística . 88 (424): 1242-1249. doi :10.1080/01621459.1993.10476404.

Otras lecturas

Adèr, HJ ; Mellenbergh, GJ y Hand, DJ (2007). Asesoramiento sobre métodos de investigación: el compañero de un consultor . Huizen, Países Bajos: Johannes van Kessel Publishing. ISBN 978-90-79418-01-5.
Efrón, B. (2004). "Prueba de hipótesis simultánea a gran escala". Revista de la Asociación Estadounidense de Estadística . 99 (465): 96-104. doi :10.1198/016214504000000089. S2CID 1520711.La aplicación de pruebas de significancia en este artículo es un caso atípico. ¿Pruebas para encontrar una hipótesis nula? ¿No se trata de mostrar importancia, sino de encontrar casos interesantes?
Arroz, William R.; Gaines, Steven D. (junio de 1994). "'Cara, yo gano, cruz, tú pierdes': prueba de hipótesis alternativas direccionales en la investigación ecológica y evolutiva". ÁRBOL . 9 (6): 235–237. doi :10.1016/0169-5347(94)90258-5. PMID 21236837.Las pruebas dirigidas combinan los atributos de las pruebas de una y dos colas. "...las pruebas dirigidas deben utilizarse prácticamente en todas las aplicaciones en las que anteriormente se han utilizado pruebas unilaterales, excepto en aquellos casos en los que los datos sólo pueden desviarse de H ₀ , en una dirección".

enlaces externos

HyperStat Online: hipótesis nula