stringtranslate.com

Hipótesis nula

En la investigación científica , la hipótesis nula (a menudo denominada H 0 ) [1] es la afirmación de que el efecto que se estudia no existe. [nota 1] La hipótesis nula también puede describirse como la hipótesis en la que no existe relación entre dos conjuntos de datos o variables que se analizan. Si la hipótesis nula es verdadera, cualquier efecto observado experimentalmente se debe solo al azar, de ahí el término "nulo". En contraste con la hipótesis nula, se desarrolla una hipótesis alternativa , que afirma que existe una relación entre dos variables.

Definiciones básicas

La hipótesis nula y la hipótesis alternativa son tipos de conjeturas utilizadas en pruebas estadísticas para realizar inferencias estadísticas, que son métodos formales para llegar a conclusiones y separar las afirmaciones científicas del ruido estadístico.

La afirmación que se prueba en una prueba de significancia estadística se denomina hipótesis nula. La prueba de significancia está diseñada para evaluar la solidez de la evidencia en contra de la hipótesis nula, o una afirmación de "ningún efecto" o "ninguna diferencia". [2] A menudo se simboliza como H 0 .

La afirmación que se está probando frente a la hipótesis nula es la hipótesis alternativa. [2] Los símbolos pueden incluir H 1 y H a .

Una prueba de significación estadística comienza con una muestra aleatoria de una población. Si los datos de la muestra son consistentes con la hipótesis nula, entonces no se rechaza la hipótesis nula; si los datos de la muestra son inconsistentes con la hipótesis nula, entonces se rechaza la hipótesis nula y se concluye que la hipótesis alternativa es verdadera. [3]

Lo que sigue añade contexto y matices a las definiciones básicas.

Dadas las puntuaciones de dos muestras aleatorias , una de hombres y otra de mujeres, ¿un grupo obtiene mejores puntuaciones que el otro? Una posible hipótesis nula es que la puntuación media masculina es la misma que la puntuación media femenina:

H 0 : μ 1 = μ 2

dónde

H 0 = la hipótesis nula,
μ 1 = la media de la población 1, y
μ 2 = la media de la población 2.

Una hipótesis nula más fuerte es que las dos muestras tienen varianzas y formas iguales en sus respectivas distribuciones.

Terminología

Hipótesis simple
Cualquier hipótesis que especifique completamente la distribución de la población. Para una hipótesis de este tipo, la distribución muestral de cualquier estadística es una función únicamente del tamaño de la muestra.
Hipótesis compuesta
Cualquier hipótesis que no especifique completamente la distribución de la población. [4] Ejemplo: Una hipótesis que especifica una distribución normal con una media especificada y una varianza no especificada.

La distinción entre simple y compuesto fue realizada por Neyman y Pearson. [5]

Hipótesis exacta
Cualquier hipótesis que especifique un valor de parámetro exacto. [6] Ejemplo: μ = 100. Sinónimo: hipótesis puntual .
Hipótesis inexacta
Los que especifican un rango o intervalo de parámetros. Ejemplos: μ ≤ 100; 95 ≤ μ ≤ 105.

Fisher requirió una hipótesis nula exacta para la prueba (ver las citas a continuación).

Una hipótesis unilateral (probada mediante una prueba unilateral) [2] es una hipótesis inexacta en la que el valor de un parámetro se especifica como:

Se dice que una hipótesis de una cola tiene direccionalidad .

El ejemplo original de Fisher ( la señora probando té ) era una prueba de una cola. La hipótesis nula era asimétrica. La probabilidad de adivinar todas las tazas correctamente era la misma que la de adivinar todas las tazas incorrectamente, pero Fisher observó que solo adivinar correctamente era compatible con la afirmación de la señora.

Descripción técnica

La hipótesis nula es una hipótesis predeterminada según la cual una cantidad a medir es cero (nula). Normalmente, la cantidad a medir es la diferencia entre dos situaciones. Por ejemplo, intentar determinar si hay una prueba positiva de que se ha producido un efecto o de que las muestras proceden de lotes diferentes. [7] [8]

En general, se supone que la hipótesis nula sigue siendo posiblemente verdadera. Se pueden realizar múltiples análisis para mostrar cómo se debe rechazar o excluir la hipótesis, por ejemplo, si tiene un alto nivel de confianza, lo que demuestra una diferencia estadísticamente significativa. Esto se demuestra mostrando que cero está fuera del intervalo de confianza especificado de la medición en ambos lados, generalmente dentro de los números reales . [8] El hecho de no excluir la hipótesis nula (con algún nivel de confianza) no confirma ni respalda lógicamente la hipótesis nula (indemostrable). (Cuando se prueba que algo es, por ejemplo, mayor que x , no implica necesariamente que sea plausible que sea menor o igual que x ; en cambio, puede ser una medición de mala calidad con baja precisión. Confirmar la hipótesis nula de dos colas equivaldría a probar positivamente que es mayor o igual que 0 y a probar positivamente que es menor o igual que 0; esto es algo para lo que se necesita una precisión infinita, así como un efecto exactamente cero, ninguno de los cuales normalmente es realista. Además, las mediciones nunca indicarán una probabilidad distinta de cero de una diferencia exactamente cero). Por lo tanto, el fracaso de una exclusión de una hipótesis nula equivale a un "no sé" en el nivel de confianza especificado; no implica inmediatamente nulo de alguna manera, ya que los datos ya pueden mostrar una indicación (menos fuerte) de un no nulo. El nivel de confianza utilizado no corresponde absolutamente con certeza a la probabilidad de nulo al no excluir; de hecho, en este caso, un nivel de confianza utilizado alto expande el rango aún plausible.

Una hipótesis no nula puede tener los siguientes significados, dependiendo del autor a) se utiliza un valor distinto de cero, b) se utiliza algún margen distinto de cero y c) la hipótesis "alternativa" . [9] [10]

La comprobación (excluyendo o no la exclusión) de la hipótesis nula proporciona evidencia de que existen (o no) motivos estadísticos suficientes para creer que existe una relación entre dos fenómenos (por ejemplo, que un posible tratamiento tiene un efecto distinto de cero, en cualquier caso). La comprobación de la hipótesis nula es una tarea central en la comprobación de hipótesis estadísticas en la práctica científica moderna. Existen criterios precisos para excluir o no excluir una hipótesis nula en un determinado nivel de confianza. El nivel de confianza debería indicar la probabilidad de que muchos más y mejores datos aún puedan excluir la hipótesis nula en el mismo lado. [8]

El concepto de hipótesis nula se utiliza de forma diferente en dos enfoques de inferencia estadística. En el enfoque de prueba de significancia de Ronald Fisher , se rechaza una hipótesis nula si es significativamente improbable que los datos observados hubieran ocurrido si la hipótesis nula fuera verdadera. En este caso, se rechaza la hipótesis nula y se acepta una hipótesis alternativa en su lugar. Si los datos son consistentes con la hipótesis nula estadísticamente posiblemente verdadera, entonces la hipótesis nula no se rechaza. En ninguno de los casos se prueba la hipótesis nula o su alternativa; con mejores o más datos, la hipótesis nula aún puede rechazarse. Esto es análogo al principio legal de presunción de inocencia , en el que se supone que un sospechoso o acusado es inocente (no se rechaza la hipótesis nula) hasta que se demuestre su culpabilidad (se rechaza la hipótesis nula) más allá de una duda razonable (en un grado estadísticamente significativo). [8]

En el método de prueba de hipótesis de Jerzy Neyman y Egon Pearson , se contrasta una hipótesis nula con una hipótesis alternativa y se distinguen las dos hipótesis en función de los datos, con ciertos índices de error. Se utiliza para formular respuestas en la investigación.

La inferencia estadística se puede realizar sin una hipótesis nula, especificando un modelo estadístico correspondiente a cada hipótesis candidata y utilizando técnicas de selección de modelos para elegir el modelo más apropiado. [11] (Las técnicas de selección más comunes se basan en el criterio de información de Akaike o en el factor de Bayes ).

Principio

La prueba de hipótesis requiere la construcción de un modelo estadístico de cómo se verían los datos si el azar o los procesos aleatorios fueran los únicos responsables de los resultados. La hipótesis de que el azar es el único responsable de los resultados se denomina hipótesis nula . El modelo del resultado del proceso aleatorio se denomina distribución bajo la hipótesis nula . Los resultados obtenidos se comparan con la distribución bajo la hipótesis nula y, de este modo, se determina la probabilidad de encontrar los resultados obtenidos. [12]

La prueba de hipótesis funciona mediante la recopilación de datos y la medición de la probabilidad de que un determinado conjunto de datos sea cierto (suponiendo que la hipótesis nula es verdadera), cuando el estudio se basa en una muestra representativa seleccionada al azar. La hipótesis nula supone que no existe relación entre las variables de la población de la que se selecciona la muestra . [13]

Si el conjunto de datos de una muestra representativa seleccionada al azar es muy poco probable en relación con la hipótesis nula (definida como parte de una clase de conjuntos de datos que solo rara vez se observarán), el experimentador rechaza la hipótesis nula y concluye que (probablemente) es falsa. Esta clase de conjuntos de datos generalmente se especifica mediante una estadística de prueba , que está diseñada para medir el grado de desviación aparente de la hipótesis nula. El procedimiento funciona evaluando si la desviación observada, medida por la estadística de prueba, es mayor que un valor definido, de modo que la probabilidad de ocurrencia de un valor más extremo sea pequeña bajo la hipótesis nula (generalmente en menos del 5% o el 1% de los conjuntos de datos similares en los que se cumple la hipótesis nula).

Si los datos no contradicen la hipótesis nula, entonces sólo se puede llegar a una conclusión débil: a saber, que el conjunto de datos observados no proporciona evidencia suficiente contra la hipótesis nula. En este caso, debido a que la hipótesis nula puede ser verdadera o falsa, en algunos contextos esto se interpreta como que los datos no proporcionan evidencia suficiente para llegar a ninguna conclusión, mientras que en otros contextos, se interpreta como que no hay evidencia suficiente para respaldar el cambio de un régimen actualmente útil a otro diferente. Sin embargo, si en este punto el efecto parece probable y/o suficientemente grande, puede haber un incentivo para investigar más, como por ejemplo, realizar una muestra más grande.

Por ejemplo, un determinado fármaco puede reducir el riesgo de sufrir un ataque cardíaco. Las hipótesis nulas posibles son "este fármaco no reduce el riesgo de sufrir un ataque cardíaco" o "este fármaco no tiene ningún efecto sobre el riesgo de sufrir un ataque cardíaco". La prueba de la hipótesis consiste en administrar el fármaco a la mitad de las personas de un grupo de estudio como experimento controlado . Si los datos muestran un cambio estadísticamente significativo en las personas que reciben el fármaco, se rechaza la hipótesis nula.

Objetivos de las pruebas de hipótesis nula

Existen muchos tipos de pruebas de significación para una, dos o más muestras, para medias, varianzas y proporciones, datos pareados o no pareados, para diferentes distribuciones, para muestras grandes y pequeñas; todas tienen hipótesis nulas. También existen al menos cuatro objetivos de las hipótesis nulas para pruebas de significación: [14]

El rechazo de la hipótesis nula no es necesariamente el objetivo real de un evaluador de significancia. Un modelo estadístico adecuado puede estar asociado con un fracaso en el rechazo de la hipótesis nula; el modelo se ajusta hasta que la hipótesis nula no sea rechazada. Los numerosos usos de las pruebas de significancia eran bien conocidos por Fisher, quien analizó muchos de ellos en su libro escrito una década antes de definir la hipótesis nula. [15]

Una prueba de significación estadística comparte muchas de las matemáticas con un intervalo de confianza . Se complementan entre sí . Un resultado suele ser significativo cuando hay confianza en el signo de una relación (el intervalo no incluye el 0). Siempre que el signo de una relación sea importante, la significación estadística es un objetivo valioso. Esto también revela las debilidades de las pruebas de significación: un resultado puede ser significativo sin una buena estimación de la fuerza de una relación; la significación puede ser un objetivo modesto. Una relación débil también puede alcanzar la significación con suficientes datos. Se recomienda comúnmente informar tanto la significación como los intervalos de confianza.

Los variados usos de las pruebas de significancia reducen el número de generalizaciones que se pueden hacer sobre todas las aplicaciones.

Elección de la hipótesis nula

La elección de la hipótesis nula se asocia con un asesoramiento escaso e inconsistente. Fisher mencionó pocas restricciones a la elección y afirmó que se deben considerar muchas hipótesis nulas y que son posibles muchas pruebas para cada una. La variedad de aplicaciones y la diversidad de objetivos sugieren que la elección puede ser complicada. En muchas aplicaciones, la formulación de la prueba es tradicional. La familiaridad con la gama de pruebas disponibles puede sugerir una hipótesis nula y una prueba particulares. La formulación de la hipótesis nula no está automatizada (aunque los cálculos de las pruebas de significación generalmente sí lo están). David Cox dijo: "Cómo se hace la traducción del problema en cuestión al modelo estadístico es a menudo la parte más crítica de un análisis". [16]

Una prueba de significación estadística tiene como objetivo comprobar una hipótesis. Si la hipótesis resume un conjunto de datos, no tiene sentido comprobar la hipótesis sobre ese conjunto de datos. Ejemplo: si un estudio de los informes meteorológicos del año pasado indica que en una región llueve principalmente los fines de semana, solo es válido comprobar esa hipótesis nula sobre informes meteorológicos de cualquier otro año. Comprobar hipótesis sugeridas por los datos es un razonamiento circular que no prueba nada; es una limitación especial a la elección de la hipótesis nula.

Un procedimiento rutinario es el siguiente: se parte de la hipótesis científica, se la traduce a una hipótesis estadística alternativa y se procede de la siguiente manera: "Como H a expresa el efecto para el que deseamos encontrar evidencia, a menudo comenzamos con H a y luego planteamos H 0 como la afirmación de que el efecto esperado no está presente". [2] Este consejo se invierte para las aplicaciones de modelado en las que esperamos no encontrar evidencia en contra de la hipótesis nula.

Un ejemplo de caso complejo es el siguiente: [17] El estándar de oro en la investigación clínica es el ensayo clínico doble ciego controlado con placebo aleatorizado . Pero probar un nuevo fármaco contra un placebo (médicamente ineficaz) puede ser poco ético para una enfermedad grave. Probar un nuevo fármaco contra un fármaco más antiguo médicamente eficaz plantea cuestiones filosóficas fundamentales con respecto al objetivo de la prueba y la motivación de los experimentadores. La hipótesis nula estándar de "no hay diferencias" puede recompensar a la empresa farmacéutica por reunir datos inadecuados. "Diferencia" es una mejor hipótesis nula en este caso, pero la significación estadística no es un criterio adecuado para llegar a una conclusión matizada que requiere una buena estimación numérica de la eficacia del fármaco. Un cambio propuesto "menor" o "simple" en la hipótesis nula ((nuevo vs. antiguo) en lugar de (nuevo vs. placebo)) puede tener un efecto dramático en la utilidad de una prueba por razones no estadísticas complejas.

Direccionalidad

La elección de la hipótesis nula ( H0 ) y la consideración de la direccionalidad (véase " prueba de una cola ") son fundamentales.

Carácter colateral de la prueba de hipótesis nula

Consideremos la cuestión de si el lanzamiento de una moneda es justo (es decir, que en promedio cae cara el 50% de las veces) y un experimento en el que se lanza la moneda 5 veces. Un posible resultado del experimento que consideramos aquí es 5 caras. Consideremos que los resultados son improbables con respecto a una distribución supuesta si su probabilidad es menor que un umbral de significancia de 0,05.

Una hipótesis nula potencial que implica una prueba de una sola cola es "esta moneda no está sesgada hacia cara". Tenga en cuenta que, en este contexto, el término "de una sola cola" no se refiere al resultado de un solo lanzamiento de moneda (es decir, si la moneda sale "cruz" en lugar de "cara"); el término "de una sola cola " se refiere a una forma específica de probar la hipótesis nula en la que la región crítica (también conocida como " región de rechazo ") termina en un solo lado de la distribución de probabilidad.

De hecho, con una moneda justa, la probabilidad de que se produzca este resultado experimental es 1/2 5 = 0,031, que sería incluso menor si la moneda estuviera sesgada a favor de la cruz. Por lo tanto, las observaciones no son lo suficientemente probables como para que se cumpla la hipótesis nula, y la prueba la refuta. Dado que la moneda no es ostensiblemente justa ni está sesgada a favor de la cruz, la conclusión del experimento es que la moneda está sesgada a favor de la cara.

Alternativamente, una hipótesis nula que implica una prueba de dos colas es "esta moneda es justa". Esta hipótesis nula podría examinarse buscando demasiadas cruces o demasiadas caras en los experimentos. Los resultados que tenderían a refutar esta hipótesis nula son aquellos con una gran cantidad de caras o cruces, y nuestro experimento con 5 caras parecería pertenecer a esta clase.

Sin embargo, la probabilidad de que salgan 5 lanzamientos del mismo tipo, independientemente de que salgan cara o cruz, es el doble que la de que salgan 5 caras por separado. Por lo tanto, bajo esta hipótesis nula de dos colas, la observación recibe un valor de probabilidad de 0,063. Por lo tanto, nuevamente, con el mismo umbral de significación utilizado para la prueba de una cola (0,05), el mismo resultado no es estadísticamente significativo. Por lo tanto, la hipótesis nula de dos colas se mantendrá en este caso, lo que no respalda la conclusión a la que se llegó con la hipótesis nula de una cola, de que la moneda está sesgada hacia la cara.

Este ejemplo ilustra que la conclusión a la que se llega a partir de una prueba estadística puede depender de la formulación precisa de las hipótesis nula y alternativa.

Discusión

Fisher dijo que "la hipótesis nula debe ser exacta, es decir, libre de vaguedad y ambigüedad, porque debe proporcionar la base del 'problema de distribución', del cual la prueba de significancia es la solución", lo que implica un dominio más restrictivo para H 0 . [18] Según este punto de vista, la hipótesis nula debe ser numéricamente exacta: debe afirmar que una cantidad o diferencia particular es igual a un número particular. En la ciencia clásica, es más típico afirmar que no hay efecto de un tratamiento particular; en las observaciones, es típico afirmar que no hay diferencia entre el valor de una variable medida particular y el de una predicción.

La mayoría de los estadísticos creen que es válido indicar la dirección como parte de la hipótesis nula, o como parte de un par de hipótesis nula/hipótesis alternativa. [19] Sin embargo, los resultados no son una descripción completa de todos los resultados de un experimento, simplemente un resultado único adaptado a un propósito particular. Por ejemplo, considere una H 0 que afirma que la media poblacional para un nuevo tratamiento es una mejora en un tratamiento bien establecido con media poblacional = 10 (conocido por larga experiencia), con la alternativa de una cola siendo que la media del nuevo tratamiento > 10 . Si la evidencia de muestra obtenida a través de x -barra es igual a −200 y la estadística de prueba t correspondiente es igual a −50, la conclusión de la prueba sería que no hay evidencia de que el nuevo tratamiento sea mejor que el existente: no informaría que es marcadamente peor, pero eso no es lo que esta prueba en particular está buscando. Para superar cualquier posible ambigüedad al informar el resultado de la prueba de una hipótesis nula, es mejor indicar si la prueba fue bilateral y, si fue unilateral, incluir la dirección del efecto que se estaba probando.

La teoría estadística necesaria para tratar los casos simples de direccionalidad tratados aquí, y otros más complicados, hace uso del concepto de prueba imparcial .

La direccionalidad de las hipótesis no siempre es obvia. La hipótesis nula explícita del ejemplo de la Dama de Fisher que degustaba té era que la Dama no tenía esa capacidad, lo que condujo a una distribución de probabilidad simétrica. La naturaleza unilateral de la prueba resultó de la hipótesis alternativa unilateral (un término no utilizado por Fisher). La hipótesis nula se convirtió implícitamente en unilateral. La negación lógica de la afirmación unilateral de la Dama también fue unilateral. (Afirmación: Capacidad > 0; Nula declarada: Capacidad = 0; Nula implícita: Capacidad ≤ 0).

Los argumentos puros sobre el uso de pruebas unilaterales se complican por la variedad de pruebas. Algunas pruebas (por ejemplo, la prueba de bondad de ajuste χ 2 ) son inherentemente unilaterales. Algunas distribuciones de probabilidad son asimétricas. Las pruebas tradicionales de 3 o más grupos son bilaterales.

Los consejos sobre el uso de hipótesis unilaterales han sido inconsistentes y la práctica aceptada varía entre los campos. [20] La mayor objeción a las hipótesis unilaterales es su potencial subjetividad. Un resultado no significativo a veces puede convertirse en un resultado significativo mediante el uso de una hipótesis unilateral (como la prueba de la moneda justa, al antojo del analista). La otra cara del argumento: las pruebas unilaterales tienen menos probabilidades de ignorar un efecto real. Las pruebas unilaterales pueden suprimir la publicación de datos que difieren en signo de las predicciones. La objetividad fue un objetivo de los desarrolladores de pruebas estadísticas.

Es una práctica común utilizar una hipótesis unilateral por defecto. Sin embargo, "si no se tiene una dirección específica en mente de antemano, se utiliza una alternativa bilateral. Además, algunos usuarios de la estadística sostienen que siempre deberíamos trabajar con la alternativa bilateral". [2] [21]

Una alternativa a este consejo es utilizar pruebas de tres resultados. Esto elimina los problemas relacionados con la direccionalidad de las hipótesis al realizar dos pruebas, una en cada dirección y combinar los resultados para producir tres resultados posibles. [22] Existen variaciones de este enfoque que existen desde 1950 y se han sugerido unas diez veces. [23]

Los desacuerdos sobre las pruebas unilaterales surgen de la filosofía de la ciencia. Mientras que Fisher estaba dispuesto a ignorar el caso improbable de que la Dama adivinara todas las tazas de té incorrectamente (lo que podría haber sido apropiado para las circunstancias), la medicina cree que un tratamiento propuesto que mata a los pacientes es significativo en todos los sentidos y debe informarse y tal vez explicarse. Las prácticas deficientes de informes estadísticos han contribuido a los desacuerdos sobre las pruebas unilaterales. La significación estadística resultante de las pruebas bilaterales es insensible al signo de la relación; informar la significación por sí sola es inadecuado. "El tratamiento tiene un efecto" es el resultado poco informativo de una prueba bilateral. "El tratamiento tiene un efecto beneficioso" es el resultado más informativo de una prueba unilateral. "El tratamiento tiene un efecto, reduciendo la duración promedio de la hospitalización en 1,5 días" es el informe más informativo, que combina un resultado de prueba de significación bilateral con una estimación numérica de la relación entre el tratamiento y el efecto. Informar explícitamente un resultado numérico elimina una ventaja filosófica de una prueba unilateral. Una cuestión subyacente es la forma apropiada de una ciencia experimental sin teorías predictivas numéricas: un modelo de resultados numéricos es más informativo que un modelo de signos de efecto (positivos, negativos o desconocidos), que es más informativo que un modelo de significación simple (distinto de cero o desconocido); en ausencia de teoría numérica, los signos pueden ser suficientes.

Historia de las pruebas estadísticas

La historia de las hipótesis nulas y alternativas tiene mucho que ver con la historia de las pruebas estadísticas. [24] [25]

Véase también

Notas

  1. ^ Nótese que el término "efecto" aquí no pretende implicar una relación causal.

Referencias

  1. ^ Helmenstine, Anne Marie. "¿Qué es la hipótesis nula? Definición y ejemplos". ThoughtCo . Consultado el 10 de diciembre de 2019 .
  2. ^ abcde Moore, David; McCabe, George (2003). Introducción a la práctica de la estadística (4.ª ed.). Nueva York: WH Freeman and Co. pág. 438. ISBN 978-0716796572.
  3. ^ Weiss, Neil A. (1999). Introducción a la estadística (5.ª ed.). Addison Wesley. pág. 494. ISBN 978-0201598773.
  4. ^ Rossi, RJ (2018), Estadística matemática , Wiley , pág. 281.
  5. ^ ab Neyman, J; Pearson, ES (1 de enero de 1933). "Sobre el problema de las pruebas más eficientes de hipótesis estadísticas". Philosophical Transactions of the Royal Society A . 231 (694–706): 289–337. Bibcode :1933RSPTA.231..289N. doi : 10.1098/rsta.1933.0009 .
  6. ^ Winkler, Robert L; Hays, William L (1975). Estadística: probabilidad, inferencia y decisión. Nueva York: Holt, Rinehart y Winston. pág. 403. ISBN 978-0-03-014011-2.
  7. ^ Everitt, Brian (1998). Diccionario de estadística de Cambridge . Cambridge y Nueva York: Cambridge University Press. ISBN 978-0521593465.
  8. ^ abcd Hayes, Adam. «Definición de hipótesis nula». Investopedia . Consultado el 10 de diciembre de 2019 .
  9. ^ Zhao, Guolong (18 de abril de 2015). "Una prueba de hipótesis no nula para tendencias lineales en proporciones". Comunicaciones en estadística: teoría y métodos . 44 (8): 1621–1639. doi :10.1080/03610926.2013.776687. ISSN  0361-0926. S2CID  120030713.
  10. ^ "Glosario de términos estadísticos de la OCDE: definición de hipótesis no nula". stats.oecd.org . Consultado el 5 de diciembre de 2020 .
  11. ^ Burnham, KP; Anderson, DR (2002), Selección de modelos e inferencia multimodelo: un enfoque práctico basado en la teoría de la información (2.ª ed.), Springer-Verlag, ISBN 978-0-387-95364-9.
  12. ^ Stockburger DW (2007), "Hipótesis y pruebas de hipótesis", Enciclopedia de medición y estadística (editor—Salkind NJ), SAGE Publications .
  13. ^ Chiang, I. -Chant A.; Jhangiani, Rajiv S.; Price, Paul C. (13 de octubre de 2015). "Comprensión de las pruebas de hipótesis nulas: métodos de investigación en psicología". opentextbc.ca . Consultado el 10 de diciembre de 2019 .
  14. ^ Cox, DR (1982). "Pruebas de significación estadística". Br. J. Clin. Pharmacol . 14 (3): 325–331. doi :10.1111/j.1365-2125.1982.tb01987.x. PMC 1427620. PMID  6751362 . 
  15. ^ Métodos estadísticos para investigadores (11.ª ed.): Capítulo IV: Pruebas de bondad de ajuste, independencia y homogeneidad; con tabla de χ 2 . En relación con una prueba de significación que apoya la bondad de ajuste: si la probabilidad calculada es alta, entonces "ciertamente no hay razón para sospechar que la hipótesis [nula] se ha probado. Si es [baja], es un fuerte indicio de que la hipótesis [nula] no explica la totalidad de los hechos".
  16. ^ Cox, DR (2006). Principios de inferencia estadística . Cambridge University Press. pág. 197. ISBN 978-0-521-68567-2.
  17. ^ Jones, B; P Jarvis; JA Lewis; AF Ebbutt (6 de julio de 1996). "Ensayos para evaluar la equivalencia: la importancia de los métodos rigurosos". BMJ . 313 (7048): 36–39. doi :10.1136/bmj.313.7048.36. PMC 2351444 . PMID  8664772.  Se sugiere que la posición predeterminada (la hipótesis nula) debería ser que los tratamientos no son equivalentes. Las conclusiones deberían basarse en intervalos de confianza en lugar de en la significación.
  18. ^ Fisher, RA (1966). El diseño de experimentos (8.ª ed.). Edimburgo: Hafner.
  19. ^ Por ejemplo, véase Hipótesis nula.
  20. ^ Lombardi, Celia M.; Hurlbert, Stuart H. (2009). "Mal uso y prescripción de pruebas unilaterales". Ecología Austral . 34 (4): 447–468. doi : 10.1111/j.1442-9993.2009.01946.x ​​. Analiza en profundidad los méritos y el uso histórico de las pruebas unilaterales en biología.
  21. ^ Bland, J Martin; Altman, Douglas G (23 de julio de 1994). "Pruebas de significación unilaterales y bilaterales". BMJ . 309 (6949): 248. doi :10.1136/bmj.309.6949.248. PMC 2540725 . PMID  8069143.  En lo que respecta a las estadísticas médicas: "En general, una prueba unilateral es adecuada cuando una gran diferencia en una dirección llevaría a la misma acción que ninguna diferencia en absoluto. La expectativa de una diferencia en una dirección particular no es una justificación adecuada". "Se deben utilizar pruebas bilaterales a menos que exista una muy buena razón para hacer lo contrario. Si se van a utilizar pruebas unilaterales, la dirección de la prueba debe especificarse de antemano. Las pruebas unilaterales nunca se deben utilizar simplemente como un mecanismo para hacer significativa una diferencia convencionalmente no significativa".
  22. ^ Jones, Lyle V.; Tukey, John W. (2000). "Una formulación sensata de la prueba de significación". Métodos psicológicos . 5 (4): 411–414. doi :10.1037/1082-989X.5.4.411. PMID  11194204. S2CID  14553341. Los resultados de la prueba se firman: efecto positivo significativo, efecto negativo significativo o efecto insignificante de signo desconocido. Esta es una conclusión más matizada que la de la prueba de dos colas. Tiene las ventajas de las pruebas de una cola sin las desventajas.
  23. ^ Hurlbert, SH; Lombardi, CM (2009). "Colapso final del marco teórico de decisiones de Neyman-Pearson y surgimiento del neofisheriano". Ann. Zool. Fennici . 46 (5): 311–349. doi :10.5735/086.046.0501. ISSN  1797-2450. S2CID  9688067.
  24. ^ ab Gigerenzer, Gerd; Zeno Swijtink; Theodore Porter; Lorraine Daston; John Beatty; Lorenz Kruger (1989). "Parte 3: Los expertos en inferencia". El imperio del azar: cómo la probabilidad cambió la ciencia y la vida cotidiana . Cambridge University Press. págs. 70–122. ISBN 978-0-521-39838-1.
  25. ^ Lehmann, EL (2011). Fisher, Neyman y la creación de la estadística clásica . Nueva York: Springer. ISBN 978-1441994998.
  26. ^ Aldrich, John. "Usos más antiguos conocidos de algunas palabras de probabilidad y estadística" . Consultado el 30 de junio de 2014 .Última actualización: 12 de marzo de 2003. Por Jeff Miller.
  27. ^ Lehmann, EL (diciembre de 1993). "Las teorías de Fisher, Neyman-Pearson sobre la prueba de hipótesis: ¿una teoría o dos?". Journal of the American Statistical Association . 88 (424): 1242–1249. doi :10.1080/01621459.1993.10476404.

Lectura adicional

Enlaces externos