La prueba estadística es la demostración racional del grado de certeza de una proposición , hipótesis o teoría que se utiliza para convencer a otros después de una prueba estadística de la evidencia de apoyo y los tipos de inferencias que se pueden extraer de los puntajes de la prueba. Los métodos estadísticos se utilizan para aumentar la comprensión de los hechos y la prueba demuestra la validez y la lógica de la inferencia con referencia explícita a una hipótesis, los datos experimentales , los hechos, la prueba y las probabilidades . La prueba tiene dos objetivos esenciales: el primero es convencer y el segundo es explicar la proposición a través de una revisión por pares y pública. [1]
La carga de la prueba recae sobre la aplicación demostrable del método estadístico, la revelación de los supuestos y la relevancia que tiene la prueba con respecto a una comprensión genuina de los datos en relación con el mundo externo. Hay partidarios de varias filosofías estadísticas de inferencia diferentes, como el teorema de Bayes frente a la función de verosimilitud , o el positivismo frente al racionalismo crítico . Estos métodos de razonamiento tienen una relación directa con la prueba estadística y sus interpretaciones en la filosofía más amplia de la ciencia. [1] [2]
Una demarcación común entre ciencia y no ciencia es la prueba hipotético-deductiva de falsación desarrollada por Karl Popper , que es una práctica bien establecida en la tradición de la estadística. Sin embargo, otros modos de inferencia pueden incluir los modos de prueba inductivos y abductivos . [3] Los científicos no utilizan la prueba estadística como un medio para alcanzar la certeza, sino para falsificar afirmaciones y explicar la teoría. La ciencia no puede lograr la certeza absoluta ni es una marcha continua hacia una verdad objetiva como podría implicar el significado vernáculo en oposición al científico del término "prueba". La prueba estadística ofrece un tipo de prueba de la falsedad de una teoría y los medios para aprender heurísticamente a través de ensayos estadísticos repetidos y error experimental. [2] La prueba estadística también tiene aplicaciones en asuntos legales con implicaciones para la carga legal de la prueba . [4]
Hay dos tipos de axiomas : 1) las convenciones que se toman como verdaderas y que deben evitarse porque no pueden probarse, y 2) las hipótesis. [5] La prueba en la teoría de la probabilidad se basó en cuatro axiomas desarrollados a fines del siglo XVII:
Los axiomas anteriores proporcionan la prueba estadística y la base de las leyes de aleatoriedad o probabilidad objetiva, a partir de las cuales ha avanzado la teoría estadística moderna. Sin embargo, los datos experimentales nunca pueden probar que la hipótesis (h) sea verdadera, sino que se basan en una inferencia inductiva midiendo la probabilidad de las hipótesis en relación con los datos empíricos. La prueba está en la demostración racional del uso de la lógica de la inferencia , las matemáticas , las pruebas y el razonamiento deductivo de la significancia . [1] [2] [6]
El término prueba desciende de sus raíces latinas (provable, probable, probare L.) que significa probar . [7] [8] Por lo tanto, la prueba es una forma de inferencia por medio de una prueba estadística. Las pruebas estadísticas se formulan en modelos que generan distribuciones de probabilidad . Los ejemplos de distribuciones de probabilidad pueden incluir la distribución binaria , normal o de Poisson que brindan descripciones exactas de variables que se comportan de acuerdo con las leyes naturales del azar . Cuando se aplica una prueba estadística a muestras de una población, la prueba determina si las estadísticas de la muestra son significativamente diferentes del modelo nulo asumido . Los valores verdaderos de una población, que son incognoscibles en la práctica, se denominan parámetros de la población. Los investigadores toman muestras de poblaciones, que proporcionan estimaciones de los parámetros, para calcular la media o la desviación estándar. Si se muestrea toda la población, entonces la media y la distribución de la estadística de la muestra convergerán con la distribución paramétrica. [9]
Utilizando el método científico de falsificación, el valor de probabilidad de que la estadística de la muestra sea suficientemente diferente del modelo nulo como para que pueda explicarse únicamente por el azar se proporciona antes de la prueba. La mayoría de los estadísticos establecen el valor de probabilidad previa en 0,05 o 0,1, lo que significa que si las estadísticas de la muestra divergen del modelo paramétrico más de 5 (o 10) veces de cada 100, entonces es poco probable que la discrepancia se explique únicamente por el azar y se rechaza la hipótesis nula. Los modelos estadísticos proporcionan resultados exactos de los paramétricos y estimaciones de las estadísticas de la muestra. Por lo tanto, la carga de la prueba recae en las estadísticas de la muestra que proporcionan estimaciones de un modelo estadístico. Los modelos estadísticos contienen la prueba matemática de los valores paramétricos y sus distribuciones de probabilidad. [10] [11]
Las estadísticas bayesianas se basan en un enfoque filosófico diferente para la prueba de inferencia . La fórmula matemática del teorema de Bayes es:
La fórmula se lee como la probabilidad del parámetro (o hipótesis = h , como se usa en la notación de axiomas) "dados" los datos (o la observación empírica), donde la barra horizontal se refiere a "dado". El lado derecho de la fórmula calcula la probabilidad previa de un modelo estadístico (Pr [Parámetro]) con la probabilidad (Pr [Datos | Parámetro]) de producir una distribución de probabilidad posterior del parámetro (Pr [Parámetro | Datos]). La probabilidad posterior es la probabilidad de que el parámetro sea correcto dados los datos observados o las estadísticas de las muestras. [12] Las hipótesis se pueden comparar utilizando la inferencia bayesiana por medio del factor Bayes, que es la relación entre las probabilidades posteriores y las probabilidades previas. Proporciona una medida de los datos y si ha aumentado o disminuido la probabilidad de una hipótesis en relación con otra. [13]
La prueba estadística es la demostración bayesiana de que una hipótesis tiene una probabilidad mayor (débil, fuerte, positiva). [13] Existe un debate considerable sobre si el método bayesiano se alinea con el método de prueba de falsificación de Karl Popper, donde algunos han sugerido que "... no existe tal cosa como "aceptar" hipótesis en absoluto. Todo lo que uno hace en ciencia es asignar grados de creencia..." [14] : 180 Según Popper, las hipótesis que han resistido la prueba y aún no han sido falsificadas no se verifican sino que se corroboran . Algunas investigaciones han sugerido que la búsqueda de Popper para definir la corroboración sobre la premisa de la probabilidad puso su filosofía en línea con el enfoque bayesiano. En este contexto, la probabilidad de una hipótesis en relación con otra puede ser un índice de corroboración, no de confirmación, y por lo tanto estadísticamente probada a través de una posición objetiva rigurosa. [6] [15]
"Cuando se puedan demostrar grandes disparidades estadísticas, sólo ellas podrán, en un caso adecuado, constituir una prueba prima facie de un patrón o práctica de discriminación." [nb 1] : 271
Las pruebas estadísticas en un procedimiento judicial se pueden clasificar en tres categorías de evidencia:
La prueba estadística no se aplicó regularmente en decisiones relativas a procedimientos legales en los Estados Unidos hasta mediados de la década de 1970, tras un caso histórico de discriminación por parte del jurado en Castaneda v. Partida . La Corte Suprema de los Estados Unidos dictaminó que las disparidades estadísticas flagrantes constituyen una " prueba prima facie " de discriminación, lo que dio lugar a un cambio de la carga de la prueba del demandante al demandado. Desde esa sentencia, la prueba estadística se ha utilizado en muchos otros casos sobre desigualdad, discriminación y pruebas de ADN. [4] [17] [18] Sin embargo, no existe una correspondencia unívoca entre la prueba estadística y la carga legal de la prueba. "La Corte Suprema ha declarado que los grados de rigor requeridos en los procesos de determinación de hechos del derecho y la ciencia no necesariamente se corresponden". [18] : 1533
En un ejemplo de sentencia a muerte ( McCleskey v. Kemp [nb 2] ) relacionada con discriminación racial, el peticionario, un hombre negro llamado McCleskey, fue acusado del asesinato de un policía blanco durante un robo. El testimonio del experto de McCleskey presentó una prueba estadística que mostraba que "los acusados de matar a víctimas blancas tenían 4,3 veces más probabilidades de recibir una sentencia de muerte que los acusados de matar a negros". [19] : 595 No obstante, las estadísticas eran insuficientes "para demostrar que los que tomaron las decisiones en su caso actuaron con un propósito discriminatorio". [19] : 596 Se argumentó además que existían "limitaciones inherentes de la prueba estadística", [19] : 596 porque no se refería a los detalles del individuo. A pesar de la demostración estadística de una mayor probabilidad de discriminación, la carga legal de la prueba (se argumentó) tenía que examinarse caso por caso. [19]
biometría.