En las pruebas de hipótesis estadísticas , se ha propuesto el p-rep o p rep como una alternativa estadística al valor p clásico . [1] Mientras que un valor p es la probabilidad de obtener un resultado bajo la hipótesis nula, p-rep pretende calcular la probabilidad de replicar un efecto. La derivación de p-rep contenía errores matemáticos significativos.
Durante un tiempo, la Asociación para la Ciencia Psicológica recomendó que los artículos enviados a Psychological Science y sus otras revistas informaran el p-rep en lugar del clásico valor p, [2] pero este ya no es el caso. [3]
El valor de p-rep ( p rep ) se puede aproximar en función del valor p ( p ) de la siguiente manera:
Lo anterior se aplica a distribuciones de una cola.
El hecho de que el p-rep tenga una correspondencia uno a uno con el valor p deja claro que esta nueva medida no aporta información adicional más allá de la transmitida por la significancia del resultado. Killeen reconoce esta falta de información, pero sugiere que el p-rep capta mejor la forma en que los experimentadores ingenuos conceptualizan los valores p y las pruebas de hipótesis estadísticas .
Entre las críticas a p-rep está el hecho de que, si bien intenta estimar la replicabilidad, ignora los resultados de otros estudios que pueden guiar con precisión esta estimación. [4] Por ejemplo, un experimento sobre algún fenómeno paranormal improbable puede arrojar un p-rep de 0,75. La mayoría de las personas aún no concluirían que la probabilidad de una replicación es del 75%. Más bien, concluirían que está mucho más cerca de 0: Las afirmaciones extraordinarias requieren evidencia extraordinaria , y p-rep ignora esto. Debido a esto, p-rep puede, de hecho, ser más difícil de interpretar que un valor p clásico. El hecho de que p-rep requiera suposiciones sobre probabilidades previas para que sea válido hace que su interpretación sea compleja. Killeen sostiene que los nuevos resultados deben evaluarse por derecho propio, sin la "carga de la historia", con antecedentes planos: eso es lo que produce p-rep. Una estimación más pragmática de la replicabilidad incluiría el conocimiento previo, a través, por ejemplo, del metaanálisis .
Los críticos también han subrayado errores matemáticos en el artículo original de Killeen. Por ejemplo, la fórmula que relaciona los tamaños del efecto de dos réplicas de un experimento dado utiliza erróneamente una de estas variables aleatorias como parámetro de la distribución de probabilidad de la otra, mientras que anteriormente había planteado la hipótesis de que estas dos variables eran independientes , [5] críticas que Killeen aborda en su réplica. [6]
Otra crítica a la estadística p-rep involucra la lógica de la experimentación. El valor científico de los datos replicables reside en la adecuada consideración de factores no medidos previamente (por ejemplo, variables no medidas de los participantes, sesgo del experimentador , etc.). La idea de que un solo estudio puede capturar una probabilidad lógica de que dichos factores no medidos afecten el resultado y, por lo tanto, la probabilidad de replicabilidad, es una falacia lógica. [ cita requerida ]