La estadística paramétrica es una rama de la estadística que aprovecha modelos basados en un conjunto fijo (finito) de parámetros . [1] Por el contrario, la estadística no paramétrica no asume formas matemáticas explícitas (finito-paramétricas) para las distribuciones al modelar datos. Sin embargo, puede hacer algunas suposiciones sobre esa distribución, como la continuidad o la simetría, o incluso una forma matemática explícita, pero tener un modelo para un parámetro de distribución que no es en sí mismo finito-paramétrico.
La mayoría de los métodos estadísticos más conocidos son paramétricos. [2] Con respecto a los modelos no paramétricos (y semiparamétricos), Sir David Cox ha dicho: "Éstos suelen implicar menos supuestos de estructura y forma distributiva, pero suelen contener supuestos sólidos sobre independencias". [3]
Todas las distribuciones de la familia normal tienen la misma forma general y están parametrizadas por la media y la desviación estándar . Esto significa que si se conocen la media y la desviación estándar y si la distribución es normal, se conoce la probabilidad de que cualquier observación futura se encuentre en un rango determinado.
Supongamos que tenemos una muestra de 99 puntuaciones de exámenes con una media de 100 y una desviación estándar de 1. Si asumimos que las 99 puntuaciones de exámenes son observaciones aleatorias de una distribución normal, entonces predecimos que hay una probabilidad del 1% de que la puntuación número 100 de la prueba sea mayor que 102,33 (es decir, la media más 2,33 desviaciones estándar), suponiendo que la puntuación número 100 de la prueba proviene de la misma distribución que las demás. Se utilizan métodos estadísticos paramétricos para calcular el valor 2,33 anterior, dadas 99 observaciones independientes de la misma distribución normal.
Una estimación no paramétrica de lo mismo es el máximo de las primeras 99 puntuaciones. No necesitamos suponer nada sobre la distribución de las puntuaciones de los exámenes para razonar que antes de realizar el examen era igualmente probable que la puntuación más alta fuera cualquiera de las primeras 100. Por lo tanto, hay una probabilidad del 1% de que la puntuación número 100 sea más alta que cualquiera de las 99 que la precedieron.
La estadística paramétrica fue mencionada por RA Fisher en su obra Métodos estadísticos para investigadores en 1925, que creó las bases para la estadística moderna.