stringtranslate.com

Estadísticas no paramétricas

La estadística no paramétrica es un tipo de análisis estadístico que hace suposiciones mínimas sobre la distribución subyacente de los datos que se estudian. A menudo, estos modelos son de dimensión infinita, en lugar de finita, como lo es la estadística paramétrica. [1] Las estadísticas no paramétricas se pueden utilizar para estadísticas descriptivas o inferencia estadística . Las pruebas no paramétricas se utilizan a menudo cuando es evidente que se violan los supuestos de las pruebas paramétricas. [2]

Definiciones

El término "estadística no paramétrica" ​​se ha definido de forma imprecisa, entre otras, de las dos formas siguientes:

  1. El primer significado de no paramétrico implica técnicas que no se basan en datos que pertenecen a ninguna familia paramétrica particular de distribuciones de probabilidad.

    Estos incluyen, entre otros:

    • Métodos que no tienen distribución , que no se basan en suposiciones de que los datos se extraen de una familia paramétrica determinada de distribuciones de probabilidad .
    • Estadísticas definidas como una función sobre una muestra, sin dependencia de un parámetro .

    Un ejemplo son las estadísticas de orden , que se basan en la clasificación ordinal de observaciones.

    La discusión siguiente está tomada de la Teoría Avanzada de la Estadística de Kendall . [3]

    Las hipótesis estadísticas se refieren al comportamiento de variables aleatorias observables... Por ejemplo, la hipótesis (a) de que una distribución normal tiene una media y una varianza específicas es estadística; también lo es la hipótesis (b) de que tiene una media dada pero una varianza no especificada; también lo es la hipótesis (c) de que una distribución es de forma normal sin especificar ni la media ni la varianza; finalmente, también lo es la hipótesis (d) de que dos distribuciones continuas no especificadas son idénticas.

    Se habrá observado que en los ejemplos (a) y (b) la distribución subyacente a las observaciones se consideró de cierta forma (la normal) y la hipótesis se refería enteramente al valor de uno o ambos parámetros. Esta hipótesis, por razones obvias, se denomina paramétrica .

    La hipótesis (c) era de naturaleza diferente, ya que no se especifican valores de parámetros en el enunciado de la hipótesis; Podríamos razonablemente llamar a tal hipótesis no paramétrica . La hipótesis (d) tampoco es paramétrica pero, además, ni siquiera especifica la forma subyacente de la distribución y ahora puede denominarse razonablemente libre de distribución . A pesar de estas distinciones, la literatura estadística ahora aplica comúnmente la etiqueta "no paramétrico" a los procedimientos de prueba que acabamos de denominar "libres de distribución", perdiendo así una clasificación útil.

  2. El segundo significado de no paramétrico implica técnicas que no suponen que la estructura de un modelo sea fija. Normalmente, el modelo aumenta de tamaño para adaptarse a la complejidad de los datos. En estas técnicas, normalmente se supone que las variables individuales pertenecen a distribuciones paramétricas y también se hacen suposiciones sobre los tipos de asociaciones entre variables. Estas técnicas incluyen, entre otras:
    • regresión no paramétrica , que es un modelado mediante el cual la estructura de la relación entre variables se trata de manera no paramétrica, pero donde, sin embargo, puede haber supuestos paramétricos sobre la distribución de los residuos del modelo.
    • Modelos bayesianos jerárquicos no paramétricos , como los modelos basados ​​en el proceso de Dirichlet , que permiten que el número de variables latentes crezca según sea necesario para ajustarse a los datos, pero donde las variables individuales aún siguen distribuciones paramétricas e incluso el proceso que controla la tasa de crecimiento de Las variables latentes siguen una distribución paramétrica.

Aplicaciones y finalidad

Los métodos no paramétricos se utilizan ampliamente para estudiar poblaciones que tienen un orden de clasificación (como reseñas de películas que reciben de una a cuatro "estrellas"). El uso de métodos no paramétricos puede ser necesario cuando los datos tienen una clasificación pero no una interpretación numérica clara , como cuando se evalúan las preferencias . En términos de niveles de medición , los métodos no paramétricos dan como resultado datos ordinales .

Como los métodos no paramétricos parten de menos suposiciones, su aplicabilidad es mucho más general que los métodos paramétricos correspondientes. En particular, podrán aplicarse en situaciones en las que se sepa menos sobre la aplicación en cuestión. Además, debido a que se basan en menos supuestos, los métodos no paramétricos son más sólidos .

Los métodos no paramétricos a veces se consideran más sencillos de usar y más sólidos que los métodos paramétricos, incluso cuando los supuestos de los métodos paramétricos están justificados. Esto se debe a su naturaleza más general, que puede hacerlos menos susceptibles de mal uso y malentendidos. Los métodos no paramétricos pueden considerarse una opción conservadora, ya que funcionarán incluso cuando no se cumplan sus supuestos, mientras que los métodos paramétricos pueden producir resultados engañosos cuando se violen sus supuestos.

La aplicabilidad más amplia y la mayor solidez de las pruebas no paramétricas tienen un costo: en los casos en que una prueba paramétrica sería apropiada, las pruebas no paramétricas tienen menos poder estadístico . En otras palabras, se puede requerir un tamaño de muestra mayor para sacar conclusiones con el mismo grado de confianza.

Modelos no paramétricos

Los modelos no paramétricos se diferencian de los modelos paramétricos en que la estructura del modelo no se especifica a priori sino que se determina a partir de los datos. El término no paramétrico no implica que tales modelos carezcan completamente de parámetros, sino que el número y la naturaleza de los parámetros son flexibles y no están fijados de antemano.

Métodos

Los métodos estadísticos inferenciales no paramétricos (o libres de distribución ) son procedimientos matemáticos para probar hipótesis estadísticas que, a diferencia de las estadísticas paramétricas , no hacen suposiciones sobre las distribuciones de probabilidad de las variables que se evalúan. Las pruebas más utilizadas incluyen

Historia

Las primeras estadísticas no paramétricas incluyen la mediana (siglo XIII o antes, utilizada en la estimación por Edward Wright , 1599; ver Mediana § Historia ) y la prueba de signos de John Arbuthnot (1710) al analizar la proporción de sexos humanos al nacer (ver Prueba de signos § Historia ). [4] [5]

Ver también

Notas

  1. ^ "Todas las estadísticas no paramétricas". Textos Springer en Estadística . 2006.doi : 10.1007 /0-387-30623-4.
  2. ^ Pearce, J; Torre de perforación, B (2019). "Pruebas preliminares: ¿El diablo de las estadísticas?". Reinvención: una revista internacional de investigación de pregrado . 12 (2). doi : 10.31273/reinvención.v12i2.339 .
  3. ^ Stuart A., Ord JK, Arnold S. (1999), Teoría avanzada de la estadística de Kendall: volumen 2A: inferencia clásica y modelo lineal , sexta edición, §20.2–20.3 ( Arnold ).
  4. ^ Conover, WJ (1999), "Capítulo 3.4: La prueba de signos", Estadística práctica no paramétrica (tercera ed.), Wiley, págs. 157-176, ISBN 0-471-16068-7
  5. ^ Sprent, P. (1989), Métodos estadísticos no paramétricos aplicados (Segunda ed.), Chapman & Hall, ISBN 0-412-44980-3

Referencias generales