stringtranslate.com

Media aritmética ponderada

La media aritmética ponderada es similar a una media aritmética ordinaria (el tipo más común de promedio ), excepto que en lugar de que cada uno de los puntos de datos contribuya por igual al promedio final, algunos puntos de datos contribuyen más que otros. La noción de media ponderada desempeña un papel en la estadística descriptiva y también aparece de forma más general en otras áreas de las matemáticas.

Si todos los pesos son iguales, entonces la media ponderada es la misma que la media aritmética . Si bien las medias ponderadas generalmente se comportan de manera similar a las medias aritméticas, tienen algunas propiedades contraintuitivas, como se refleja, por ejemplo, en la paradoja de Simpson .

Ejemplos

Ejemplo básico

Se le dan dos clases escolares , una con 20 estudiantes y otra con 30 estudiantes , y las calificaciones de las pruebas en cada clase son las siguientes:

Clase de la mañana = {62, 67, 71, 74, 76, 77, 78, 79, 79, 80, 80, 81, 81, 82, 83, 84, 86, 89, 93, 98}

Clase de la tarde = {81, 82, 83, 84, 85, 86, 87, 87, 88, 88, 89, 89, 89, 90, 90, 90, 90, 91, 91, 91, 92, 92, 93, 93, 94, 95, 96, 97, 98, 99}

La media de la clase de la mañana es 80 y la media de la clase de la tarde es 90. La media no ponderada de las dos medias es 85. Sin embargo, esto no toma en cuenta la diferencia en el número de estudiantes en cada clase (20 versus 30); por lo tanto, el valor de 85 no refleja la calificación promedio del estudiante (independientemente de la clase). La calificación promedio de un estudiante se puede obtener promediando todas las calificaciones, sin importar las clases (sume todas las calificaciones y divida por el número total de estudiantes):

O esto se puede lograr ponderando las medias de las clases por el número de estudiantes en cada clase. A la clase más grande se le da más "peso":

Así, la media ponderada permite encontrar la nota media de los alumnos sin conocer la puntuación de cada alumno. Sólo se necesitan las medias de clase y el número de estudiantes en cada clase.

Ejemplo de combinación convexa

Dado que sólo los pesos relativos son relevantes, cualquier media ponderada puede expresarse utilizando coeficientes que sumen uno. Esta combinación lineal se llama combinación convexa .

Usando el ejemplo anterior, obtendríamos los siguientes pesos:

Luego, aplica los pesos de esta manera:

Definición matemática

Formalmente, la media ponderada de una tupla finita de datos no vacía , con sus correspondientes pesos no negativos es

que se expande a:

Por lo tanto, los elementos de datos con un peso alto contribuyen más a la media ponderada que los elementos con un peso bajo. Los pesos no pueden ser negativos para que la ecuación funcione [a] . Algunos pueden ser cero, pero no todos (ya que no se permite la división por cero).

Las fórmulas se simplifican cuando los pesos se normalizan de modo que sumen 1, es decir, . Para tales ponderaciones normalizadas, la media ponderada es equivalente:

.

Siempre se pueden normalizar los pesos realizando la siguiente transformación sobre los pesos originales:

.

La media ordinaria es un caso especial de la media ponderada donde todos los datos tienen pesos iguales.

Si los elementos de datos son variables aleatorias independientes y distribuidas idénticamente con varianza , se puede demostrar que el error estándar de la media ponderada , mediante la propagación de la incertidumbre, es:

Pesos definidos por la varianza

Para la media ponderada de una lista de datos en la que cada elemento proviene potencialmente de una distribución de probabilidad diferente con varianza conocida , y todos tienen la misma media, una posible elección para las ponderaciones viene dada por el recíproco de la varianza:

La media ponderada en este caso es:

y el error estándar de la media ponderada (con ponderaciones de varianza inversa) es:

Tenga en cuenta que esto se reduce a cuando todos . Es un caso especial de la fórmula general de la sección anterior,

Las ecuaciones anteriores se pueden combinar para obtener:

La importancia de esta elección es que esta media ponderada es el estimador de máxima verosimilitud de la media de las distribuciones de probabilidad bajo el supuesto de que son independientes y están normalmente distribuidas con la misma media.

Propiedades estadísticas

Expectativa

La media muestral ponderada, , es en sí misma una variable aleatoria. Su valor esperado y desviación estándar están relacionados con los valores esperados y las desviaciones estándar de las observaciones, de la siguiente manera. Para simplificar, asumimos ponderaciones normalizadas (ponderaciones que suman uno).

Si las observaciones tienen valores esperados.

Diferencia

caso iid simple

Cuando se tratan los pesos como constantes y se tiene una muestra de n observaciones de variables aleatorias no correlacionadas , todas con la misma varianza y expectativa (como es el caso de las variables aleatorias iid ), entonces la varianza de la media ponderada se puede estimar como la multiplicación. de la varianza no ponderada por el efecto de diseño de Kish (ver prueba ):

Con y _

Sin embargo, esta estimación es bastante limitada debido a los fuertes supuestos sobre las observaciones y . Esto ha llevado al desarrollo de estimadores alternativos, más generales.

Perspectiva del muestreo de la encuesta

Desde una perspectiva basada en modelos , nos interesa estimar la varianza de la media ponderada cuando las diferentes no son variables aleatorias iid . Una perspectiva alternativa para este problema es la de algún diseño de muestreo arbitrario de los datos en el que las unidades se seleccionan con probabilidades desiguales (con reemplazo). [1] : 306 

En la metodología de encuesta , la media poblacional, de alguna cantidad de interés y , se calcula tomando una estimación del total de y sobre todos los elementos de la población ( Y o, a veces, T ) y dividiéndola por el tamaño de la población, ya sea conocida ( ). o estimado ( ). En este contexto, cada valor de y se considera constante y la variabilidad proviene del procedimiento de selección. Esto contrasta con los enfoques "basados ​​en modelos" en los que la aleatoriedad a menudo se describe en los valores de y. El procedimiento de muestreo de la encuesta produce una serie de valores del indicador Bernoulli ( ) que obtienen 1 si alguna observación i está en la muestra y 0 si no fue seleccionada. Esto puede ocurrir con un tamaño de muestra fijo o con un muestreo de tamaño de muestra variado (por ejemplo, muestreo de Poisson ). La probabilidad de que se elija algún elemento, dada una muestra, se denota como , y la probabilidad de selección de un sorteo es (si N es muy grande y cada uno es muy pequeño). Para la siguiente derivación asumiremos que la probabilidad de seleccionar cada elemento está completamente representada por estas probabilidades. [2] : 42, 43, 51  Es decir: seleccionar algún elemento no influirá en la probabilidad de extraer otro elemento (esto no se aplica a cosas como el diseño de muestreo por conglomerados ).

Como cada elemento ( ) es fijo, y la aleatoriedad proviene de estar incluido o no en la muestra ( ), solemos hablar de la multiplicación de los dos, que es una variable aleatoria. Para evitar confusiones en la siguiente sección, llamemos a este término: . Con la siguiente expectativa: ; y variación: .

Cuando cada elemento de la muestra se infla por la inversa de su probabilidad de selección, se denomina valores de y expandidos , es decir: . Una cantidad relacionada tiene valores de y expandidos : . [2] : 42, 43, 51, 52  Como arriba, podemos agregar una marca si multiplicamos por la función del indicador. Es decir:

En esta perspectiva basada en el diseño , las ponderaciones, utilizadas en el numerador de la media ponderada, se obtienen tomando la inversa de la probabilidad de selección (es decir, el factor de inflación). Es decir: .

Varianza de la suma ponderada ( pwr -estimador para totales)

Si se conoce el tamaño de la población N, podemos estimar la media poblacional usando .

Si el diseño de muestreo da como resultado un tamaño de muestra fijo n (como en el muestreo pps ), entonces la varianza de este estimador es:

Prueba

La fórmula general se puede desarrollar así:

La población total se denota como y puede estimarse mediante el estimador (insesgado) de Horvitz-Thompson , también llamado estimador. Este estimador puede estimarse a su vez utilizando el estimador pwr (es decir: estimador ampliado con reemplazo o estimador de "probabilidad con reemplazo"). Con la notación anterior, es: . [2] : 51 

La varianza estimada del estimador pwr viene dada por: [2] : 52 

dónde .

La fórmula anterior fue tomada de Sarndal et al. (1992) (también presentado en Cochran 1977), pero fue escrito de manera diferente. [2] : 52  [1] : 307 (11.35)  El lado izquierdo es cómo se escribió la varianza y el lado derecho es cómo desarrollamos la versión ponderada:

Y llegamos a la fórmula desde arriba.

Un término alternativo, para cuando el muestreo tiene un tamaño de muestra aleatorio (como en el muestreo de Poisson ), se presenta en Sarndal et al. (1992) como: [2] : 182 

Con . Además, ¿ dónde está la probabilidad de seleccionar tanto i como j? [2] : 36  Y , y para i=j: . [2] : 43 

Si las probabilidades de selección no están correlacionadas (es decir: ), y al asumir que la probabilidad de cada elemento es muy pequeña, entonces:

Prueba

Asumimos eso y eso

Varianza de la media ponderada ( π -estimador de ratio-media)

La sección anterior trató sobre la estimación de la media poblacional como una proporción de una población total estimada ( ) con un tamaño de población conocido ( ), y la varianza se estimó en ese contexto. Otro caso común es que el tamaño de la población en sí ( ) se desconoce y se estima utilizando la muestra (es decir: ). La estimación de puede describirse como la suma de pesos. Entonces, cuando lleguemos . Con la notación anterior, el parámetro que nos importa es la relación de las sumas de sy 1s. Es decir: . Podemos estimarlo usando nuestra muestra con: . A medida que pasamos del uso de N al uso de n, en realidad sabemos que todas las variables del indicador obtienen 1, por lo que simplemente podríamos escribir: . Esta será la estimación para valores específicos de y y w, pero las propiedades estadísticas surgen al incluir la variable indicadora . [2] : 162, 163, 176 

Esto se llama estimador de razón y es aproximadamente insesgado para R. [2] : 182 

En este caso, la variabilidad de la relación depende de la variabilidad de las variables aleatorias tanto en el numerador como en el denominador, así como de su correlación. Dado que no existe una forma analítica cerrada para calcular esta varianza, se utilizan varios métodos para una estimación aproximada. Principalmente linealización de primer orden de series de Taylor , asintóticas y bootstrap/jackknife. [2] : 172  El método de linealización de Taylor podría llevar a una subestimación de la varianza para tamaños de muestra pequeños en general, pero eso depende de la complejidad de la estadística. Para la media ponderada, se supone que la varianza aproximada es relativamente precisa incluso para tamaños de muestra medianos. [2] : 176  Para cuando el muestreo tiene un tamaño de muestra aleatorio (como en el muestreo de Poisson ), queda como sigue: [2] : 182 

.

Si , entonces usar o daría el mismo estimador, ya que multiplicar por algún factor conduciría al mismo estimador. También significa que si escalamos la suma de ponderaciones para que sea igual a un tamaño de población N conocido desde antes , el cálculo de la varianza sería el mismo. Cuando todos los pesos son iguales entre sí, esta fórmula se reduce al estimador de varianza insesgado estándar.

Prueba

La linealización de Taylor establece que para un estimador de razón general de dos sumas ( ), se pueden expandir alrededor del valor verdadero R y dar: [2] : 178 

Y la varianza se puede aproximar mediante: [2] : 178, 179 

.

El término es la covarianza estimada entre la suma estimada de Y y la suma estimada de Z. Dado que esta es la covarianza de dos sumas de variables aleatorias , incluiría muchas combinaciones de covarianzas que dependerán de las variables indicadoras. Si la probabilidad de selección no está correlacionada (es decir: ), este término aún incluiría una suma de n covarianzas para cada elemento i entre y . Esto ayuda a ilustrar que esta fórmula incorpora el efecto de la correlación entre y y z en la varianza de los estimadores de razones.

Al definir lo anterior queda: [2] : 182 

Si las probabilidades de selección no están correlacionadas (es decir: ), y cuando se supone que la probabilidad de cada elemento es muy pequeña (es decir: ), entonces lo anterior se reduce a lo siguiente:

Thomas Lumley proporcionó una recreación similar de la prueba (con algunos errores al final) en validación cruzada. [3]

Tenemos (al menos) dos versiones de la varianza para la media ponderada: una con estimación del tamaño de la población conocida y otra con estimación desconocida. No existe un enfoque uniformemente mejor, pero la literatura presenta varios argumentos para preferir usar la versión de estimación de población (incluso cuando se conoce el tamaño de la población). [2] : 188  Por ejemplo: si todos los valores de y son constantes, el estimador con tamaño de población desconocido dará el resultado correcto, mientras que el que tiene tamaño de población conocido tendrá cierta variabilidad. Además, cuando el tamaño de la muestra en sí es aleatorio (por ejemplo, en el muestreo de Poisson ), la versión con media poblacional desconocida se considera más estable. Por último, si la proporción del muestreo está correlacionada negativamente con los valores (es decir, menor probabilidad de muestrear una observación que es grande), entonces la versión de tamaño de población desconocido lo compensa ligeramente.

Para el caso trivial en el que todos los pesos son iguales a 1, la fórmula anterior es igual que la fórmula normal para la varianza de la media (pero observe que utiliza el estimador de máxima verosimilitud para la varianza en lugar de la varianza insesgada. Es decir: dividiéndolo por n en lugar de (n-1)).

Validación de arranque

Se ha demostrado, por Gatz et al. (1995), que en comparación con los métodos de arranque , lo siguiente (estimación de la varianza de la relación media utilizando la linealización de la serie de Taylor ) es una estimación razonable para el cuadrado del error estándar de la media (cuando se utiliza en el contexto de la medición de componentes químicos) : [4] : 1186 

dónde . Una mayor simplificación conduce a

Gatz et al. mencionar que la formulación anterior fue publicada por Endlich et al. (1988) al tratar la media ponderada como una combinación de un estimador total ponderado dividido por un estimador del tamaño de la población, [5] basándose en la formulación publicada por Cochran (1977), como una aproximación a la media del ratio. Sin embargo, Endlich et al. no pareció publicar esta derivación en su artículo (aunque mencionan que la usaron), y el libro de Cochran incluye una formulación ligeramente diferente. [1] : 155  Aún así, es casi idéntico a las formulaciones descritas en secciones anteriores.

Estimadores basados ​​en replicación

Debido a que no existe una forma analítica cerrada para la varianza de la media ponderada, en la literatura se propuso confiar en métodos de replicación como Jackknife y Bootstrapping . [1] : 321 

Otras notas

Para observaciones no correlacionadas con varianzas , la varianza de la media muestral ponderada es [ cita necesaria ]

cuya raíz cuadrada puede denominarse error estándar de la media ponderada (caso general) . [ cita necesaria ]

En consecuencia, si todas las observaciones tienen la misma varianza, la media muestral ponderada tendrá varianza

dónde . La varianza alcanza su valor máximo, cuando todos los pesos excepto uno son cero. Su valor mínimo se encuentra cuando todos los pesos son iguales (es decir, media no ponderada), en cuyo caso tenemos , es decir, degenera en el error estándar de la media , al cuadrado.

Debido a que siempre se pueden transformar pesos no normalizados en pesos normalizados, todas las fórmulas de esta sección se pueden adaptar a pesos no normalizados reemplazando all .

Conceptos relacionados

Varianza de muestra ponderada

Normalmente, cuando se calcula una media, es importante conocer la varianza y la desviación estándar de esa media. Cuando se utiliza una media ponderada , la varianza de la muestra ponderada es diferente de la varianza de la muestra no ponderada.

La varianza de la muestra ponderada sesgada se define de manera similar a la varianza de la muestra sesgada normal :

donde para pesos normalizados. Si las ponderaciones son ponderaciones de frecuencia (y, por lo tanto, son variables aleatorias), se puede demostrar [ cita necesaria ] que es el estimador de máxima verosimilitud de las observaciones gaussianas iid .

Para muestras pequeñas, se acostumbra utilizar un estimador insesgado de la varianza poblacional. En muestras normales no ponderadas, la N en el denominador (correspondiente al tamaño de la muestra) se cambia a N  − 1 (consulte la corrección de Bessel ). En el entorno ponderado, en realidad existen dos estimadores insesgados diferentes, uno para el caso de las ponderaciones de frecuencia y otro para el caso de las ponderaciones de confiabilidad .

Pesos de frecuencia

Si las ponderaciones son ponderaciones de frecuencia (donde una ponderación es igual al número de ocurrencias), entonces el estimador insesgado es:

Esto aplica efectivamente la corrección de Bessel para ponderaciones de frecuencia.

Por ejemplo, si los valores se extraen de la misma distribución, entonces podemos tratar este conjunto como una muestra no ponderada, o podemos tratarlo como una muestra ponderada con los pesos correspondientes , y obtenemos el mismo resultado de cualquier manera.

Si las ponderaciones de frecuencia se normalizan a 1, entonces la expresión correcta después de la corrección de Bessel se convierte en

donde el número total de muestras es (no ). En cualquier caso, la información sobre el número total de muestras es necesaria para obtener una corrección insesgada, incluso si tiene un significado diferente al de ponderación frecuencial.

El estimador puede ser insesgado sólo si las ponderaciones no están estandarizadas ni normalizadas , estos procesos cambian la media y la varianza de los datos y, por lo tanto, conducen a una pérdida de la tasa base (el recuento de población, que es un requisito para la corrección de Bessel).

Pesos de confiabilidad

Si, en cambio, las ponderaciones no son aleatorias ( ponderaciones de confiabilidad [ definición necesaria ] ), podemos determinar un factor de corrección para producir un estimador insesgado. Suponiendo que cada variable aleatoria se muestrea de la misma distribución con media y varianza real , tomando las expectativas que tenemos,

dónde y . Por lo tanto, el sesgo en nuestro estimador es , análogo al sesgo en el estimador no ponderado (obsérvese también que es el tamaño de muestra efectivo ). Esto significa que para eliminar el sesgo de nuestro estimador debemos dividir previamente entre , asegurando que el valor esperado de la varianza estimada sea igual a la varianza real de la distribución muestral.

La estimación final insesgada de la varianza muestral es:

[6]

dónde .

Los grados de libertad de la varianza de la muestra ponderada e insesgada varían en consecuencia desde N  − 1 hasta 0.

La desviación estándar es simplemente la raíz cuadrada de la varianza anterior.

Como nota al margen, se han descrito otros enfoques para calcular la varianza muestral ponderada. [7]

Covarianza de muestra ponderada

En una muestra ponderada, a cada vector de fila (cada conjunto de observaciones individuales en cada una de las K variables aleatorias) se le asigna un peso .

Entonces el vector medio ponderado viene dado por

Y la matriz de covarianza ponderada viene dada por: [8]

De manera similar a la varianza de la muestra ponderada, existen dos estimadores insesgados diferentes según el tipo de ponderaciones.

Pesos de frecuencia

Si las ponderaciones son ponderaciones de frecuencia , la estimación ponderada insesgada de la matriz de covarianza , con la corrección de Bessel, viene dada por: [8]

Este estimador puede ser insesgado sólo si las ponderaciones no están estandarizadas ni normalizadas , estos procesos cambian la media y la varianza de los datos y, por lo tanto, conducen a una pérdida de la tasa base (el recuento de población, que es un requisito para la corrección de Bessel).

Pesos de confiabilidad

En el caso de las ponderaciones de confiabilidad , las ponderaciones están normalizadas :

(Si no es así, divida los pesos por su suma para normalizarlos antes de calcular :

Entonces el vector medio ponderado se puede simplificar a

y la estimación ponderada insesgada de la matriz de covarianza es: [9]

El razonamiento aquí es el mismo que en el apartado anterior.

Como suponemos que los pesos están normalizados, esto se reduce a:

Si todas las ponderaciones son iguales, es decir , entonces la media ponderada y la covarianza se reducen a la media muestral no ponderada y la covarianza anteriores.

Estimaciones valoradas por vectores

Lo anterior se generaliza fácilmente al caso de tomar la media de estimaciones con valores vectoriales. Por ejemplo, las estimaciones de posición en un avión pueden tener menos certeza en una dirección que en otra. Como en el caso escalar, la media ponderada de estimaciones múltiples puede proporcionar una estimación de máxima verosimilitud . Simplemente reemplazamos la varianza por la matriz de covarianza y la inversa aritmética por la matriz inversa (ambas indicadas de la misma manera, mediante superíndices); la matriz de peso luego dice: [10]

La media ponderada en este caso es:

producto matriz-vectorconmutativo

Por ejemplo, considere la media ponderada del punto [1 0] con alta varianza en el segundo componente y [0 1] con alta varianza en el primer componente. Entonces

entonces la media ponderada es:

lo cual tiene sentido: la estimación [1 0] es "cumple" en el segundo componente y la estimación [0 1] es compatible en el primer componente, por lo que la media ponderada es casi [1 1].

Contabilización de correlaciones

En el caso general, supongamos que , es la matriz de covarianza que relaciona las cantidades , es la media común a estimar y es una matriz de diseño igual a un vector de unos (de longitud ). El teorema de Gauss-Markov establece que la estimación de la media con varianza mínima viene dada por:

y

dónde:

Disminución de la fuerza de las interacciones.

Considere la serie de tiempo de una variable independiente y una variable dependiente , con observaciones muestreadas en tiempos discretos . En muchas situaciones comunes, el valor de at time depende no sólo de sus valores pasados ​​sino también de ellos. Comúnmente, la fuerza de esta dependencia disminuye a medida que aumenta la separación de las observaciones en el tiempo. Para modelar esta situación, se puede reemplazar la variable independiente por su media móvil para un tamaño de ventana .

Pesos exponencialmente decrecientes

En el escenario descrito en la sección anterior, lo más frecuente es que la disminución de la fuerza de interacción obedezca una ley exponencial negativa. Si las observaciones se muestrean en tiempos equidistantes, entonces la disminución exponencial equivale a una disminución en una fracción constante en cada paso de tiempo. Configuración podemos definir pesos normalizados por

donde es la suma de los pesos no normalizados. En este caso es simplemente

acercándose para valores grandes de .

La constante de amortiguación debe corresponder a la disminución real de la fuerza de interacción. Si esto no se puede determinar a partir de consideraciones teóricas, entonces las siguientes propiedades de los pesos exponencialmente decrecientes son útiles para hacer una elección adecuada: en el paso , el peso es aproximadamente igual a , el área de la cola al valor , el área de la cabeza . El área de la cola en el paso es . Cuando importan principalmente las observaciones más cercanas y el efecto de las observaciones restantes se puede ignorar con seguridad, entonces elija una opción tal que el área de la cola sea suficientemente pequeña.

Promedios ponderados de funciones

El concepto de promedio ponderado se puede extender a funciones. [11] Los promedios ponderados de funciones juegan un papel importante en los sistemas de cálculo diferencial e integral ponderado. [12]

Corrección de dispersión excesiva o insuficiente

Las medias ponderadas se utilizan normalmente para encontrar la media ponderada de datos históricos, en lugar de datos generados teóricamente. En este caso, habrá algún error en la varianza de cada punto de datos. Por lo general, los errores experimentales pueden subestimarse debido a que el experimentador no tiene en cuenta todas las fuentes de error al calcular la varianza de cada punto de datos. En este caso, la varianza en la media ponderada debe corregirse para tener en cuenta el hecho de que es demasiado grande. La corrección que se debe hacer es

¿ Dónde está el chi-cuadrado reducido ?

La raíz cuadrada puede denominarse error estándar de la media ponderada (ponderaciones de varianza, escala corregida) .

Cuando todas las varianzas de los datos son iguales, se cancelan en la varianza media ponderada, que nuevamente se reduce al error estándar de la media (al cuadrado), formulado en términos de la desviación estándar de la muestra (al cuadrado),

Ver también

Notas

  1. ^ Técnicamente, se pueden utilizar negativos si todos los valores son cero o negativos. Sin embargo, esto no cumple ninguna función ya que los pesos funcionan como valores absolutos .

Referencias

  1. ^ abcd Cochran, WG (1977). Técnicas de muestreo (3ª ed.). Nashville, Tennessee: John Wiley & Sons. ISBN  978-0-471-16240-7
  2. ^ abcdefghijklmnopq Carl-Erik Sarndal; Bengt Swensson; Jan Wretman (1992). Muestreo de encuestas asistido por modelos . ISBN 978-0-387-97528-3.
  3. ^ Thomas Lumley (https://stats.stackexchange.com/users/249135/thomas-lumley), ¿Cómo estimar la varianza (aproximada) de la media ponderada?, URL (versión: 2021-06-08): https: //stats.stackexchange.com/q/525770
  4. ^ Gatz, Donald F.; Smith, Lutero (junio de 1995). "El error estándar de una concentración media ponderada: I. Bootstrapping frente a otros métodos". Ambiente Atmosférico . 29 (11): 1185-1193. Código Bib : 1995AtmEn..29.1185G. doi :10.1016/1352-2310(94)00210-C.- enlace pdf
  5. ^ Endlich, RM; Eymon, BP; Ferek, RJ; Valdés, AD; Maxwell, C. (1 de diciembre de 1988). "Análisis estadístico de las mediciones de la química de la precipitación en el este de los Estados Unidos. Parte I: correlaciones y patrones estacionales y regionales". Revista de Meteorología y Climatología Aplicadas . 27 (12): 1322-1333. doi : 10.1175/1520-0450(1988)027<1322:SAOPCM>2.0.CO;2 .
  6. ^ "Biblioteca científica GNU - Manual de referencia: muestras ponderadas". Gnu.org . Consultado el 22 de diciembre de 2017 .
  7. ^ "Error estándar ponderado y su impacto en las pruebas de significancia (WinCross vs. Quantum y SPSS), Dr. Albert Madansky" (PDF) . Grupo analítico.com . Consultado el 22 de diciembre de 2017 .
  8. ^ ab Price, George R. (abril de 1972). "Ampliación de las matemáticas de selección de covarianza" (PDF) . Anales de genética humana . 35 (4): 485–490. doi :10.1111/j.1469-1809.1957.tb01874.x. PMID  5073694. S2CID  37828617.
  9. ^ Mark Galassi, Jim Davies, James Theiler, Brian Gough, Gerard Jungman, Michael Booth y Fabrice Rossi. Biblioteca científica GNU: manual de referencia, versión 1.15, 2011. Sec. 21.7 Muestras ponderadas
  10. ^ James, Federico (2006). Métodos estadísticos en física experimental (2ª ed.). Singapur: World Scientific. pag. 324.ISBN _ 981-270-527-9.
  11. ^ GH Hardy, JE Littlewood y G. Pólya. Desigualdades (2ª ed.), Cambridge University Press, ISBN 978-0-521-35880-4 , 1988. 
  12. ^ Jane Grossman, Michael Grossman, Robert Katz. Los primeros sistemas de cálculo diferencial e integral ponderado, ISBN 0-9771170-1-4 , 1980. 

Otras lecturas

enlaces externos