stringtranslate.com

Análisis de Procusto

Superposición de Procusto. La figura muestra los tres pasos de transformación de un Procusto ordinario apto para dos configuraciones de puntos de referencia. (a) Escalado de ambas configuraciones al mismo tamaño; b) Transposición a la misma posición del centro de gravedad; (c) Rotación a la orientación que proporcione la suma mínima de distancias al cuadrado entre puntos de referencia correspondientes.

En estadística , el análisis de Procrustes es una forma de análisis estadístico de formas que se utiliza para analizar la distribución de un conjunto de formas . El nombre Procusto ( griego : Προκρούστης ) hace referencia a un bandido de la mitología griega que hacía que sus víctimas encajaran en su cama ya sea estirando sus extremidades o cortándolas.

En matemáticas:

Cuando se compara una forma con otra, o un conjunto de formas con una forma de referencia seleccionada arbitrariamente, el análisis de Procrustes a veces se califica además como clásico u ordinario , a diferencia del análisis de Procrustes generalizado (GPA), que compara tres o más formas con una "forma media" óptimamente determinada.

Introducción

Para comparar las formas de dos o más objetos, primero los objetos deben "superponerse" de manera óptima. La superposición de Procrustes (PS) se realiza trasladando , rotando y escalando uniformemente de manera óptima los objetos. En otras palabras, tanto la ubicación en el espacio como el tamaño de los objetos se pueden ajustar libremente. El objetivo es obtener una ubicación y un tamaño similares, minimizando una medida de diferencia de forma llamada distancia de Procrustes entre los objetos. Esto a veces se denomina PS completo , a diferencia del PS parcial , en el que no se realiza el escalado (es decir, se conserva el tamaño de los objetos). Observe que, después de la PS completa, los objetos coincidirán exactamente si su forma es idéntica. Por ejemplo, con PS completo siempre coincidirán dos esferas con radios diferentes, porque tienen exactamente la misma forma. Por el contrario, con PS parciales nunca coincidirán. Esto implica que, según la definición estricta del término forma en geometría , el análisis de forma debe realizarse utilizando PS completo. Un análisis estadístico basado en PS parcial no es un análisis de forma puro ya que no sólo es sensible a las diferencias de forma, sino también a las diferencias de tamaño. Tanto el PS completo como el parcial nunca conseguirán combinar perfectamente dos objetos con formas diferentes, como un cubo y una esfera, o una mano derecha y una mano izquierda.

En algunos casos, tanto el PS total como el parcial también pueden incluir reflexión . La reflexión permite, por ejemplo, una superposición exitosa (posiblemente perfecta) de una mano derecha a una mano izquierda. Por lo tanto, el PS parcial con la reflexión habilitada conserva el tamaño pero permite la traslación, la rotación y la reflexión, mientras que el PS completo con la reflexión habilitada permite la traslación, la rotación, el escalado y la reflexión.

La traducción y el escalado óptimos se determinan con operaciones mucho más simples (ver más abajo).

Análisis de Procusto ordinario

Aquí simplemente consideramos objetos formados por un número finito k de puntos en n dimensiones. A menudo, estos puntos se seleccionan en la superficie continua de objetos complejos, como un hueso humano, y en este caso se denominan puntos de referencia .

La forma de un objeto puede considerarse como miembro de una clase de equivalencia formada eliminando los componentes de traslación , rotación y escala uniforme .

Traducción

Por ejemplo, los componentes traslacionales se pueden eliminar de un objeto traduciendo el objeto de modo que la media de todos los puntos del objeto (es decir, su centroide ) se encuentre en el origen.

Matemáticamente: tomar puntos en dos dimensiones, digamos

.

La media de estos puntos es donde

Ahora traduce estos puntos para que su media se traduzca al origen , dando el punto .

Escalado uniforme

Del mismo modo, el componente de escala se puede eliminar escalando el objeto de modo que la distancia cuadrática media ( RMSD ) desde los puntos hasta el origen trasladado sea 1. Este RMSD es una medida estadística de la escala o tamaño del objeto :

La escala pasa a ser 1 cuando las coordenadas del punto se dividen por la escala inicial del objeto:

.

Tenga en cuenta que en la literatura a veces se utilizan otros métodos para definir y eliminar la escala.

Rotación

Quitar el componente rotacional es más complejo, ya que no siempre está disponible una orientación de referencia estándar. Considere dos objetos compuestos por el mismo número de puntos sin escala ni traslación. Sean los puntos de estos , . Uno de estos objetos se puede utilizar para proporcionar una orientación de referencia. Fije el objeto de referencia y gire el otro alrededor del origen, hasta encontrar un ángulo de rotación óptimo tal que se minimice la suma de las distancias al cuadrado ( SSD ) entre los puntos correspondientes (un ejemplo de técnica de mínimos cuadrados ).

Una rotación por ángulo da

.

donde (u,v) son las coordenadas de un punto rotado. Tomando la derivada de con respecto a y resolviendo cuando la derivada es cero da

Cuando el objeto es tridimensional, la rotación óptima se representa mediante una matriz de rotación R de 3 por 3 , en lugar de un simple ángulo, y en este caso se puede utilizar la descomposición en valores singulares para encontrar el valor óptimo de R (ver la solución para el problema de Procusto ortogonal restringido , sujeto a det ( R ) = 1).

Comparación de formas

La diferencia entre la forma de dos objetos se puede evaluar sólo después de "superponer" los dos objetos trasladándolos, escalándolos y girándolos de manera óptima como se explicó anteriormente. La raíz cuadrada del SSD mencionado anteriormente entre puntos correspondientes se puede utilizar como medida estadística de esta diferencia de forma:

Esta medida suele denominarse distancia de Procusto . Tenga en cuenta que en la literatura a veces se utilizan otras definiciones más complejas de la distancia de Procusto y otras medidas de "diferencia de forma".

Superponer un conjunto de formas.

Mostramos cómo superponer dos formas. Se puede aplicar el mismo método para superponer un conjunto de tres o más formas, siempre que se utilice para todas ellas la orientación de referencia mencionada anteriormente. Sin embargo, el análisis de Procrustes generalizado proporciona un método mejor para lograr este objetivo.

Análisis de Procusto generalizado (GPA)

GPA aplica el método de análisis de Procrustes para superponer de manera óptima un conjunto de objetos, en lugar de superponerlos a una forma seleccionada arbitrariamente.

El análisis de Procusto generalizado y el ordinario se diferencian sólo en la determinación de una orientación de referencia para los objetos, que en la primera técnica se determina de manera óptima y en la segunda se selecciona arbitrariamente. Ambas técnicas realizan el escalado y la traducción de la misma manera. Cuando sólo se comparan dos formas, el GPA equivale al análisis de Procrustes ordinario.

El esquema del algoritmo es el siguiente:

  1. elegir arbitrariamente una forma de referencia (normalmente seleccionándola entre las instancias disponibles)
  2. superponer todas las instancias a la forma de referencia actual
  3. calcular la forma media del conjunto actual de formas superpuestas
  4. si la distancia de Procrustes entre la forma media y de referencia está por encima de un umbral, establezca la referencia a la forma media y continúe con el paso 2.

Variaciones

Hay muchas formas de representar la forma de un objeto. La forma de un objeto puede considerarse como miembro de una clase de equivalencia formada tomando el conjunto de todos los conjuntos de k puntos en n dimensiones, es decir R kn y factorizando el conjunto de todas las traslaciones, rotaciones y escalas. Una representación particular de la forma se encuentra eligiendo una representación particular de la clase de equivalencia. Esto dará una variedad de dimensión kn -4. Procrustes es un método para hacer esto con una justificación estadística particular.

Bookstein obtiene una representación de la forma fijando la posición de dos puntos llamados línea de bases. Un punto se fijará en el origen y el otro en (1,0) los puntos restantes forman las coordenadas de Bookstein .

También es común considerar la forma y la escala, es decir, sin los componentes de traslación y rotación.

Ejemplos

El análisis de forma se utiliza en datos biológicos para identificar las variaciones de características anatómicas caracterizadas por datos de referencia, por ejemplo al considerar la forma de los huesos de la mandíbula. [1]

Un estudio realizado por David George Kendall examinó los triángulos formados por piedras verticales para deducir si a menudo estaban dispuestas en líneas rectas. La forma de un triángulo se puede representar como un punto en la esfera, y la distribución de todas las formas se puede pensar en una distribución sobre la esfera. La distribución de la muestra de los menhires se comparó con la distribución teórica para mostrar que la aparición de líneas rectas no superaba el promedio. [2]

Ver también

Referencias

  1. ^ "Explorando la forma del espacio" Archivado el 1 de septiembre de 2006 en la Wayback Machine por Nancy Marie Brown, Research/Penn State, vol. 15, núm. 1 de marzo de 1994
  2. ^ "Un estudio de la teoría estadística de la forma", por David G. Kendall, Statistical Science, vol. 4, núm. 2 (mayo de 1989), págs. 87–99

enlaces externos