stringtranslate.com

Análisis circular

En estadística , el análisis circular es la selección de los detalles de un análisis de datos utilizando los datos que se están analizando. A menudo se lo conoce como double dipping , ya que se utilizan los mismos datos dos veces. El análisis circular infla injustificadamente la aparente solidez estadística de los resultados informados y, en el caso más extremo, puede llevar a que el resultado aparentemente significativo se encuentre en datos que solo consisten en ruido. En particular, cuando se implementa un experimento para estudiar un efecto postulado, es un mal uso de la estadística reducir inicialmente el conjunto de datos completo seleccionando un subconjunto de datos de maneras que estén alineadas con los efectos que se están estudiando. Un segundo mal uso ocurre cuando el desempeño de un modelo ajustado o una regla de clasificación se informa como un resultado bruto, sin tener en cuenta los efectos de la selección del modelo y el ajuste de los parámetros en función de los datos que se están analizando.

Ejemplos

En su forma más simple, puede incluir la decisión de eliminar los valores atípicos, después de notar que esto podría ayudar a mejorar el análisis de un experimento. El efecto puede ser más sutil. En los datos de imágenes por resonancia magnética funcional (fMRI), por ejemplo, a menudo se necesita una cantidad considerable de preprocesamiento. Estos pueden aplicarse de manera incremental hasta que el análisis "funcione". De manera similar, los clasificadores utilizados en un análisis de patrones multivoxel de datos fMRI requieren parámetros, que podrían ajustarse para maximizar la precisión de la clasificación.

En geología, se ha observado el potencial del análisis circular [1] en el caso de mapas de fallas geológicas, que pueden dibujarse partiendo de la suposición de que las fallas se desarrollan y propagan de una manera particular, y esos mapas se utilizan posteriormente como evidencia de que las fallas en realidad se desarrollan de esa manera.

Soluciones

Un diseño cuidadoso del análisis que se planea realizar, antes de recopilar los datos, significa que la elección del análisis no se ve afectada por los datos recopilados. Alternativamente, se puede decidir perfeccionar la clasificación en uno o dos participantes y luego utilizar el análisis en los datos de los participantes restantes. Con respecto a la selección de parámetros de clasificación, un método común es dividir los datos en dos conjuntos y encontrar el parámetro óptimo utilizando un conjunto y luego probar utilizando este valor de parámetro en el segundo conjunto. Esta es una técnica estándar [ cita requerida ] utilizada (por ejemplo) por la biblioteca de clasificación MVPA de Princeton. [2]

Notas

  1. ^ Scott, DL; Braun, J.; Etheridge, MA (1994). "Análisis de inclinación como herramienta para estimar la cinemática regional en terrenos extensionales". Journal of Structural Geology . 16 (3): 393. doi :10.1016/0191-8141(94)90043-4.
  2. ^ "Princeton Multi-Voxel Pattern Analysis (MVPA) Toolbox | Neuroscience" (Caja de herramientas de análisis de patrones multivóxel de Princeton [MVPA] | Neurociencia)". pni.princeton.edu . Consultado el 23 de julio de 2019 .

Referencias