stringtranslate.com

Modelo de clase latente

En estadística , un modelo de clase latente ( MCM ) es un modelo para agrupar datos discretos multivariados. Supone que los datos surgen de una mezcla de distribuciones discretas, dentro de cada una de las cuales las variables son independientes. Se denomina modelo de clase latente porque la clase a la que pertenece cada punto de datos no es observable o es latente.

El análisis de clases latentes ( LCA ) es un subconjunto del modelado de ecuaciones estructurales que se utiliza para encontrar grupos o subtipos de casos en datos categóricos multivariados . Estos subtipos se denominan "clases latentes". [1] [2]

Ante una situación como la siguiente, un investigador podría optar por utilizar el ACV para comprender los datos: imaginemos que se han medido los síntomas ad en un rango de pacientes con enfermedades X, Y y Z, y que la enfermedad X está asociada con la presencia de los síntomas a, b y c, la enfermedad Y con los síntomas b, c y d, y la enfermedad Z con los síntomas a, c y d.

El ACV intentará detectar la presencia de clases latentes (las entidades patológicas), creando patrones de asociación en los síntomas. Al igual que en el análisis factorial , el ACV también se puede utilizar para clasificar los casos según su pertenencia a la clase de máxima verosimilitud . [1] [3]

Debido a que el criterio para resolver el ACV es lograr clases latentes dentro de las cuales ya no hay ninguna asociación de un síntoma con otro (porque la clase es la enfermedad que causa su asociación), y el conjunto de enfermedades que tiene un paciente (o la clase de la que un caso es miembro) causa la asociación de síntomas, los síntomas serán "condicionalmente independientes", es decir, condicionalmente a la pertenencia a la clase, ya no están relacionados. [1]

Modelo

Dentro de cada clase latente, las variables observadas son estadísticamente independientes . Este es un aspecto importante. Normalmente las variables observadas son estadísticamente dependientes. Al introducir la variable latente, se restablece la independencia en el sentido de que dentro de las clases las variables son independientes ( independencia local ). Decimos entonces que la asociación entre las variables observadas se explica por las clases de la variable latente (McCutcheon, 1987).

En una forma, el modelo de clase latente se escribe como

donde es el número de clases latentes y son las llamadas probabilidades de reclutamiento o incondicionales que deben sumar uno. son las probabilidades marginales o condicionales.

Para un modelo de clase latente bidireccional, la forma es

Este modelo bidireccional está relacionado con el análisis semántico latente probabilístico y la factorización matricial no negativa .

El modelo de probabilidad utilizado en el ACV está estrechamente relacionado con el clasificador Naive Bayes . La principal diferencia es que en el ACV, la pertenencia a una clase de un individuo es una variable latente, mientras que en los clasificadores Naive Bayes la pertenencia a una clase es una etiqueta observada.

Métodos relacionados

Existen varios métodos con nombres y usos distintos que comparten una relación común. El análisis de conglomerados se utiliza, como el ACV, para descubrir grupos de casos similares a taxones en los datos. La estimación de mezcla multivariante (MME) es aplicable a datos continuos y supone que dichos datos surgen de una mezcla de distribuciones: imagine un conjunto de alturas que surgen de una mezcla de hombres y mujeres. Si una estimación de mezcla multivariante está restringida de modo que las medidas no deben estar correlacionadas dentro de cada distribución, se denomina análisis de perfil latente . Modificado para manejar datos discretos, este análisis restringido se conoce como ACV. Los modelos de rasgos latentes discretos restringen aún más las clases para que se formen a partir de segmentos de una sola dimensión: esencialmente asignando miembros a clases en esa dimensión: un ejemplo sería asignar casos a clases sociales en una dimensión de capacidad o mérito.

Como ejemplo práctico, las variables podrían ser preguntas de opción múltiple de un cuestionario político. Los datos en este caso consisten en una tabla de contingencia de N variables con respuestas a las preguntas para un número de encuestados. En este ejemplo, la variable latente se refiere a la opinión política y las clases latentes a los grupos políticos. Dada la pertenencia a un grupo, las probabilidades condicionales especifican la probabilidad de que se elijan ciertas respuestas.

Solicitud

El ACV se puede utilizar en muchos campos, como: filtrado colaborativo , [4] genética del comportamiento [5] y evaluación de pruebas diagnósticas. [6]

Referencias

  1. ^ abc Lazarsfeld, PF y Henry, NW (1968) Análisis de la estructura latente . Boston: Houghton Mifflin
  2. ^ Formann , Alaska (1984). Análisis de clases latentes: Einführung in die Theorie und Anwendung [Análisis de clases latentes: Introducción a la teoría y aplicación] . Weinheim: Beltz.
  3. ^ Teichert, Thorsten (2000). "Das Latent-Ciass Verfahren zur Segmentierung von wahlbasierten Conjoint-Daten. Befunde einer empirischen Anwendung". Comercialización ZFP . 22 (3): 227–240. doi :10.15358/0344-1369-2000-3-227. ISSN  0344-1369.
  4. ^ Cheung, Kwok-Wai; Tsui, Kwok-Ching; Liu, Jiming (2004). "Modelos de clases latentes extendidas para recomendación colaborativa". IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans . 34 (1): 143–148. CiteSeerX 10.1.1.6.2234 . doi :10.1109/TSMCA.2003.818877. S2CID  11628144. 
  5. ^ Eaves, LJ, Silberg, JL, Hewitt, JK, Rutter, M., Meyer, JM, Neale, MC y Pickles, A (1993). "Análisis de la semejanza entre gemelos en datos multisintomáticos: aplicaciones genéticas de un modelo de clase latente para los síntomas del trastorno de conducta en niños jóvenes". Genética del comportamiento . 23 (1): 5–19. doi :10.1007/bf01067550. PMID  8476390. S2CID  40678009.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  6. ^ Bermingham, ML, Handel, IG, Glass, EJ, Woolliams, JA, de Clare Bronsvoort, BM, McBride, SH, Skuce, RA, Allen, A . R., McDowell, SWJ, y Bishop, SC (2015). "El modelo de clase latente de Hui y Walters ampliado para estimar las propiedades de las pruebas diagnósticas a partir de datos de vigilancia: un modelo latente para datos latentes". Scientific Reports . 5 : 11861. Bibcode :2015NatSR...511861B. doi :10.1038/srep11861. PMC 4493568 . PMID  26148538. {{cite journal}}: CS1 maint: multiple names: authors list (link)

Enlaces externos