En estadística , el problema de la clase de referencia es el problema de decidir qué clase utilizar al calcular la probabilidad aplicable a un caso particular.
Por ejemplo, para estimar la probabilidad de que un avión se estrelle, podríamos referirnos a la frecuencia de accidentes entre varios conjuntos diferentes de aeronaves: todas las aeronaves, esta marca de aeronave, aeronaves voladas por esta compañía en los últimos diez años, etc. En este ejemplo, la aeronave para la que deseamos calcular la probabilidad de un accidente es miembro de muchas clases diferentes, en las que la frecuencia de los accidentes difiere. No es obvio a qué clase deberíamos referirnos para esta aeronave. En general, cualquier caso es miembro de muchas clases entre las que difiere la frecuencia del atributo de interés. El problema de la clase de referencia analiza qué clase es la más apropiada para usar.
De manera más formal, muchos argumentos en estadística toman la forma de un silogismo estadístico :
Se denomina "clase de referencia" y es la "clase de atributo" y es el objeto individual. ¿Cómo se puede elegir una clase adecuada ?
En la estadística bayesiana , el problema surge como el de decidir una probabilidad previa para el resultado en cuestión (o cuando se consideran resultados múltiples, una distribución de probabilidad previa).
John Venn afirmó en 1876 que «cada cosa o acontecimiento tiene un número indefinido de propiedades o atributos observables en ella, y por tanto podría considerarse que pertenece a un número indefinido de clases diferentes de cosas», lo que plantea problemas a la hora de asignar probabilidades a un único caso. Puso como ejemplo la probabilidad de que John Smith, un inglés tuberculoso de cincuenta años, viva hasta los sesenta y un años. [1]
El nombre de "problema de la clase de referencia" fue dado por Hans Reichenbach , quien escribió: "Si se nos pide que encontremos la probabilidad que se cumple para un evento futuro individual, primero debemos incorporar el evento en una clase de referencia adecuada. Una cosa o evento individual puede incorporarse en muchas clases de referencia, de las cuales resultarán diferentes probabilidades". [2]
También se ha discutido el problema de la clase de referencia en filosofía [3] y en las ciencias de la vida , por ejemplo, la predicción de ensayos clínicos. [4]
La aplicación práctica de la probabilidad bayesiana implica evaluar una probabilidad previa que luego se aplica a una función de probabilidad y se actualiza mediante el uso del teorema de Bayes . Supongamos que deseamos evaluar la probabilidad de culpabilidad de un acusado en un caso judicial en el que hay pruebas de ADN (u otras pruebas probabilísticas). Primero debemos evaluar la probabilidad previa de culpabilidad del acusado. Podríamos decir que el crimen ocurrió en una ciudad de 1.000.000 de personas, de las cuales el 15% cumple los requisitos de ser del mismo sexo, grupo de edad y descripción aproximada que el perpetrador. Eso sugiere una probabilidad previa de culpabilidad de 1 en 150.000. Podríamos ampliar la red y decir que hay, digamos, un 25% de posibilidades de que el perpetrador sea de fuera de la ciudad, pero aún así de este país, y construir una estimación previa diferente. Podríamos decir que el perpetrador podría venir de cualquier parte del mundo, y así sucesivamente.
Los teóricos legales han discutido el problema de la clase de referencia particularmente con referencia al caso Shonubi. Charles Shonubi, un traficante de drogas nigeriano, fue arrestado en el aeropuerto JFK el 10 de diciembre de 1991 y condenado por importación de heroína . La severidad de su sentencia dependía no sólo de la cantidad de drogas en ese viaje, sino de la cantidad total de drogas que se estimaba que había importado en siete ocasiones anteriores en las que no fue atrapado. Cinco casos legales separados debatieron cómo se debería estimar esa cantidad. En un caso, "Shonubi III", la fiscalía presentó evidencia estadística de la cantidad de drogas encontradas en los traficantes de drogas nigerianos atrapados en el aeropuerto JFK en el período entre el primer y el último viaje de Shonubi. Ha habido debate sobre si esa es la clase de referencia correcta que se debe utilizar y, de ser así, por qué. [5] [6]
Otras aplicaciones legales involucran la valuación. Por ejemplo, las casas pueden ser valuadas usando los datos en una base de datos de ventas de casas "similares". Para decidir qué casas son similares a una dada, uno necesita saber qué características de una casa son relevantes para el precio. El número de baños puede ser relevante, pero no el color de ojos del propietario. Se ha argumentado que tales problemas de clase de referencia pueden ser resueltos al encontrar qué características son relevantes: una característica es relevante para el precio de la casa si el precio de la casa covaría con ella (afecta la probabilidad de que la casa tenga un valor mayor o menor), y la clase de referencia ideal para un individuo es el conjunto de todos los casos que comparten con él todas las características relevantes. [7] [8]