Concepto en la teoría de la decisión
En la teoría de decisiones , el arrepentimiento competitivo es el arrepentimiento relativo comparado con un oráculo con poder limitado o ilimitado en el proceso de estimación de distribución.
Arrepentimiento competitivo ante el oráculo con pleno poder
Considere estimar una distribución de probabilidad discreta en un conjunto discreto basado en datos , el arrepentimiento de un estimador [1] se define como
donde es el conjunto de todas las distribuciones de probabilidad posibles, y
¿Dónde está la divergencia de Kullback-Leibler entre y ?
Arrepentimiento competitivo ante el oráculo con poder limitado
Oráculo con información parcial
El oráculo está restringido a tener acceso a información parcial de la distribución verdadera al conocer la ubicación de en el espacio de parámetros hasta una partición. [1] Dada una partición del espacio de parámetros, y supongamos que el oráculo conoce el subconjunto donde se encuentra la distribución verdadera . El oráculo se arrepentirá como
El arrepentimiento competitivo ante el oráculo será
Oráculo con información parcial
El oráculo sabe exactamente , pero sólo puede elegir el estimador entre los estimadores naturales. Un estimador natural asigna la misma probabilidad a los símbolos que aparecen el mismo número de veces en la muestra. [1] El arrepentimiento del oráculo es
y el arrepentimiento competitivo es
Ejemplo
Para el estimador propuesto en Acharya et al.(2013), [2]
Aquí se denota la superficie símplex unitaria de dimensión k. La partición denota la clase de permutación en , donde y se dividen en el mismo subconjunto si y solo si es una permutación de .
Referencias
- ^ abc Orlitsky, Alon; Suresh, Ananda Theertha. (2015), Estimación de distribución competitiva , arXiv : 1503.07940 , Bibcode :2015arXiv150307940O
- ^ Acharya, Jayadev; Jafarpour, Ashkan; Orlitsky, Alon; Suresh, Ananda Theertha (2013), "Estimación de probabilidad óptima con aplicaciones a la predicción y clasificación", Actas de la 26.ª Conferencia Anual sobre Teoría del Aprendizaje (COLT)