stringtranslate.com

Arrepentimiento competitivo

En la teoría de decisiones , el arrepentimiento competitivo es el arrepentimiento relativo comparado con un oráculo con poder limitado o ilimitado en el proceso de estimación de distribución.

Arrepentimiento competitivo ante el oráculo con pleno poder

Considere estimar una distribución de probabilidad discreta en un conjunto discreto basado en datos , el arrepentimiento de un estimador [1] se define como

donde es el conjunto de todas las distribuciones de probabilidad posibles, y

¿Dónde está la divergencia de Kullback-Leibler entre y ?

Arrepentimiento competitivo ante el oráculo con poder limitado

Oráculo con información parcial

El oráculo está restringido a tener acceso a información parcial de la distribución verdadera al conocer la ubicación de en el espacio de parámetros hasta una partición. [1] Dada una partición del espacio de parámetros, y supongamos que el oráculo conoce el subconjunto donde se encuentra la distribución verdadera . El oráculo se arrepentirá como

El arrepentimiento competitivo ante el oráculo será

Oráculo con información parcial

El oráculo sabe exactamente , pero sólo puede elegir el estimador entre los estimadores naturales. Un estimador natural asigna la misma probabilidad a los símbolos que aparecen el mismo número de veces en la muestra. [1] El arrepentimiento del oráculo es

y el arrepentimiento competitivo es

Ejemplo

Para el estimador propuesto en Acharya et al.(2013), [2]

Aquí se denota la superficie símplex unitaria de dimensión k. La partición denota la clase de permutación en , donde y se dividen en el mismo subconjunto si y solo si es una permutación de .

Referencias

  1. ^ abc Orlitsky, Alon; Suresh, Ananda Theertha. (2015), Estimación de distribución competitiva , arXiv : 1503.07940 , Bibcode :2015arXiv150307940O
  2. ^ Acharya, Jayadev; Jafarpour, Ashkan; Orlitsky, Alon; Suresh, Ananda Theertha (2013), "Estimación de probabilidad óptima con aplicaciones a la predicción y clasificación", Actas de la 26.ª Conferencia Anual sobre Teoría del Aprendizaje (COLT)