stringtranslate.com

Premio Hutter

El Premio Hutter es un premio en efectivo financiado por Marcus Hutter que recompensa las mejoras en la compresión de datos en un archivo de texto en inglés específico de 1 GB , con el objetivo de fomentar la investigación en inteligencia artificial (IA).

Lanzado en 2006, el premio otorga 5000 euros por cada uno por ciento de mejora (con una financiación total de 500.000 euros) [1] en el tamaño comprimido del archivo enwik9 , que es el más grande de los dos archivos utilizados en el Large Text Compression Benchmark (LTCB); [2] enwik9 consiste en los primeros 10 9 bytes de una versión específica de Wikipedia en inglés . [3] La competencia en curso [4] está organizada por Hutter, Matt Mahoney y Jim Bowery. [1]

El premio se anunció el 6 de agosto de 2006 [1] con un archivo de texto más pequeño: enwik8, que consta de 100 MB. El 21 de febrero de 2020 se amplió por un factor de 10, a enwik9 de 1 GB, el premio pasó de 50.000 a 500.000 euros.

Objetivos

El objetivo del Premio Hutter es fomentar la investigación en inteligencia artificial (IA). Los organizadores creen que la compresión de texto y la IA son problemas equivalentes. Hutter demostró que el comportamiento óptimo de un agente que busca un objetivo en un entorno desconocido pero computable es adivinar en cada paso que el entorno probablemente esté controlado por uno de los programas más cortos consistentes con toda la interacción hasta el momento. [5] Sin embargo, no hay una solución general porque la complejidad de Kolmogorov no es computable. Hutter demostró que en el caso restringido (llamado AIXI tl ) donde el entorno está restringido al tiempo t y al espacio l , se puede calcular una solución en el tiempo O (t2 l ), ​​que sigue siendo intratable.

Los organizadores creen además que comprimir texto en lenguaje natural es un problema de IA difícil , equivalente a pasar la prueba de Turing . Por lo tanto, el progreso hacia un objetivo representa el progreso hacia el otro. Argumentan que predecir qué caracteres tienen más probabilidades de aparecer a continuación en una secuencia de texto requiere un vasto conocimiento del mundo real. Un compresor de texto debe resolver el mismo problema para asignar los códigos más cortos a las secuencias de texto más probables. [6]

Modelos como ChatGPT no son ideales para el Premio Hutter por diversas razones: podrían requerir más recursos computacionales que los permitidos por la competencia (espacio computacional y de almacenamiento).

Normas

El concurso es abierto. Está abierto a todo el mundo. Para participar, un concursante debe presentar un programa de compresión y un descompresor que descomprima en el archivo enwik9 . [3] También es posible presentar un archivo comprimido en lugar del programa de compresión. El tamaño total del archivo comprimido y del descompresor (como un ejecutable Win32 o Linux) debe ser menor o igual al 99% del trabajo ganador del premio anterior. Por cada uno por ciento de mejora, el concursante gana 5.000 euros. El programa de descompresión también debe cumplir con las limitaciones de tiempo de ejecución y memoria.

Las propuestas deben publicarse para permitir una verificación independiente. Hay un período de espera de 30 días para recibir comentarios públicos antes de otorgar un premio. En 2017, se cambiaron las reglas para exigir la publicación del código fuente bajo una licencia de software libre , debido a la preocupación de que "las propuestas anteriores [que no revelaron su código fuente] habían sido inútiles para otros y las ideas que contenían podrían perderse para siempre". [4]

Ganadores

Véase también

Referencias

  1. ^ abc «Premio de 500.000 € para la compresión del conocimiento humano». Premio Hutter . Consultado el 8 de enero de 2023 .
  2. ^ Mahoney, Matt (2 de diciembre de 2022). "Punto de referencia de compresión de texto grande" . Consultado el 8 de enero de 2023 .
  3. ^ ab Mahoney, Matt (1 de septiembre de 2011). "Acerca de los datos de prueba" . Consultado el 16 de noviembre de 2022 .
  4. ^ ab "Preguntas y respuestas frecuentes del concurso de compresión del conocimiento humano". Premio Hutter . Consultado el 14 de octubre de 2022 .
  5. ^ Hutter, Marcus (2005). Inteligencia artificial universal: decisiones secuenciales basadas en probabilidad algorítmica. Textos de informática teórica, serie EATCS. ​​Springer . doi :10.1007/b138233. ISBN. 3-540-22139-5.
  6. ^ Mahoney, Matt (23 de julio de 2009). "Fundamento de un parámetro de referencia para la compresión de textos grandes" . Consultado el 16 de noviembre de 2022 .

Enlaces externos