Concepto de apertura aplicado a la IA
La inteligencia artificial de código abierto es la aplicación de prácticas de código abierto al desarrollo de recursos de inteligencia artificial .
Muchos productos de inteligencia artificial de código abierto son variaciones de otras herramientas y tecnologías existentes que han sido compartidas como software de código abierto por grandes empresas. [1]
Las empresas suelen desarrollar productos cerrados en un intento de mantener una ventaja competitiva en el mercado. [2] Un periodista de Wired exploró la idea de que las herramientas de inteligencia artificial de código abierto tienen una ventaja de desarrollo sobre los productos cerrados y podrían superarlos en el mercado. [2]
Las categorías populares de proyectos de inteligencia artificial de código abierto incluyen modelos de lenguaje de gran tamaño , herramientas de traducción automática y chatbots . [3]
Para que los desarrolladores de software produzcan recursos de inteligencia artificial de código abierto, deben confiar en los demás componentes de software de código abierto que utilizan en su desarrollo. [4] [5]
Modelos de lenguaje de gran tamaño
Llama
LLaMA es una familia de grandes modelos de lenguaje que Meta AI lanzará a partir de febrero de 2023. [6] Meta afirma que estos modelos son software de código abierto, pero la Open Source Initiative cuestiona esta afirmación, argumentando que "la licencia de Meta para los modelos y el código de LLaMa no cumple con este estándar; específicamente, impone restricciones al uso comercial para algunos usuarios (párrafo 2) y también restringe el uso del modelo y el software para ciertos fines (la Política de uso aceptable)". [7]
Referencias
- ^ Heaven, Will Douglas (12 de mayo de 2023). "El auge de la inteligencia artificial de código abierto se basa en las dádivas de las grandes empresas tecnológicas. ¿Cuánto durará?". MIT Technology Review .
- ^ ab Solaiman, Irene (24 de mayo de 2023). "Los sistemas de IA generativa no son solo de código abierto o cerrado". Wired .
- ^ Castelvecchi, Davide (29 de junio de 2023). «Los chatbots de inteligencia artificial de código abierto están en auge: ¿qué significa esto para los investigadores?». Nature . 618 (7967): 891–892. doi :10.1038/d41586-023-01970-6.
- ^ Thummadi, Babu Veeresh (2021). "Capacidades de inteligencia artificial (IA), confianza y rendimiento del equipo de software de código abierto". En Denis Dennehy; Anastasia Griva; Nancy Pouloudi; Yogesh K. Dwivedi; Ilias Pappas; Matti Mäntymäki (eds.). Inteligencia artificial y analítica responsables para una sociedad digitalizada ética e inclusiva . 20.ª Conferencia del Grupo de Trabajo 6.11 de la Federación Internacional de Procesamiento de la Información sobre comercio electrónico, servicios electrónicos y sociedad electrónica, Galway, Irlanda, del 1 al 3 de septiembre de 2021. Lecture Notes in Computer Science. Vol. 12896. Springer. págs. 629–640. doi :10.1007/978-3-030-85447-8_52. ISBN 978-3-030-85446-1.
- ^ Mitchell, James (22 de octubre de 2023). "Cómo crear software de inteligencia artificial". Desarrolladores de software de inteligencia artificial . Consultado el 31 de marzo de 2024 .
- ^ ab "Presentación de LLaMA: un modelo de lenguaje fundacional de 65 mil millones de parámetros". 2023-09-11. Archivado desde el original el 2023-09-11 . Consultado el 2023-10-03 .
- ^ "La licencia LLaMa 2 de Meta no es de código abierto".
- ^ "meta-llama/Llama-2-70b-chat-hf · Hugging Face". huggingface.co . Consultado el 3 de octubre de 2023 .
- ^ "Llama 2 - Meta AI". ai.meta.com . Consultado el 3 de octubre de 2023 .
- ^ "Conoce a Llama 3.1". Llama Meta . 2024-09-09 . Consultado el 2024-09-09 .
{{cite web}}
: CS1 maint: url-status (link) - ^ "Ventana de contexto de Llama 3.1 - Búsqueda de Google". www.google.com . Consultado el 9 de septiembre de 2024 .
- ^ "llama3/LICENSE en main · meta-llama/llama3". GitHub . Consultado el 9 de septiembre de 2024 .
- ^ "mistralai/Mistral-7B-v0.1 · Hugging Face". huggingface.co . Consultado el 3 de octubre de 2023 .
- ^ AI, Mistral (27 de septiembre de 2023). «Mistral 7B». mistral.ai . Consultado el 3 de octubre de 2023 .
- ^ "EleutherAI/gpt-j-6b · Hugging Face". huggingface.co . 2023-05-03 . Consultado el 2023-10-03 .
- ^ Biderman, Stella; Schoelkopf, Hailey; Antonio, Quintín; Bradley, Herbie; O'Brien, Kyle; Hallahan, Eric; Mohammad Aflah Khan; Purohit, Shivanshu; USVSN Sai Prashanth; Raff, Eduardo; Skowron, Aviya; Sutawika, Lintang; Oskar van der Wal (3 de octubre de 2023). "[2304.01373] Pythia: una suite para analizar modelos de lenguaje grandes a través de entrenamiento y escalamiento". arXiv : 2304.01373 [cs.CL].
- ^ "EleutherAI/pythia-6.9b · Hugging Face". huggingface.co . 2023-05-03 . Consultado el 2023-10-03 .