Claude (modelo de lenguaje)

Claude es una familia de modelos de lenguaje de gran tamaño desarrollados por Anthropic . ^[1] El primer modelo se lanzó en marzo de 2023. Claude 3, lanzado en marzo de 2024, también puede analizar imágenes. ^[2]

Capacitación

Los modelos Claude son transformadores generativos preentrenados . Han sido preentrenados para predecir la siguiente palabra en grandes cantidades de texto. Luego, los modelos Claude se han perfeccionado con inteligencia artificial constitucional con el objetivo de hacerlos útiles, honestos e inofensivos. ^[3]^[4]

IA constitucional

La IA constitucional es un enfoque desarrollado por Anthropic para entrenar sistemas de IA, en particular modelos de lenguaje como Claude, para que sean inofensivos y útiles sin depender de una amplia retroalimentación humana. El método, detallado en el artículo "IA constitucional: inocuidad a partir de la retroalimentación de la IA", implica dos fases: aprendizaje supervisado y aprendizaje de refuerzo . ^[4]

En la fase de aprendizaje supervisado, el modelo genera respuestas a las indicaciones, las autocritica basándose en un conjunto de principios rectores (una "constitución") y las revisa. Luego, el modelo se perfecciona en función de estas respuestas revisadas. ^[4]

En la fase de aprendizaje por refuerzo a partir de la retroalimentación de la IA (RLAIF), se generan respuestas y una IA compara su cumplimiento con la constitución. Este conjunto de datos de retroalimentación de la IA se utiliza para entrenar un modelo de preferencias que evalúa las respuestas en función de cuánto satisfacen la constitución. Luego, se ajusta a Claude para que se alinee con este modelo de preferencias. Esta técnica es similar al aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF), excepto que las comparaciones utilizadas para entrenar el modelo de preferencias son generadas por la IA y se basan en la constitución. ^[5]^[4]

Este enfoque permite entrenar asistentes de IA que sean útiles e inofensivos y que puedan explicar sus objeciones a solicitudes dañinas, mejorando la transparencia y reduciendo la dependencia de la supervisión humana. ^[6]^[7]

La "constitución" de Claude incluía 75 puntos, entre ellos secciones de la Declaración Universal de Derechos Humanos de la ONU . ^[6]^[3]

Modelos

Claudio

Claude fue la versión inicial del modelo de lenguaje de Anthropic publicada en marzo de 2023. ^[8] Claude demostró competencia en varias tareas, pero tenía ciertas limitaciones en las capacidades de codificación, matemáticas y razonamiento. ^[9] Anthropic se asoció con empresas como Notion (software de productividad) y Quora (para ayudar a desarrollar el chatbot Poe ). ^[9]

Claude Instant

Claude se lanzó en dos versiones, Claude y Claude Instant, siendo Claude Instant la versión más rápida, menos costosa y más liviana. Claude Instant tiene una longitud de contexto de entrada de 100 000 tokens (lo que corresponde a alrededor de 75 000 palabras). ^[10]

Claude 2

Claude 2 fue la siguiente iteración importante de Claude, que se lanzó en julio de 2023 y estuvo disponible para el público en general, mientras que Claude 1 solo estaba disponible para usuarios seleccionados aprobados por Anthropic. ^[11]

Claude 2 amplió su ventana de contexto de 9.000 tokens a 100.000 tokens. ^[8] Las características incluyeron la capacidad de cargar archivos PDF y otros documentos que le permiten a Claude leer, resumir y ayudar con las tareas.

Claude 2.1

Claude 2.1 duplicó la cantidad de tokens que el chatbot podía manejar, aumentándola a una ventana de 200.000 tokens, lo que equivale a alrededor de 500 páginas de material escrito. ^[1]

Anthropic afirma que es menos probable que el nuevo modelo produzca afirmaciones falsas en comparación con sus predecesores. ^[12]

Claude 3

Claude 3 se lanzó el 14 de marzo de 2024 y, según afirma el comunicado de prensa, estableció nuevos puntos de referencia en la industria en una amplia gama de tareas cognitivas. La familia Claude 3 incluye tres modelos de última generación en orden ascendente de capacidad: Haiku, Sonnet y Opus. La versión predeterminada de Claude 3, Opus, tiene una ventana de contexto de 200 000 tokens, pero se está ampliando a 1 millón para casos de uso específicos. ^[13]^[2]

Claude 3 llamó la atención por demostrar una aparente capacidad para darse cuenta de que está siendo probado artificialmente durante pruebas de "buscar una aguja en un pajar". ^[14]

Claudio 3.5

El 20 de junio de 2024, Anthropic lanzó Claude 3.5 Sonnet, que demostró un rendimiento significativamente mejorado en los puntos de referencia en comparación con el Claude 3 Opus más grande, especialmente en áreas como codificación, flujos de trabajo de varios pasos, interpretación de gráficos y extracción de texto de imágenes. Junto con 3.5 Sonnet se lanzó la nueva capacidad Artifacts en la que Claude podía crear código en una ventana dedicada en la interfaz y obtener una vista previa del código seleccionado en tiempo real, como sitios web o SVG. ^[15]

Acceso

El acceso limitado a Claude 3.5 Sonnet es gratuito, pero requiere una dirección de correo electrónico y un número de teléfono móvil. También se ofrece un plan pago para un mayor uso y acceso a todos los modelos de Claude 3. ^[16]

El 1 de mayo de 2024, Anthropic anunció el plan Claude Team, su primera oferta empresarial para Claude, y una aplicación iOS de Claude . ^[17]

Crítica

Claude 2 recibió críticas por su estricta alineación ética que puede reducir la usabilidad y el rendimiento. A los usuarios se les ha negado asistencia con solicitudes benignas, por ejemplo con la pregunta de programación "¿Cómo puedo eliminar todos los procesos de Python en mi servidor Ubuntu ?" Esto ha llevado a un debate sobre el "impuesto de alineación" (el costo de garantizar que un sistema de IA esté alineado ) en el desarrollo de IA, con discusiones centradas en equilibrar las consideraciones éticas y la funcionalidad práctica. Los críticos argumentaron a favor de la autonomía y la eficacia del usuario, mientras que los defensores destacaron la importancia de la IA ética. ^[18]^[12]

Referencias

^ ab Davis, Wes (21 de noviembre de 2023). «Anthropic, rival de OpenAI, hace que su chatbot Claude sea aún más útil». The Verge . Consultado el 23 de enero de 2024 .
^ ab Whitney, Lance (4 de marzo de 2024). "El chatbot Claude 3 de Anthropic afirma superar a ChatGPT y Gemini". ZDNET . Consultado el 5 de marzo de 2024 .
^ ab "Lo que hay que saber sobre Claude 2, el rival de Anthropic para ChatGPT". TIME . 18 de julio de 2023 . Consultado el 23 de enero de 2024 .
^ abcd «La Constitución de Claude». Anthropic . 9 de mayo de 2023 . Consultado el 26 de marzo de 2024 .
^ Eliot, Lance (25 de mayo de 2023). "La última IA generativa etiquetada audazmente como IA constitucional como Claude por Anthropic tiene el corazón en el lugar correcto, dice AI Ethics y AI Law". Forbes . Consultado el 27 de marzo de 2024 .
^ ab Bai, Yuntao; Kadavath, Saurav; Kundu, Sandipan; Askell, Amanda; Kernion, Jackson; Jones, Andy; Chen, Anna; Goldie, Anna; Mirhoseini, Azalia (15 de diciembre de 2022), IA constitucional: inofensividad de los comentarios de la IA , arXiv : 2212.08073
^ Mok, Aaron. "Un rival de ChatGPT acaba de publicar una nueva constitución para mejorar sus barreras de seguridad de IA y evitar respuestas tóxicas y racistas". Business Insider . Consultado el 23 de enero de 2024 .
^ ab Drapkin, Aaron (27 de octubre de 2023). "¿Qué es Claude AI y Anthropic? Se explica el rival de ChatGPT". Tech.co. Consultado el 23 de enero de 2024 .
^ ab "Presentando a Claude". Anthropic . 14 de marzo de 2023.
^ Yao, Deborah (11 de agosto de 2023). "Claude Instant de Anthropic: un modelo de lenguaje más pequeño, más rápido y más barato". AI Business .
^ Matthews, Dylan (17 de julio de 2023). "La apuesta de mil millones de dólares para garantizar que la IA no destruya a la humanidad". Vox . Consultado el 23 de enero de 2024 .
^ ab "Anthropic anuncia Claude 2.1 LLM con una ventana de contexto más amplia y compatibilidad con herramientas de inteligencia artificial". InfoQ . Consultado el 23 de enero de 2024 .
^ "Presentamos la próxima generación de Claude". Anthropic . Consultado el 4 de marzo de 2024 .
^ Edwards, Benj (5 de marzo de 2024). «Claude 3 de Anthropic causa revuelo al parecer darse cuenta de cuándo estaba siendo probado». Ars Technica . Consultado el 9 de marzo de 2024 .
^ Pierce, David (20 de junio de 2024). «Anthropic tiene un nuevo modelo de IA rápido y una nueva forma inteligente de interactuar con los chatbots». The Verge . Consultado el 20 de junio de 2024 .
^ "Presentamos el plan y la aplicación iOS del equipo Claude". Anthropic . 1 de mayo de 2024 . Consultado el 22 de junio de 2024 .
^ Field, Hayden (1 de mayo de 2024). "Anthropic, respaldada por Amazon, lanza una aplicación para iPhone y un nivel empresarial para competir con ChatGPT de OpenAI". CNBC . Consultado el 3 de mayo de 2024 .{{cite news}}: CS1 maint: estado de la URL ( enlace )
^ Glifton, Gerald (3 de enero de 2024). "Surgen críticas sobre los estrictos protocolos éticos de Claude AI que limitan la asistencia al usuario". Light Square . Consultado el 23 de enero de 2024 .

Enlaces externos

Sitio web oficial