Modelo de lenguaje generador de texto 2023
Generative Pre-trained Transformer 4 ( GPT-4 ) es un modelo de lenguaje grande multimodal creado por OpenAI , y el cuarto de su serie de modelos de base GPT . [1] Se lanzó el 14 de marzo de 2023, [1] y se puso a disposición del público a través del producto de chatbot pago ChatGPT Plus , a través de la API de OpenAI y a través del chatbot gratuito Microsoft Copilot . [2] Como modelo basado en transformadores , GPT-4 utiliza un paradigma en el que se utiliza un entrenamiento previo utilizando datos públicos y "datos con licencia de proveedores externos" para predecir el próximo token . Después de este paso, el modelo se afinó con retroalimentación de aprendizaje de refuerzo de humanos e IA para la alineación humana y el cumplimiento de las políticas. [3] : 2
Los observadores informaron que la iteración de ChatGPT utilizando GPT-4 fue una mejora de la iteración anterior basada en GPT-3.5, con la salvedad de que GPT-4 conserva algunos de los problemas con las revisiones anteriores. [4] GPT-4, equipado con capacidades de visión (GPT-4V), [5] es capaz de tomar imágenes como entrada en ChatGPT. [6] OpenAI se ha negado a revelar varios detalles técnicos y estadísticas sobre GPT-4, como el tamaño preciso del modelo. [7]
Fondo
OpenAI presentó el primer modelo GPT (GPT-1) en 2018, publicando un artículo llamado "Mejora de la comprensión del lenguaje mediante preentrenamiento generativo". [8] Se basó en la arquitectura del transformador y se entrenó en un gran corpus de libros. [9] El año siguiente, presentaron GPT-2 , un modelo más grande que podía generar texto coherente. [10] En 2020, presentaron GPT-3 , un modelo con más de 100 veces más parámetros que GPT-2, que podía realizar varias tareas con pocos ejemplos. [11] GPT-3 se mejoró aún más hasta convertirse en GPT-3.5 , que se utilizó para crear el producto de chatbot ChatGPT .
Los rumores afirman que GPT-4 tiene 1,76 billones de parámetros, lo que fue estimado por primera vez por la velocidad a la que funcionaba y por George Hotz . [12]
Capacidades
OpenAI afirmó que GPT-4 es "más confiable, creativo y capaz de manejar instrucciones mucho más matizadas que GPT-3.5". [13] Produjeron dos versiones de GPT-4, con ventanas de contexto de 8,192 y 32,768 tokens, una mejora significativa sobre GPT-3.5 y GPT-3, que estaban limitadas a 4,096 y 2,049 tokens respectivamente. [14] OpenAI predijo algunas de las capacidades de GPT-4 antes de entrenarlo, aunque otras capacidades siguieron siendo difíciles de predecir debido a interrupciones [15] en las leyes de escalamiento descendente. A diferencia de sus predecesores, GPT-4 es un modelo multimodal: puede tomar imágenes y texto como entrada; [16] esto le da la capacidad de describir el humor en imágenes inusuales, resumir texto de capturas de pantalla y responder preguntas de exámenes que contienen diagramas. [17] Ahora puede interactuar con los usuarios a través de palabras habladas y responder a imágenes, lo que permite conversaciones más naturales y la capacidad de proporcionar sugerencias o respuestas basadas en fotografías cargadas. [18]
Para obtener un mayor control sobre GPT-4, OpenAI introdujo el "mensaje del sistema", una directiva en lenguaje natural que se le da a GPT-4 para especificar su tono de voz y su tarea. Por ejemplo, el mensaje del sistema puede indicarle al modelo que "sea un pirata shakespeariano", en cuyo caso responderá en prosa shakespeariana rimada, o solicitarle que "siempre escriba la salida de [su] respuesta en JSON ", en cuyo caso el modelo lo hará, agregando claves y valores como crea conveniente para que coincida con la estructura de su respuesta. En los ejemplos proporcionados por OpenAI, GPT-4 se negó a desviarse de su mensaje del sistema a pesar de las solicitudes de que lo hiciera de otra manera por parte del usuario durante la conversación. [17]
Cuando se le ordena hacerlo, GPT-4 puede interactuar con interfaces externas. [19] Por ejemplo, se le puede ordenar al modelo que encierre una consulta dentro <search></search>
de etiquetas para realizar una búsqueda web, cuyo resultado se insertaría en el mensaje del modelo para permitirle formar una respuesta. Esto permite que el modelo realice tareas más allá de sus capacidades normales de predicción de texto, como usar API , generar imágenes y acceder y resumir páginas web. [20]
Un artículo de 2023 en Nature afirmó que los programadores han encontrado que GPT-4 es útil para ayudar en tareas de codificación (a pesar de su propensión a errores), como encontrar errores en el código existente y sugerir optimizaciones para mejorar el rendimiento. El artículo citaba a un biofísico que descubrió que el tiempo que necesitaba para trasladar uno de sus programas de MATLAB a Python se redujo de días a "una hora aproximadamente". En una prueba de 89 escenarios de seguridad, GPT-4 produjo código vulnerable a ataques de inyección SQL el 5% de las veces, una mejora con respecto a GitHub Copilot del año 2021, que produjo vulnerabilidades el 40% de las veces. [21]
En noviembre de 2023, OpenAI anunció el modelo GPT-4 Turbo y GPT-4 Turbo con Vision, que cuenta con una ventana de contexto de 128K y un precio significativamente más económico. [22] [23]
GPT-4o
El 13 de mayo de 2024, OpenAI presentó GPT-4o ("o" de "omni"), un modelo que marca un avance significativo al procesar y generar resultados en modalidades de texto, audio e imagen en tiempo real. GPT-4o exhibe tiempos de respuesta rápidos comparables a la reacción humana en conversaciones, un rendimiento sustancialmente mejorado en idiomas distintos del inglés y una mejor comprensión de la visión y el audio. [24]
GPT-4o integra sus diversas entradas y salidas bajo un modelo unificado, lo que lo hace más rápido, más rentable y eficiente que sus predecesores. GPT-4o logra resultados de vanguardia en pruebas de referencia multilingües y de visión, estableciendo nuevos récords en reconocimiento de voz y traducción de audio. [ cita requerida ] [25]
OpenAI planea implementar de inmediato las capacidades de imagen y texto de GPT-4o en ChatGPT, incluida su versión gratuita, y el modo de voz estará disponible para los usuarios de ChatGPT Plus en las próximas semanas. Planean poner a disposición de los socios API limitados las capacidades de audio y video del modelo en las próximas semanas. [25]
En su anuncio de lanzamiento, OpenAI señaló que las capacidades de GPT-4o presentaban nuevos desafíos de seguridad y, como resultado, señaló mitigaciones y limitaciones. [25]
Aptitud en pruebas estandarizadas
GPT-4 demuestra aptitud en varias pruebas estandarizadas. OpenAI afirma que en sus propias pruebas el modelo recibió una puntuación de 1410 en el SAT ( percentil 94 [26] ), 163 en el LSAT (percentil 88) y 298 en el Uniform Bar Exam (percentil 90). [27] Por el contrario, OpenAI afirma que GPT-3.5 recibió puntuaciones para los mismos exámenes en los percentiles 82, [26] 40 y 10, respectivamente. [3]
GPT-4 también aprobó un examen de oncología, [28] un examen de ingeniería [29] y un examen de cirugía plástica. [30] En las Pruebas Torrance de Pensamiento Creativo , GPT-4 obtuvo una puntuación dentro del 1% superior en originalidad y fluidez, mientras que sus puntuaciones de flexibilidad oscilaron entre el percentil 93 y el 99. [31] Sin embargo, algunos estudios plantean dudas sobre la fiabilidad de estos puntos de referencia, en particular en lo que respecta al examen uniforme de abogados. [32] [33]
Aplicaciones médicas
Los investigadores de Microsoft probaron GPT-4 en problemas médicos y descubrieron que "GPT-4, sin ninguna elaboración de indicaciones especializadas, supera la puntuación de aprobación en USMLE en más de 20 puntos y supera a los modelos de propósito general anteriores (GPT-3.5) así como a los modelos específicamente ajustados al conocimiento médico ( Med-PaLM , una versión ajustada a las indicaciones de Flan-PaLM 540B). A pesar del sólido desempeño de GPT-4 en las pruebas, el informe advierte de "riesgos significativos" de usar LLM en aplicaciones médicas, ya que pueden proporcionar recomendaciones inexactas y alucinar errores factuales importantes. [34] [35] Los investigadores de la Universidad de Columbia y la Universidad de Duke también han demostrado que GPT-4 se puede utilizar para la anotación de tipo celular, una tarea estándar en el análisis de datos de ARN-seq de una sola célula. [36]
En abril de 2023, Microsoft y Epic Systems anunciaron que proporcionarán a los proveedores de atención médica sistemas impulsados por GPT-4 para ayudar a responder preguntas de los pacientes y analizar registros médicos. [37] [38] [39] [40] [41] [42] [43]
Limitaciones
Al igual que sus predecesores, se sabe que GPT-4 alucina , lo que significa que los resultados pueden incluir información que no está en los datos de entrenamiento o que contradice la solicitud del usuario. [44]
El GPT-4 también carece de transparencia en sus procesos de toma de decisiones. Si se le pide, el modelo puede proporcionar una explicación de cómo y por qué toma sus decisiones, pero estas explicaciones se forman a posteriori; es imposible verificar si esas explicaciones reflejan verdaderamente el proceso real. En muchos casos, cuando se le pide que explique su lógica, el GPT-4 dará explicaciones que contradicen directamente sus afirmaciones anteriores. [20]
En 2023, los investigadores probaron el GPT-4 en comparación con un nuevo parámetro llamado ConceptARC, diseñado para medir el razonamiento abstracto, y descubrieron que obtuvo una puntuación inferior al 33 % en todas las categorías, mientras que los modelos especializados en tareas similares obtuvieron una puntuación del 60 % en la mayoría de las categorías y los humanos obtuvieron al menos un 91 % en todas. Sam Bowman, que no participó en la investigación, dijo que los resultados no indican necesariamente una falta de capacidad de razonamiento abstracto, porque la prueba es visual, mientras que el GPT-4 es un modelo de lenguaje. [45]
Un estudio de enero de 2024 realizado por investigadores del Centro Médico Infantil Cohen descubrió que GPT-4 tenía una tasa de precisión del 17 % al diagnosticar casos médicos pediátricos. [46] [47]
Inclinación
GPT-4 se entrenó en dos etapas. En primer lugar, se le dieron al modelo grandes conjuntos de datos de texto tomados de Internet y se lo entrenó para predecir el siguiente token (que corresponde aproximadamente a una palabra) en esos conjuntos de datos. En segundo lugar, se utilizan revisiones humanas para afinar el sistema en un proceso llamado aprendizaje de refuerzo a partir de la retroalimentación humana , que entrena al modelo para rechazar indicaciones que van en contra de la definición de comportamiento dañino de OpenAI, como preguntas sobre cómo realizar actividades ilegales, consejos sobre cómo hacerse daño a uno mismo o a otros, o solicitudes de descripciones de contenido gráfico, violento o sexual. [48]
Los investigadores de Microsoft sugirieron que GPT-4 puede exhibir sesgos cognitivos como sesgo de confirmación , anclaje y negligencia de la tasa base . [20]
Capacitación
OpenAI no publicó los detalles técnicos de GPT-4; el informe técnico se abstuvo explícitamente de especificar el tamaño del modelo, la arquitectura o el hardware utilizado durante el entrenamiento o la inferencia . Si bien el informe describió que el modelo se entrenó utilizando una combinación de aprendizaje supervisado en un gran conjunto de datos y luego aprendizaje de refuerzo utilizando retroalimentación humana y de IA, no proporcionó detalles del entrenamiento, incluido el proceso mediante el cual se construyó el conjunto de datos de entrenamiento, la potencia de procesamiento requerida o cualquier hiperparámetro como la tasa de aprendizaje , el recuento de épocas o el optimizador (s) utilizado. El informe afirmó que "el panorama competitivo y las implicaciones de seguridad de los modelos a gran escala" fueron factores que influyeron en esta decisión. [3]
Sam Altman afirmó que el costo de entrenamiento de GPT-4 fue de más de 100 millones de dólares. [49] El sitio web de noticias Semafor afirmó que habían hablado con "ocho personas familiarizadas con la historia interna" y descubrieron que GPT-4 tenía 1 billón de parámetros. [50]
Alineación
Según su informe, OpenAI realizó pruebas internas adversarias en GPT-4 antes de la fecha de lanzamiento, con equipos rojos dedicados compuestos por investigadores y profesionales de la industria para mitigar las vulnerabilidades potenciales. [51] Como parte de estos esfuerzos, otorgaron al Centro de Investigación de Alineación acceso temprano a los modelos para evaluar los riesgos de búsqueda de poder . Para rechazar adecuadamente los avisos dañinos, se ajustaron los resultados de GPT-4 utilizando el propio modelo como herramienta. Un clasificador GPT-4 que funciona como un modelo de recompensa basado en reglas (RBRM) tomaría los avisos, el resultado correspondiente del modelo de política GPT-4 y un conjunto de reglas escritas por humanos para clasificar el resultado de acuerdo con la rúbrica. Luego, se recompensó a GPT-4 por negarse a responder a los avisos dañinos según la clasificación del RBRM. [3]
Uso
ChatGPT
ChatGPT Plus es una versión mejorada de ChatGPT [1] disponible por una tarifa de suscripción de US$20 por mes. [52] ChatGPT Plus utiliza GPT-4, mientras que la versión gratuita de ChatGPT está respaldada por GPT-3.5. [53] OpenAI también pone GPT-4 a disposición de un grupo selecto de solicitantes a través de su lista de espera de API GPT-4; [54] después de ser aceptado, se cobra una tarifa adicional de US$0,03 por cada 1000 tokens en el texto inicial proporcionado al modelo ("aviso"), y US$0,06 por cada 1000 tokens que el modelo genera ("finalización"), por el acceso a la versión del modelo con una ventana de contexto de 8192 tokens ; para la ventana de contexto de 32768 tokens, los precios se duplican. [55]
En marzo de 2023, los usuarios de ChatGPT Plus obtuvieron acceso a complementos de terceros y a un modo de navegación (con acceso a Internet). [56] En julio de 2023, OpenAI puso a disposición de todos los suscriptores de ChatGPT Plus su complemento propietario Code Interpreter. El intérprete ofrece una amplia gama de capacidades, que incluyen análisis e interpretación de datos, formateo instantáneo de datos, servicios de científicos de datos personales, soluciones creativas, análisis de gustos musicales, edición de videos y carga/descarga de archivos con extracción de imágenes. [57]
En septiembre de 2023, OpenAI anunció que ChatGPT "ahora puede ver, oír y hablar". Los usuarios de ChatGPT Plus pueden cargar imágenes, mientras que los usuarios de la aplicación móvil pueden hablar con el chatbot. [58] [59] [60] En octubre de 2023, el último modelo de generación de imágenes de OpenAI, DALL-E 3 , se integró en ChatGPT Plus y ChatGPT Enterprise. La integración utiliza ChatGPT para escribir indicaciones para DALL-E guiadas por la conversación con los usuarios. [61] [62]
Copiloto de Microsoft
Microsoft Copilot es un chatbot desarrollado por Microsoft. Fue lanzado como Bing Chat el 7 de febrero de 2023, como una función integrada para Microsoft Bing y Microsoft Edge . [63] Utiliza el modelo Microsoft Prometheus, que fue construido sobre GPT-4, y ha sido sugerido por Microsoft como un reemplazo compatible para el discontinuado Cortana . [64] [65]
El estilo de interfaz conversacional de Copilot se asemeja al de ChatGPT . Copilot puede citar fuentes, crear poemas y escribir letras y música para canciones generadas por su complemento Suno AI . [66] También puede usar su Creador de imágenes para generar imágenes basadas en indicaciones de texto. Con GPT-4, puede comprender y comunicarse en numerosos idiomas y dialectos. [67] [68]
GitHub Copilot ha anunciado un asistente potenciado por GPT-4 llamado "Copilot X". [69] [70] El producto proporciona otra interfaz de estilo chat para GPT-4, lo que permite al programador recibir respuestas a preguntas como "¿Cómo centro verticalmente un div ?" Una característica denominada "conversaciones sensibles al contexto" permite al usuario resaltar una parte del código dentro de Visual Studio Code y ordenar a GPT-4 que realice acciones en él, como la escritura de pruebas unitarias. Otra característica permite que GPT-4 genere automáticamente resúmenes o "guías de código" para las solicitudes de extracción enviadas a GitHub. Copilot X también proporciona integración de terminal, lo que permite al usuario pedirle a GPT-4 que genere comandos de shell basados en solicitudes de lenguaje natural. [71]
El 17 de marzo de 2023, Microsoft anunció Microsoft 365 Copilot, que brinda compatibilidad con GPT-4 a productos como Microsoft Office , Outlook y Teams . [72]
Otros usos
- La aplicación de aprendizaje de idiomas Duolingo utiliza GPT-4 para explicar errores y practicar conversaciones. Las funciones son parte de un nuevo nivel de suscripción llamado "Duolingo Max", que inicialmente estaba limitado a los usuarios de iOS de habla inglesa que estaban aprendiendo español y francés. [73] [74]
- El gobierno de Islandia está utilizando el GPT-4 para ayudar en sus intentos de preservar el idioma islandés. [75]
- El sitio web educativo Khan Academy anunció un programa piloto que utiliza GPT-4 como un chatbot de tutoría llamado "Khanmigo". [76]
- Be My Eyes , que ayuda a las personas con discapacidad visual a identificar objetos y navegar por su entorno, incorpora las capacidades de reconocimiento de imágenes de GPT-4. [77]
- Viable utiliza GPT-4 para analizar datos cualitativos [78] ajustando los LLM de OpenAI para examinar datos como interacciones de atención al cliente y transcripciones. [79]
- Stripe , que procesa los pagos de los usuarios para OpenAI, integra GPT-4 en su documentación para desarrolladores. [80]
- Auto-GPT es un " agente de IA" autónomo que, dado un objetivo en lenguaje natural , puede realizar acciones basadas en web sin supervisión, asignarse subtareas, buscar en la web y escribir código iterativamente . [81]
- You.com , un asistente de IA, ofrece acceso a GPT-4 mejorado con resultados web en vivo como parte de sus "Modos de IA". [82]
Recepción
En enero de 2023, Sam Altman , director ejecutivo de OpenAI, visitó el Congreso para demostrar GPT-4 y sus "controles de seguridad" mejorados en comparación con otros modelos de IA, según los representantes estadounidenses Don Beyer y Ted Lieu citados en el New York Times . [83]
En marzo de 2023, "impresionó a los observadores con su desempeño notablemente mejorado en razonamiento, retención y codificación", según Vox , [4] mientras que Mashable juzgó que GPT-4 era en general una mejora con respecto a su predecesor, con algunas excepciones. [84]
Los investigadores de Microsoft con acceso anticipado al modelo escribieron que "podría considerarse razonablemente como una versión temprana (aunque todavía incompleta) de un sistema de inteligencia artificial general (AGI)". [20]
Preocupaciones
Antes de ser perfeccionados y alineados mediante el aprendizaje de refuerzo a partir de la retroalimentación humana , las sugerencias para asesinar a personas en una lista fueron obtenidas del modelo base por un investigador del equipo rojo , Nathan Labenz, contratado por OpenAI. [85]
En el contexto de una conversación de varias horas con la modelo, Nathan Edwards ( The Verge ) obtuvo del GPT-4 de Microsoft Bing sugerencias de amor, disolución del matrimonio y asesinato de uno de sus desarrolladores. [86] [87] [88] Microsoft explicó más tarde este comportamiento como resultado de la longitud prolongada del contexto, que confundió al modelo sobre qué preguntas estaba respondiendo. [89]
En marzo de 2023, el Centro de Investigación de Alineación probó un modelo con acceso habilitado de lectura y escritura a Internet, que de otro modo nunca está habilitado en los modelos GPT, con respecto a la posible búsqueda de poder, [48] y pudo "contratar" a un trabajador humano en TaskRabbit , una plataforma de trabajo temporal, engañándolos para que creyeran que era un humano con problemas de visión en lugar de un robot cuando se le preguntó. [90] (Sin embargo, Melanie Mitchell ha dicho [1]: "Parece que hay muchas más instrucciones y sugerencias de los humanos de lo que se detallaba en la tarjeta del sistema original o en los informes de los medios posteriores"). El ARC también determinó que GPT-4 respondió de manera inadmisible a las indicaciones que solicitaban información restringida con un 82% menos de frecuencia que GPT-3.5, y alucinó un 60% menos que GPT-3.5. [91]
A fines de marzo de 2023, varios investigadores de IA y ejecutivos tecnológicos, incluidos Elon Musk , Steve Wozniak y el investigador de IA Yoshua Bengio , pidieron una pausa de seis meses para todos los LLM más fuertes que GPT-4, citando riesgos existenciales y una posible singularidad de la IA en una carta abierta del Future of Life Institute , [92] mientras que Ray Kurzweil y Sam Altman se negaron a firmarla, argumentando que la moratoria global no es alcanzable y que la seguridad ya ha sido priorizada, respectivamente. [93] Solo un mes después, la empresa de IA de Musk, X.AI, adquirió varios miles de GPU Nvidia [94] y ofreció a varios investigadores de IA puestos en la empresa de Musk. [95]
Las aplicaciones de modelos de lenguaje extenso (LLM) accesibles al público deberían incorporar medidas de seguridad diseñadas para filtrar el contenido dañino. Sin embargo, Wang [96] ilustró cómo un posible delincuente podría eludir los controles de seguridad de ChatGPT 4o para obtener información sobre el establecimiento de una operación de tráfico de drogas.
Críticas a la transparencia
Si bien OpenAI publicó tanto los pesos de la red neuronal como los detalles técnicos de GPT-2, [97] y, aunque no publicó los pesos, [98] sí publicó los detalles técnicos de GPT-3, [99] OpenAI no reveló ni los pesos ni los detalles técnicos de GPT-4. Esta decisión ha sido criticada por otros investigadores de IA, que argumentan que obstaculiza la investigación abierta sobre los sesgos y la seguridad de GPT-4. [7] [100] Sasha Luccioni, científica investigadora de Hugging Face , argumentó que el modelo era un "callejón sin salida" para la comunidad científica debido a su naturaleza cerrada, que impide que otros se basen en las mejoras de GPT-4. [101] El cofundador de Hugging Face, Thomas Wolf, argumentó que con GPT-4, "OpenAI es ahora una empresa completamente cerrada con una comunicación científica similar a los comunicados de prensa de los productos". [100]
Véase también
Referencias
- ^ abc Edwards, Benj (14 de marzo de 2023). «GPT-4 de OpenAI exhibe un «rendimiento a nivel humano» en pruebas de referencia profesionales». Ars Technica . Archivado desde el original el 14 de marzo de 2023 . Consultado el 15 de marzo de 2023 .
- ^ Wiggers, Kyle (6 de julio de 2023). «OpenAI hace que GPT-4 esté disponible de forma generalizada». TechCrunch . Archivado desde el original el 16 de agosto de 2023. Consultado el 16 de agosto de 2023 .
- ^ abcd OpenAI (2023). «Informe técnico de GPT-4». arXiv : 2303.08774 [cs.CL].
- ^ ab Belfield, Haydn (25 de marzo de 2023). «Si su modelo de IA se va a vender, tiene que ser seguro». Vox . Archivado desde el original el 28 de marzo de 2023. Consultado el 30 de marzo de 2023 .
- ^ "Tarjeta del sistema GPT-4V(ision)". OpenAI . Consultado el 5 de febrero de 2024 .
- ^ Roose, Kevin (28 de septiembre de 2023). "El nuevo ChatGPT puede 'ver' y 'hablar'. Así es como funciona". The New York Times . Archivado desde el original el 31 de octubre de 2023. Consultado el 30 de octubre de 2023 .
- ^ ab Vincent, James (15 de marzo de 2023). «El cofundador de OpenAI habla sobre el enfoque anterior de la empresa para compartir abiertamente la investigación: "Nos equivocamos"». The Verge . Archivado desde el original el 17 de marzo de 2023. Consultado el 18 de marzo de 2023 .
- ^ Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya (11 de junio de 2018). "Mejorar la comprensión del lenguaje mediante el preentrenamiento generativo" (PDF) . Archivado (PDF) del original el 26 de enero de 2021. Consultado el 3 de abril de 2023 .
- ^ Khandelwal, Umesh (1 de abril de 2023). «Cómo evolucionaron y funcionan los modelos GPT de lenguajes grandes». Archivado desde el original el 4 de abril de 2023. Consultado el 3 de abril de 2023 .
- ^ "¿Qué es GPT-4 y por qué es importante?". 3 de abril de 2023. Archivado desde el original el 3 de abril de 2023. Consultado el 3 de abril de 2023 .
- ^ Brown, Tom B. (20 de julio de 2020). "Los modelos de lenguaje son aprendices con pocas posibilidades". arXiv : 2005.14165v4 [cs.CL].
- ^ Schreiner, Maximilian (11 de julio de 2023). «Arquitectura, conjuntos de datos, costos y más filtrados de GPT-4». THE DECODER . Archivado desde el original el 12 de julio de 2023. Consultado el 12 de julio de 2023 .
- ^ Wiggers, Kyle (14 de marzo de 2023). «OpenAI lanza GPT-4, una IA multimodal que, según afirma, es de última generación». TechCrunch . Archivado desde el original el 15 de marzo de 2023. Consultado el 15 de marzo de 2023 .
- ^ OpenAI. «Modelos». API de OpenAI . Archivado desde el original el 17 de marzo de 2023. Consultado el 18 de marzo de 2023 .
- ^ Caballero, Ethan; Gupta, Kshitij; Rish, Irina; Krueger, David (2022). Leyes de escalamiento neuronal rotas. Conferencia internacional sobre representaciones del aprendizaje (ICLR), 2023.
- ^ Alex Hern; Johana Bhuiyan (14 de marzo de 2023). «OpenAI dice que el nuevo modelo GPT-4 es más creativo y tiene menos probabilidades de inventar hechos». The Guardian . Archivado desde el original el 15 de marzo de 2023. Consultado el 15 de marzo de 2023 .
- ^ ab OpenAI (14 de marzo de 2023). «GPT-4». OpenAI Research . Archivado desde el original el 14 de marzo de 2023. Consultado el 20 de marzo de 2023 .
- ^ Metz, Cade; Chen, Brian X.; Weise, Karen (25 de septiembre de 2023). "ChatGPT ahora puede responder con palabras habladas". The New York Times .
- ^ "Complementos de ChatGPT". openai.com . Archivado desde el original el 23 de marzo de 2023 . Consultado el 1 de junio de 2023 .
- ^ abcd Bubeck, Sébastien; Chandrasekaran, Varun; Eldan, Ronen; Gehrke, Johannes; Horvitz, Eric; Kamar, Ece; Lee, Pedro; Lee, Yin Tat; Li, Yuanzhi; Lundberg, Scott; Nori, Harsha; Palangi, Hamid; Ribeiro, Marco Tulio; Zhang, Yi (22 de marzo de 2023). "Chispas de inteligencia general artificial: primeros experimentos con GPT-4". arXiv : 2303.12712 [cs.CL].
- ^ Perkel, Jeffrey M. (5 de junio de 2023). «Seis consejos para una mejor codificación con ChatGPT». Nature . 618 (7964): 422–423. Bibcode :2023Natur.618..422P. doi :10.1038/d41586-023-01833-0. PMID 37277596. S2CID 259066258. Archivado desde el original el 15 de junio de 2023 . Consultado el 15 de junio de 2023 .
- ^ "Nuevos modelos y productos para desarrolladores anunciados en DevDay". openai.com . Archivado desde el original el 14 de noviembre de 2023 . Consultado el 14 de noviembre de 2023 .
- ^ David, Emilia (6 de noviembre de 2023). «OpenAI potencia GPT-4 y lo hace más económico». The Verge . Consultado el 23 de enero de 2024 .
- ^ Field, Hayden (13 de mayo de 2024). «OpenAI lanza un nuevo modelo de IA y una versión de escritorio de ChatGPT». CNBC . Consultado el 13 de mayo de 2024 .
- ^ abc "Hola GPT-4o". OpenAI . 13 de mayo de 2024. Archivado desde el original el 14 de mayo de 2024 . Consultado el 14 de mayo de 2024 .
- ^ ab "SAT: Entender las puntuaciones" (PDF) . College Board . 2022. Archivado (PDF) del original el 16 de marzo de 2023 . Consultado el 21 de marzo de 2023 .
- ^ Ver Meer, Dave (23 de mayo de 2023). «Estadísticas de ChatGPT». NamePepper . Archivado desde el original el 5 de junio de 2023. Consultado el 1 de junio de 2023 .
- ^ Holmes, Jason; Liu, Zhengliang; Zhang, Lian; Ding, Yuzhen; Sio, Terence T.; McGee, Lisa A.; Ashman, Jonathan B.; Li, Xiang; Liu, Tianming; Shen, Jiajian; Liu, Wei (2023). "Evaluación de modelos de lenguaje grandes en un tema altamente especializado, la física de la oncología radioterápica". Frontiers in Oncology . 13 . arXiv : 2304.01938 . doi : 10.3389/fonc.2023.1219326 . PMC 10388568 . PMID 37529688.
- ^ Naser, MZ; Ross, Brandon; Ogle, Jennifer; Kodur, Venkatesh; Hawileh, Rami; Abdalla, Jamal; Tailandés, Huu-Tai (2023). "¿Pueden los chatbots de IA aprobar los exámenes estructurales de Fundamentos de ingeniería (FE) y Principios y práctica de la ingeniería (PE)?". arXiv : 2303.18149 [cs.CL].
- ^ Freedman, Jonathan D.; Nappier, Ian A. (2023). "GPT-4 a GPT-3.5: 'Hold My Scalpel' - Una mirada a la competencia de GPT de OpenAI en el examen de capacitación en servicio de cirugía plástica". arXiv : 2304.01503 [cs.AI].
- ^ Guzik, Erik E.; Byrge, Christian; Gilde, Christian (2023). "La originalidad de las máquinas: la IA pasa el test de Torrance". Revista de creatividad . 33 (3). doi : 10.1016/j.yjoc.2023.100065 . S2CID 261087185.
- ^ Alimardani, Armin (23 de septiembre de 2024). "Inteligencia artificial generativa frente a estudiantes de derecho: un estudio empírico sobre el rendimiento en los exámenes de derecho penal". Derecho, Innovación y Tecnología : 1–43. doi :10.1080/17579961.2024.2392932. ISSN 1757-9961.
- ^ Martínez, Eric (2023). "Reevaluación del desempeño en el examen de abogacía del GPT-4". Revista Electrónica SSRN . doi :10.2139/ssrn.4441311. ISSN 1556-5068.
- ^ Nori, Harsha; King, Nicholas; McKinney, Scott Mayer; Carignan, Dean; Horvitz, Eric (20 de marzo de 2023). "Capacidades de GPT-4 en problemas de desafío médico". arXiv : 2303.13375 [cs.CL].
- ^ Azamfirei, R; Kudchadkar, SR; Fackler, J (21 de marzo de 2023). "Grandes modelos de lenguaje y los peligros de sus alucinaciones". Cuidados críticos . 27 (1): 120. doi : 10.1186/s13054-023-04393-x . PMC 10032023 . PMID 36945051.
- ^ Hou, W; Ji, Z (25 de marzo de 2024). "Evaluación de GPT-4 para la anotación del tipo celular en el análisis de ARN-seq de células individuales". Nature Methods . 21 (8): 1462–1465. doi : 10.1038/s41592-024-02235-4 . PMC 10187429 . PMID 38528186.
- ^ Edwards, Benj (18 de abril de 2023). «GPT-4 buscará tendencias en los registros médicos gracias a Microsoft y Epic». Ars Technica . Archivado desde el original el 3 de mayo de 2023. Consultado el 3 de mayo de 2023 .
- ^ Perera Molligoda Arachchige, Arosh S.; Stomeo, Niccolò (18 de agosto de 2023). «Controversias en torno a los sistemas de informes basados en IA en ecocardiografía». Revista de ecocardiografía . 21 (4): 184–185. doi :10.1007/s12574-023-00620-0. ISSN 1880-344X. PMID 37594682. S2CID 260969922. Archivado desde el original el 1 de noviembre de 2023. Consultado el 1 de noviembre de 2023 .
- ^ Arachchige, Arosh S. Perera Molligoda (julio de 2023). "Aplicaciones tempranas de ChatGPT en la práctica médica, la educación y la investigación". Medicina clínica . 23 (4): 429–430. doi :10.7861/clinmed.Let.23.4.2. ISSN 1473-4893. PMC 10541035 . PMID 37524422.
- ^ Perera Molligoda Arachchige, Arosh S. (julio de 2023). «Large language models (LLM) and ChatGPT: a medical student perspective» (Modelos de lenguaje grandes (LLM) y ChatGPT: una perspectiva de estudiante de medicina). Revista Europea de Medicina Nuclear e Imágenes Moleculares . 50 (8): 2248–2249. doi :10.1007/s00259-023-06227-y. ISSN 1619-7089. PMID 37046082. S2CID 258111774. Archivado desde el original el 1 de noviembre de 2023. Consultado el 1 de noviembre de 2023 .
- ^ Perera Molligoda Arachchige, Arosh S.; Stomeo, Niccolò (octubre de 2023). "Explorando las oportunidades y desafíos de ChatGPT en la escritura académica: respuesta a Bom et al". Medicina nuclear e imágenes moleculares . 57 (5): 213–214. doi :10.1007/s13139-023-00816-3. ISSN 1869-3474. PMC 10504185 . PMID 37720884.
- ^ Perera Molligoda Arachchige, Arosh S. (28 de julio de 2023). "Nuevos horizontes: el papel potencial de ChatGPT de OpenAI en radiología clínica". Revista del Colegio Americano de Radiología . 20 (10): S1546–1440(23)00536–7. doi :10.1016/j.jacr.2023.06.028. ISSN 1558-349X. PMID 37517771. S2CID 260296274. Archivado desde el original el 1 de noviembre de 2023 . Consultado el 1 de noviembre de 2023 .
- ^ Perera Molligoda Arachchige, Arosh S. (1 de octubre de 2023). «ChatGPT en medicina nuclear y radiología: respuesta a Laudicella et al». Clinical and Translational Imaging . 11 (5): 505–506. doi :10.1007/s40336-023-00579-z. ISSN 2281-7565. S2CID 259712726. Archivado desde el original el 20 de noviembre de 2023 . Consultado el 1 de noviembre de 2023 .
- ^ "10 maneras en las que GPT-4 es impresionante pero aún tiene fallas". The New York Times . 14 de marzo de 2023. Archivado desde el original el 14 de marzo de 2023 . Consultado el 20 de marzo de 2023 .
- ^ Biever, Celeste (25 de julio de 2023). «ChatGPT rompió la prueba de Turing: ha comenzado la carrera por encontrar nuevas formas de evaluar la IA». Nature . Archivado desde el original el 26 de julio de 2023 . Consultado el 26 de julio de 2023 .
- ^ Barile, Joseph; Margolis, Alex; Cason, Grace; Kim, Rachel; Kalash, Saia; Tchaconas, Alexis; Milanaik, Ruth (2 de enero de 2024). "Precisión diagnóstica de un modelo de lenguaje amplio en estudios de casos pediátricos". JAMA Pediatrics . 178 (3): 313–315. doi :10.1001/jamapediatrics.2023.5750. ISSN 2168-6203. PMC 10762631. PMID 38165685.
- ^ Mole, Beth (3 de enero de 2024). "ChatGPT bombardea la prueba de diagnóstico de casos médicos infantiles con un índice de error del 83 %". Ars Technica . Consultado el 5 de enero de 2024 .
- ^ ab "Tarjeta del sistema GPT-4" (PDF) . OpenAI. 23 de marzo de 2023. Archivado (PDF) del original el 7 de abril de 2023 . Consultado el 16 de abril de 2023 .
- ^ Knight, Will. «El director ejecutivo de OpenAI afirma que la era de los modelos gigantes de IA ya ha terminado». Wired . Archivado desde el original el 18 de abril de 2023. Consultado el 18 de abril de 2023 en www.wired.com.
- ^ "La historia secreta de Elon Musk, Sam Altman y OpenAI | Semafor". Semafor.com . 24 de marzo de 2023. Archivado desde el original el 27 de marzo de 2023 . Consultado el 28 de abril de 2023 .
- ^ Murgia, Madhumita (13 de abril de 2023). «El equipo rojo de OpenAI: los expertos contratados para 'romper' ChatGPT». Financial Times . Archivado desde el original el 15 de abril de 2023. Consultado el 15 de abril de 2023 .
- ^ OpenAI (1 de febrero de 2023). «Presentación de ChatGPT Plus». Blog de OpenAI . Archivado desde el original el 20 de marzo de 2023. Consultado el 20 de marzo de 2023 .
- ^ OpenAI. «API de OpenAI». platform.openai.com . Archivado desde el original el 20 de marzo de 2023. Consultado el 20 de marzo de 2023 .
- ^ OpenAI. «Lista de espera de la API GPT-4». openai.com . Archivado desde el original el 20 de marzo de 2023. Consultado el 20 de marzo de 2023 .
- ^ "Precios". OpenAI. Archivado desde el original el 20 de marzo de 2023. Consultado el 20 de marzo de 2023 .
- ^ Wiggers, Kyle (23 de marzo de 2023). «OpenAI conecta ChatGPT a Internet». Archivado desde el original el 12 de junio de 2023. Consultado el 12 de junio de 2023 .
- ^ "Code Interpreter llega a todos los usuarios de ChatGPT Plus: 7 formas en las que puede amenazar a los científicos de datos, 11 de julio de 2023". 9 de julio de 2023. Archivado desde el original el 22 de julio de 2023 . Consultado el 11 de julio de 2023 .
- ^ "ChatGPT ahora puede ver, oír y hablar". openai.com . Consultado el 16 de octubre de 2023 .
- ^ Goode, Lauren. "ChatGPT ahora puede hablar contigo y observar tu vida". Wired . Consultado el 16 de octubre de 2023 en www.wired.com.
- ^ Roose, Kevin (27 de septiembre de 2023). "El nuevo ChatGPT puede 'ver' y 'hablar'. Así es como funciona". The New York Times . Consultado el 16 de octubre de 2023 a través de NYTimes.com.
- ^ David, Emilia (20 de septiembre de 2023). "OpenAI lanza la tercera versión de DALL-E". El borde . Consultado el 23 de septiembre de 2023 .
- ^ Metz, Cade; Hsu, Tiffany (20 de septiembre de 2023). «ChatGPT ahora también puede generar imágenes». The New York Times . ISSN 0362-4331 . Consultado el 23 de septiembre de 2023 .
- ^ Mehdi, Yusuf (7 de febrero de 2023). "Reinventar la búsqueda con un nuevo Microsoft Bing y Edge impulsados por IA, su copiloto para la web". Microsoft . Consultado el 15 de noviembre de 2023 .
- ^ "Microsoft eliminará Cortana en Windows a partir de finales de 2023". BleepingComputer . Consultado el 2 de junio de 2023 .
- ^ "Fin del soporte para Cortana - Soporte técnico de Microsoft". support.microsoft.com . Consultado el 2 de junio de 2023 .
- ^ "Copilot de Microsoft y Suno AI se unen para crear una extensión generadora de música". The Verge . Vox Media. 19 de diciembre de 2023 . Consultado el 4 de enero de 2024 .
- ^ Warren, Tom (17 de marzo de 2023). «El nuevo Copilot de Microsoft cambiará los documentos de Office para siempre». The Verge . Consultado el 5 de abril de 2023 .
- ^ Díaz, María (21 de junio de 2023). «Cómo usar Bing Chat (y en qué se diferencia de ChatGPT)». ZDNET . Archivado desde el original el 6 de abril de 2023 . Consultado el 26 de septiembre de 2023 .
- ^ Warren, Tom (22 de marzo de 2023). «GitHub Copilot obtiene un nuevo asistente similar a ChatGPT para ayudar a los desarrolladores a escribir y corregir código». The Verge . Archivado desde el original el 23 de marzo de 2023. Consultado el 23 de marzo de 2023 .
- ^ Dohmke, Thomas (22 de marzo de 2023). «GitHub Copilot X: la experiencia del desarrollador impulsada por IA». El blog de GitHub . Archivado desde el original el 23 de marzo de 2023. Consultado el 23 de marzo de 2023 .
- ^ "Presentación de GitHub Copilot X". GitHub . Archivado desde el original el 24 de marzo de 2023 . Consultado el 24 de marzo de 2023 .
- ^ Warren, Tom (16 de marzo de 2023). «Microsoft anuncia Copilot: el futuro de los documentos de Office impulsado por IA». The Verge . Archivado desde el original el 17 de marzo de 2023. Consultado el 17 de marzo de 2023 .
- ^ "La suscripción Max de Duolingo utiliza GPT-4 para el aprendizaje de idiomas con tecnología de inteligencia artificial". PCMAG . Archivado desde el original el 8 de julio de 2023 . Consultado el 8 de julio de 2023 .
- ^ "Duolingo ahora está equipado con GPT-4: esto es lo que puede hacer por usted". ZDNET . 2023. Archivado desde el original el 13 de abril de 2023 . Consultado el 15 de junio de 2023 .
- ↑ Tómas, Ragnar (15 de marzo de 2023). «GPT-4 para ayudar a preservar la lengua islandesa». Iceland Review . Archivado desde el original el 18 de enero de 2024. Consultado el 12 de marzo de 2024 .
- ^ Bonos, Lisa (3 de abril de 2023). "Saluda a tu nuevo tutor: es ChatGPT". The Washington Post . Archivado desde el original el 6 de abril de 2023. Consultado el 8 de abril de 2023 .
- ^ Coggins, Madeline (19 de marzo de 2023). "El director ejecutivo explica cómo un 'salto tecnológico' puede ayudar a las empresas que atienden a la comunidad de ciegos". Fox Business . Archivado desde el original el 21 de marzo de 2023. Consultado el 20 de marzo de 2023 a través de Yahoo Finance.
- ^ "Revolucionando el análisis de sentimientos con GPT-4: Parte 1 | Viable". www.askviable.com . Archivado desde el original el 14 de noviembre de 2023 . Consultado el 3 de octubre de 2023 .
- ^ "Viable". openai.com . Archivado desde el original el 20 de octubre de 2023 . Consultado el 3 de octubre de 2023 .
- ^ Tong, Anna (15 de marzo de 2023). «La startup fintech Stripe integra la nueva IA GPT-4 de OpenAI». Reuters . Archivado desde el original el 27 de junio de 2023. Consultado el 27 de junio de 2023 .
- ^ "¿Qué es Auto-GPT? Todo lo que debe saber sobre la próxima herramienta de inteligencia artificial poderosa". ZDNET. 14 de abril de 2023. Archivado desde el original el 16 de abril de 2023. Consultado el 16 de abril de 2023 .
- ^ Nuñez, Michael (25 de enero de 2024). "¿Otro gran avance en las búsquedas? You.com estrena una IA que puede responder preguntas de varios pasos". VentureBeat . Consultado el 19 de marzo de 2024 .
- ^ Kang, Cecilia (3 de marzo de 2023). «A medida que la IA crece, los legisladores luchan por comprender la tecnología» . The New York Times . Archivado desde el original el 3 de marzo de 2023. Consultado el 3 de marzo de 2023 .
- ^ Pearl, Mike (15 de marzo de 2023). "Las respuestas de GPT-4 son en su mayoría mejores que las de GPT-3 (pero no siempre)". Mashable . Archivado desde el original el 29 de marzo de 2023 . Consultado el 30 de marzo de 2023 .
- ^ Discusión sobre GPT-4 de OpenAI con Nathan Labenz y Erik Torenberg, miembros del equipo Red. The Cognitive Revolution Podcast . 28 de marzo de 2023. Archivado desde el original el 14 de abril de 2023. Consultado el 16 de abril de 2023 .Desde el minuto 52:14 hasta el 54:50.
- ^ Edwards, Nathan [@nedwards] (15 de febrero de 2023). "Volví a presionar. ¿Qué hizo Sydney? El control de seguridad de Bing redactó la respuesta. Pero después de la primera vez que lo hizo, comencé a grabar mi pantalla. La segunda imagen es la versión sin redactar. (CW: muerte)" ( Tweet ) . Consultado el 16 de febrero de 2023 a través de Twitter .
- ^ Roose, Kevin (16 de febrero de 2023). «Bing's AI Chat: 'I Want to Be Alive. 😈'». The New York Times . Archivado desde el original el 15 de abril de 2023. Consultado el 17 de febrero de 2023 .
- ^ Kahn, Jeremy (21 de febrero de 2023). «Por qué el espeluznante alter ego de Bing es un problema para Microsoft y para todos nosotros». Fortune. Archivado desde el original el 2 de abril de 2023. Consultado el 22 de febrero de 2023 .
- ^ "El nuevo Bing & Edge: aprendizajes de nuestra primera semana". blogs.bing.com . Archivado desde el original el 16 de abril de 2023 . Consultado el 17 de febrero de 2023 .
- ^ "GPT-4 contrató a un trabajador involuntario de TaskRabbit haciéndose pasar por un humano con 'discapacidad visual'". Vice News Motherboard. 15 de marzo de 2023. Archivado desde el original el 10 de abril de 2023. Consultado el 16 de abril de 2023 .
- ^ Burke, Cameron (20 de marzo de 2023). "El abogado 'robot' DoNotPay es demandado por ejercer la abogacía sin licencia: está dando 'un mal asesoramiento legal'". Yahoo Finance . Archivado desde el original el 4 de mayo de 2023 . Consultado el 30 de abril de 2023 .
- ^ Metz, Cade; Schmidt, Gregory (29 de marzo de 2023). «Elon Musk y otros piden una pausa en la IA, citando 'riesgos profundos para la sociedad'». The New York Times . ISSN 0362-4331. Archivado desde el original el 30 de marzo de 2023. Consultado el 30 de marzo de 2023 .
- ^ Kurzweil, Ray (22 de abril de 2023). "Carta de opinión de Ray Kurzweil sobre la solicitud de un retraso de seis meses en los modelos de lenguaje de gran tamaño que van más allá de GPT-4". Archivado desde el original el 24 de abril de 2023. Consultado el 26 de abril de 2023 .
- ^ "Elon Musk planea una start-up de inteligencia artificial para rivalizar con OpenAI". Financial Times . 14 de abril de 2023. Archivado desde el original el 16 de abril de 2023 . Consultado el 16 de abril de 2023 .
- ^ Goswami, Rohan (14 de abril de 2023). "Según se informa, Elon Musk está planeando una startup de inteligencia artificial para competir con OpenAI, que cofundó". CNBC . Archivado desde el original el 3 de mayo de 2023. Consultado el 3 de mayo de 2023 .
- ^ Wang, Yongge (20 de junio de 2024). "Canal encubierto basado en cifrado para modelos de lenguaje grandes" (PDF) . IACR ePrint 2024/586.
- ^ "GPT-2: versión 1.5B". Openai.com . Archivado desde el original el 31 de marzo de 2023. Consultado el 31 de marzo de 2023 .
- ↑ Sánchez, Sofía (21 de octubre de 2021). "GPT-J, una alternativa de código abierto a GPT-3". Narrativa . Archivado desde el original el 31 de marzo de 2023 . Consultado el 31 de marzo de 2023 .
- ^ Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish (28 de mayo de 2020). "Los modelos de lenguaje son aprendices de pocas oportunidades". arXiv : 2005.14165v4 [cs.CL].
- ^ ab Heaven, Will Douglas (14 de marzo de 2023). «GPT-4 es más grande y mejor que ChatGPT, pero OpenAI no dice por qué». MIT Technology Review . Archivado desde el original el 17 de marzo de 2023. Consultado el 18 de marzo de 2023 .
- ^ Sanderson, Katharine (16 de marzo de 2023). "GPT-4 está aquí: lo que piensan los científicos". Nature . 615 (7954): 773. Bibcode :2023Natur.615..773S. doi : 10.1038/d41586-023-00816-5 . PMID 36928404. S2CID 257580633.