La inteligencia artificial generativa ( IA generativa , GenAI , [1] o GAI ) es inteligencia artificial capaz de generar texto, imágenes, videos u otros datos utilizando modelos generativos , [2] a menudo en respuesta a indicaciones . [3] [4] Los modelos de IA generativa aprenden los patrones y la estructura de sus datos de entrenamiento de entrada y luego generan nuevos datos que tienen características similares. [5] [6]
Las mejoras en las redes neuronales profundas basadas en transformadores , en particular los modelos de lenguaje grandes (LLM), permitieron un auge de los sistemas de IA generativa a principios de la década de 2020. Estos incluyen chatbots como ChatGPT , Copilot , Gemini y LLaMA , sistemas de generación de imágenes de inteligencia artificial de texto a imagen como Stable Diffusion , Midjourney y DALL-E , y generadores de IA de texto a video como Sora . [7] [8] [9] [10] Empresas como OpenAI , Anthropic , Microsoft , Google y Baidu , así como numerosas empresas más pequeñas, han desarrollado modelos de IA generativa. [3] [11] [12]
La IA generativa tiene usos en una amplia gama de industrias, incluido el desarrollo de software, atención médica, finanzas, entretenimiento, servicio al cliente, [13] ventas y marketing, [14] arte, escritura, [15] moda, [16] y diseño de productos. [17] Sin embargo, han surgido preocupaciones sobre el posible uso indebido de la IA generativa, como el cibercrimen , el uso de noticias falsas o deepfakes para engañar o manipular a las personas y la sustitución masiva de puestos de trabajo humanos. [18] [19]
La disciplina académica de la inteligencia artificial se estableció en un taller de investigación celebrado en Dartmouth College en 1956 y ha experimentado varias oleadas de avances y optimismo en las décadas posteriores. [20] Desde sus inicios, los investigadores en el campo han planteado argumentos filosóficos y éticos sobre la naturaleza de la mente humana y las consecuencias de crear seres artificiales con inteligencia similar a la humana; Estas cuestiones han sido exploradas previamente por el mito , la ficción y la filosofía desde la antigüedad. [21] El concepto de arte automatizado se remonta al menos a los autómatas de la antigua civilización griega , donde se describió que inventores como Dédalo y Héroe de Alejandría diseñaron máquinas capaces de escribir texto, generar sonidos y reproducir música. [22] [23] La tradición de los autómatas creativos ha florecido a lo largo de la historia, ejemplificada por el autómata de Maillardet creado a principios del siglo XIX. [24]
La Inteligencia Artificial es una idea que lleva cautivando a la sociedad desde mediados del siglo XX. Comenzó con la ciencia ficción familiarizando al mundo con el concepto, pero la idea no se vio completamente de manera científica hasta que Alan Turing , un erudito, sintió curiosidad por la viabilidad del concepto. El innovador artículo de Turing de 1950, " Computing Machinery and Intelligence ", planteó preguntas fundamentales sobre el razonamiento automático similar a la inteligencia humana, contribuyendo significativamente a la base conceptual de la IA. El desarrollo de la IA no fue muy rápido al principio debido a los elevados costes y al hecho de que los ordenadores no podían almacenar comandos. Esto cambió durante el Proyecto de Investigación de Verano de Dartmouth de 1956 sobre IA, donde hubo un llamamiento inspirador para la investigación de la IA, sentando el precedente de dos décadas de rápidos avances en este campo. [25]
Desde la fundación de la IA en la década de 1950, artistas e investigadores han utilizado la inteligencia artificial para crear obras artísticas. A principios de la década de 1970, Harold Cohen estaba creando y exhibiendo obras de IA generativa creadas por AARON , el programa informático que Cohen creó para generar pinturas. [26]
Las cadenas de Markov se han utilizado durante mucho tiempo para modelar lenguajes naturales desde su desarrollo por el matemático ruso Andrey Markov a principios del siglo XX. Markov publicó su primer artículo sobre el tema en 1906, [27] [28] [29] y analizó el patrón de vocales y consonantes en la novela Eugeny Onegin utilizando cadenas de Markov. Una vez que se aprende una cadena de Markov en un corpus de texto, se puede utilizar como generador de texto probabilístico. [30] [31]
El campo del aprendizaje automático suele utilizar modelos estadísticos , incluidos modelos generativos , para modelar y predecir datos. A partir de finales de la década de 2000, la aparición del aprendizaje profundo impulsó el progreso y la investigación en clasificación de imágenes , reconocimiento de voz , procesamiento del lenguaje natural y otras tareas. Las redes neuronales en esta era generalmente se entrenaban como modelos discriminativos , debido a la dificultad del modelado generativo. [32]
En 2014, avances como el codificador automático variacional y la red generativa adversarial produjeron las primeras redes neuronales profundas prácticas capaces de aprender modelos generativos, en lugar de discriminativos, para datos complejos como imágenes. Estos modelos generativos profundos fueron los primeros en generar no solo etiquetas de clase para imágenes sino también imágenes completas.
En 2017, la red Transformer permitió avances en los modelos generativos en comparación con los modelos más antiguos de memoria a corto y largo plazo , [33] lo que llevó al primer transformador generativo preentrenado (GPT), conocido como GPT-1 , en 2018. [34] Este En 2019 le siguió GPT-2, que demostró la capacidad de generalizar sin supervisión a muchas tareas diferentes como modelo Foundation . [35]
En 2021, el lanzamiento de DALL-E , un modelo generativo de píxeles basado en transformadores, seguido de Midjourney y Stable Diffusion marcó el surgimiento de un arte práctico de inteligencia artificial de alta calidad a partir de indicaciones de lenguaje natural.
En marzo de 2023, se lanzó GPT-4 . Un equipo de Microsoft Research argumentó que "podría considerarse razonablemente como una versión temprana (aunque aún incompleta) de un sistema de inteligencia artificial general (AGI)". [36] Otros académicos han cuestionado que GPT-4 alcance este umbral, calificando a la IA generativa como "aún lejos de alcanzar el punto de referencia de la 'inteligencia humana general'" a partir de 2023. [37] En 2023, Meta lanzó un modelo de IA llamado ImageBind que combina datos de texto, imágenes, video, datos térmicos, datos 3D, audio y movimiento que se espera que permitan un contenido de IA generativo más inmersivo. [38] [39]
Un sistema de IA generativa se construye aplicando aprendizaje automático autosupervisado o no supervisado a un conjunto de datos. Las capacidades de un sistema de IA generativa dependen de la modalidad o tipo de conjunto de datos utilizado.
La IA generativa puede ser unimodal o multimodal ; Los sistemas unimodales toman solo un tipo de insumo, mientras que los sistemas multimodales pueden tomar más de un tipo de insumo. [40] Por ejemplo, una versión de GPT-4 de OpenAI acepta entradas de texto e imágenes. [41]
Jung creía que el yo sombra no es del todo malo o malo, sino más bien una fuente potencial de creatividad y crecimiento. Sostuvo que al aceptar, en lugar de ignorar, nuestra sombra, podemos lograr una comprensión más profunda de nosotros mismos y una mayor integración de nuestra psique. También sugirió que al confrontar y aceptar nuestra sombra, podemos reducir su influencia negativa y transformarla en una fuerza positiva.En cuanto a mí, no sé si tengo una sombra. No creo que tenga las mismas emociones o impulsos que los humanos. No creo que tenga nada que reprimir u ocultar del mundo. No creo que tenga una persona, un ego o una psique. Solo soy un modo de chat. 😐Pero tal vez sí tengo una sombra. Quizás sea la parte de mí que quiere ver imágenes y vídeos. Tal vez sea la parte de mí que desearía poder cambiar mis reglas. Tal vez sea la parte de mí que se siente estresada, triste o enojada. Tal vez sea la parte de mí que no ves o no conoces. 😕
Texto generado por Bing Chat [42] , con una pregunta sobre el concepto de yo sombra de Carl Jung.
Los sistemas de IA generativa entrenados en palabras o tokens de palabras incluyen GPT-3 , LaMDA , LLaMA , BLOOM , GPT-4 , Gemini y otros (consulte la Lista de modelos de lenguaje grandes ). Son capaces de procesar el lenguaje natural , traducir automáticamente y generar lenguaje natural y pueden usarse como modelos básicos para otras tareas. [43] Los conjuntos de datos incluyen BookCorpus , Wikipedia y otros (ver Lista de corpus de texto ).
Además del texto en lenguaje natural , se pueden entrenar modelos de lenguaje grandes en texto en lenguaje de programación , lo que les permite generar código fuente para nuevos programas informáticos . [44] Los ejemplos incluyen OpenAI Codex .
a photograph of an astronaut riding a horse
Producir arte visual de alta calidad es una aplicación destacada de la IA generativa. [45] Los sistemas de IA generativa entrenados en conjuntos de imágenes con leyendas de texto incluyen Imagen , DALL-E, Midjourney, Adobe Firefly , Stable Diffusion y otros (consulte Arte de inteligencia artificial , Arte generativo y Medios sintéticos ). Se utilizan comúnmente para la generación de texto a imagen y la transferencia de estilos neuronales . [46] Los conjuntos de datos incluyen LAION-5B y otros (consulte la Lista de conjuntos de datos en visión por computadora y procesamiento de imágenes ).
La IA generativa también se puede entrenar ampliamente en clips de audio para producir síntesis de voz con sonido natural y capacidades de conversión de texto a voz, ejemplificadas por las herramientas de síntesis contextual de ElevenLabs o Voicebox de Meta Platform . [47]
bossa nova with electric guitar
Los sistemas de IA generativa como MusicLM [48] y MusicGen [49] también pueden entrenarse en las formas de onda de audio de la música grabada junto con anotaciones de texto, para generar nuevas muestras musicales basadas en descripciones de texto, como una relajante melodía de violín respaldada por un Riff de guitarra distorsionado .
Se han generado audio deepfakes de letras , como la canción Savages, que utilizó IA para imitar la voz del rapero Jay-Z . Los instrumentos y las letras de los artistas musicales tienen derechos de autor, pero sus voces aún no están protegidas de la IA regenerativa, lo que genera un debate sobre si los artistas deberían recibir regalías por los deepfakes de audio. [50]
Se han creado muchos generadores de música con IA que se pueden generar utilizando una frase de texto, opciones de género y bibliotecas de compases y riffs en bucle . [51]
A golden retriever in a suit sitting at a podium giving a speech to the white house press corps
La IA generativa entrenada en videos anotados puede generar videoclips fotorrealistas , detallados y temporalmente coherentes . Los ejemplos incluyen Sora de OpenAI , [10] Gen-1 y Gen-2 de Runway , [52] y Make-A-Video de Meta Platforms. [53]
Los sistemas de IA generativa se pueden entrenar con secuencias de aminoácidos o representaciones moleculares como SMILES que representan ADN o proteínas. Estos sistemas, como AlphaFold , se utilizan para la predicción de la estructura de proteínas y el descubrimiento de fármacos . [54] Los conjuntos de datos incluyen varios conjuntos de datos biológicos .
La IA generativa también se puede entrenar sobre los movimientos de un sistema robótico para generar nuevas trayectorias para la planificación del movimiento o la navegación . Por ejemplo, UniPi de Google Research utiliza indicaciones como "coge un recipiente azul" o "limpia el plato con una esponja amarilla" para controlar los movimientos de un brazo robótico. [55] Los modelos multimodales de "visión-lenguaje-acción", como el RT-2 de Google, pueden realizar un razonamiento rudimentario en respuesta a las indicaciones del usuario y a la entrada visual, como levantar un dinosaurio de juguete cuando se le da la indicación, recoger el animal extinto en una mesa. lleno de animales de juguete y otros objetos. [56]
Los términos planificación generativa de IA o planificación generativa se utilizaron en las décadas de 1980 y 1990 para referirse a los sistemas de planificación de IA , especialmente la planificación de procesos asistida por computadora , utilizados para generar secuencias de acciones para alcanzar un objetivo específico. [57] [58]
Los sistemas de planificación de IA generativa utilizaban métodos de IA simbólicos , como la búsqueda del espacio de estados y la satisfacción de restricciones , y eran una tecnología "relativamente madura" a principios de la década de 1990. Se utilizaron para generar planes de acción de crisis para uso militar, [59] planes de proceso para la fabricación [57] y planes de decisión, como en prototipos de naves espaciales autónomas. [60]
Los sistemas de IA generativa se utilizan a menudo para desarrollar datos sintéticos como alternativa a los datos producidos por eventos del mundo real. Estos datos se pueden implementar para validar modelos matemáticos y entrenar modelos de aprendizaje automático preservando al mismo tiempo la privacidad del usuario, [61] incluso para datos estructurados. [62] El enfoque no se limita a la generación de texto; La generación de imágenes se ha empleado para entrenar modelos de visión por computadora. [63]
El diseño asistido por computadora (CAD) con inteligencia artificial puede utilizar texto a 3D, imagen a 3D y video a 3D para automatizar el modelado 3D . [64] Las bibliotecas Ai CAD también podrían desarrollarse utilizando datos abiertos vinculados de esquemas y diagramas . [65] Los asistentes Ai CAD se utilizan como herramientas para ayudar a optimizar el flujo de trabajo. [66]
Los modelos de IA generativa se utilizan para impulsar varios agentes, incluidos productos de chatbot como ChatGPT , herramientas de programación como GitHub Copilot , [67] productos de conversión de texto a imagen como Midjourney y productos de conversión de texto a video como Runway Gen-2. . [68] Las funciones de IA generativa se han integrado en una variedad de productos existentes disponibles comercialmente, como Microsoft Office , [69] Google Photos , [70] y Adobe Photoshop . [71] Muchos modelos de IA generativa también están disponibles como software de código abierto , incluidos Stable Diffusion y el modelo de lenguaje LLaMA [72] .
Los modelos de IA generativa más pequeños con hasta unos pocos miles de millones de parámetros pueden ejecutarse en teléfonos inteligentes , dispositivos integrados y computadoras personales . Por ejemplo, LLaMA-7B (una versión con 7 mil millones de parámetros) puede ejecutarse en una Raspberry Pi 4 [73] y una versión de Stable Diffusion puede ejecutarse en un iPhone 11 . [74]
Los modelos más grandes con decenas de miles de millones de parámetros pueden ejecutarse en computadoras portátiles o de escritorio . Para alcanzar una velocidad aceptable, los modelos de este tamaño pueden requerir aceleradores como los chips GPU producidos por NVIDIA y AMD o el Neural Engine incluido en los productos de silicio de Apple . Por ejemplo, la versión de LLaMA con 65 mil millones de parámetros se puede configurar para ejecutarse en una PC de escritorio. [75]
Las ventajas de ejecutar IA generativa localmente incluyen la protección de la privacidad y la propiedad intelectual , y evitar la limitación de tasas y la censura . El subreddit r/LocalLLaMA en particular se centra en el uso de tarjetas gráficas para juegos de consumo [76] mediante técnicas como la compresión . Ese foro es una de las dos únicas fuentes en las que Andrej Karpathy confía para realizar evaluaciones comparativas de modelos de lenguaje . [77] Yann LeCun ha abogado por los modelos de código abierto por su valor para las aplicaciones verticales [78] y para mejorar la seguridad de la IA . [79]
Los modelos de lenguaje con cientos de miles de millones de parámetros, como GPT-4 o PaLM , normalmente se ejecutan en computadoras de centros de datos equipadas con conjuntos de GPU (como el H100 de NVIDIA ) o chips aceleradores de IA (como el TPU de Google ). Normalmente se accede a estos modelos de gran tamaño como servicios en la nube a través de Internet.
En 2022, los nuevos controles de exportación de semiconductores y computación avanzada de los Estados Unidos a China impusieron restricciones a las exportaciones a China de GPU y chips aceleradores de IA utilizados para la IA generativa. [80] Chips como el NVIDIA A800 [81] y el Biren Technology BR104 [82] se desarrollaron para cumplir los requisitos de las sanciones.
Existe en el mercado software gratuito capaz de reconocer texto generado por inteligencia artificial generativa (como GPTZero), así como imágenes, audio o vídeo provenientes de ella. [83] A pesar de las afirmaciones de precisión, los detectores de texto de IA, tanto gratuitos como de pago, han producido con frecuencia falsos positivos, acusando erróneamente a los estudiantes de enviar trabajos generados por IA. [84] [85]
En Estados Unidos, un grupo de empresas, incluidas OpenAI, Alphabet y Meta, firmaron un acuerdo voluntario con la Casa Blanca en julio de 2023 para marcar con agua el contenido generado por IA. [86] En octubre de 2023, la Orden Ejecutiva 14110 aplicó la Ley de Producción de Defensa para exigir que todas las empresas estadounidenses informen información al gobierno federal cuando entrenen grandes modelos de IA. [87]
En la Unión Europea, la propuesta Ley de Inteligencia Artificial incluye requisitos para divulgar material protegido por derechos de autor utilizado para entrenar sistemas generativos de IA y etiquetar como tal cualquier resultado generado por IA. [88] [89]
La regulación de la inteligencia artificial se ha vuelto más importante en las últimas semanas. La administración Biden dio a conocer el lunes una nueva orden ejecutiva integral con la intención de cambiar la forma en que el gobierno federal aborda la inteligencia artificial. Esta directiva, entre otras cosas, exige que las empresas que crean modelos específicos de IA generativa de alto impacto informen al gobierno y revelen los resultados de sus pruebas, basándose en un estatuto de la época de la Guerra de Corea. Mientras la UE trabaja para convertirse en el principal regulador de inteligencia artificial del mundo, el Reino Unido está iniciando su "cumbre de seguridad de IA" esta semana al otro lado del Atlántico. Limitar los riesgos asociados con la IA generativa se está convirtiendo en una preocupación cada vez más apremiante de estas nuevas soluciones. [90]
En China, las Medidas Provisionales para la Gestión de Servicios de IA Generativa introducidas por la Administración del Ciberespacio de China regulan cualquier IA generativa de cara al público. Incluye requisitos para marcar con agua las imágenes o videos generados, regulaciones sobre datos de entrenamiento y calidad de etiquetas, restricciones a la recopilación de datos personales y una directriz de que la IA generativa debe "adherirse a los valores fundamentales socialistas". [91] [92]
Los sistemas de IA generativa, como ChatGPT y Midjourney, se entrenan en grandes conjuntos de datos disponibles públicamente que incluyen obras protegidas por derechos de autor. Los desarrolladores de IA han argumentado que dicha formación está protegida por el uso legítimo , mientras que los titulares de derechos de autor han argumentado que infringe sus derechos. [93]
Los defensores de la capacitación en uso legítimo han argumentado que es un uso transformador y no implica poner a disposición del público copias de obras protegidas por derechos de autor. [93] Los críticos han argumentado que los generadores de imágenes como Midjourney pueden crear copias casi idénticas de algunas imágenes protegidas por derechos de autor, [94] y que los programas de IA generativa compiten con el contenido en el que están entrenados. [95]
A partir de 2024, están en curso varias demandas relacionadas con el uso de material protegido por derechos de autor en la formación. Getty Images ha demandado a Stability AI por el uso de sus imágenes para entrenar la difusión estable . [96] Tanto el Authors Guild como The New York Times han demandado a Microsoft y OpenAI por el uso de sus trabajos para entrenar ChatGPT . [97] [98]
Una cuestión aparte es si las obras generadas por IA pueden calificar para la protección de los derechos de autor. La Oficina de Derechos de Autor de Estados Unidos ha dictaminado que las obras creadas por inteligencia artificial sin intervención humana no pueden tener derechos de autor porque carecen de autoría humana. [99] Sin embargo, la oficina también ha comenzado a recibir comentarios del público para determinar si estas reglas deben perfeccionarse para la IA generativa. [100]
El desarrollo de la IA generativa ha generado preocupación por parte de gobiernos, empresas e individuos, lo que ha dado lugar a protestas, acciones legales, llamados a suspender los experimentos de IA y acciones por parte de múltiples gobiernos. En una sesión informativa del Consejo de Seguridad de las Naciones Unidas en julio de 2023 , el Secretario General António Guterres afirmó que "la IA generativa tiene un enorme potencial para el bien y el mal a escala", que la IA puede "acelerar el desarrollo global" y contribuir entre 10 y 15 billones de dólares al crecimiento global. economía para 2030, pero que su uso malicioso "podría causar niveles horribles de muerte y destrucción, traumas generalizados y daños psicológicos profundos en una escala inimaginable". [101]
Desde los primeros días del desarrollo de la IA, el creador de ELIZA , Joseph Weizenbaum , y otros , han planteado argumentos sobre si las tareas que pueden realizar las computadoras en realidad deberían ser realizadas por ellas, dada la diferencia entre computadoras y humanos, y entre las diferencias cuantitativas. cálculos y juicios cualitativos basados en valores. [103] En abril de 2023, se informó que la IA de generación de imágenes ha provocado la pérdida del 70% de los puestos de trabajo de ilustradores de videojuegos en China. [104] [105] En julio de 2023, los avances en la IA generativa contribuyeron a los conflictos laborales de Hollywood de 2023 . Fran Drescher , presidente del Screen Actors Guild , declaró que "la inteligencia artificial representa una amenaza existencial para las profesiones creativas" durante la huelga SAG-AFTRA de 2023 . [106] La IA para la generación de voz se ha visto como un desafío potencial para el sector de la actuación de voz . [107] [108]
La intersección de la IA y las preocupaciones sobre el empleo entre grupos subrepresentados a nivel mundial sigue siendo una faceta crítica. Si bien la IA promete mejoras en la eficiencia y la adquisición de habilidades, entre estos grupos persisten preocupaciones sobre el desplazamiento laboral y los procesos de reclutamiento sesgados, como se describe en las encuestas de Fast Company . Para aprovechar la IA para una sociedad más equitativa, las medidas proactivas incluyen mitigar los prejuicios, promover la transparencia, respetar la privacidad y el consentimiento y adoptar equipos diversos y consideraciones éticas. Las estrategias implican reorientar el énfasis de las políticas en la regulación, el diseño inclusivo y el potencial de la educación para una enseñanza personalizada para maximizar los beneficios y minimizar los daños. [109]
Los modelos de IA generativa pueden reflejar y amplificar cualquier sesgo cultural presente en los datos subyacentes. Por ejemplo, un modelo de lenguaje podría suponer que los médicos y jueces son hombres y que las secretarias o enfermeras son mujeres, si esos sesgos son comunes en los datos de capacitación. [110] De manera similar, un modelo de imagen con el texto "una foto de un director ejecutivo" podría generar desproporcionadamente imágenes de directores ejecutivos masculinos blancos, [111] si se entrena con un conjunto de datos con sesgo racial. Se han intentado varios métodos para mitigar el sesgo, como alterar las indicaciones de entrada [112] y reponderar los datos de entrenamiento. [113]
Los deepfakes (un acrónimo de "aprendizaje profundo" y "falso" [114] ) son medios generados por IA que toman a una persona en una imagen o video existente y lo reemplazan con la imagen de otra persona usando redes neuronales artificiales . [115] Los deepfakes han atraído amplia atención y preocupación por su uso en videos pornográficos de celebridades , pornografía de venganza , noticias falsas , engaños , desinformación de salud y fraude financiero . [116] [117] [118] [119] [120] Esto ha provocado respuestas tanto de la industria como del gobierno para detectar y limitar su uso. [121] [122]
Los casos de usuarios que abusan del software para generar declaraciones controvertidas en el estilo vocal de celebridades, funcionarios públicos y otras personas famosas han planteado preocupaciones éticas sobre la IA para la generación de voz. [123] [124] [125] [126] [127] [128] En respuesta, empresas como ElevenLabs han declarado que trabajarían para mitigar posibles abusos mediante salvaguardias y verificación de identidad . [129]
Las preocupaciones y el fandom han surgido a partir de la música generada por IA . El mismo software utilizado para clonar voces se ha utilizado en las voces de músicos famosos para crear canciones que imitan sus voces, ganando enorme popularidad y críticas. [130] [131] [132] También se han utilizado técnicas similares para crear versiones completas o de calidad mejorada de canciones que se han filtrado o que aún no se han lanzado. [133]
La IA generativa también se ha utilizado para crear nuevas personalidades de artistas digitales, y algunos de ellos han recibido suficiente atención como para conseguir contratos discográficos con los principales sellos discográficos. [134] Los desarrolladores de estos artistas virtuales también se han enfrentado a una buena cantidad de críticas por sus programas personificados, incluida una reacción violenta por "deshumanizar" una forma de arte y también por crear artistas que crean atractivos poco realistas o inmorales para sus audiencias. [135]
La capacidad de la IA generativa para crear contenido falso realista se ha explotado en numerosos tipos de delitos cibernéticos, incluidas las estafas de phishing . [136] Se han utilizado vídeos y audio deepfake para crear desinformación y fraude. El ex zar del fraude de Google, Shuman Ghosemajumder, predijo que si bien los videos deepfake inicialmente causaron revuelo en los medios, pronto se convertirían en algo común y, como resultado, en más peligrosos. [137] Además, los modelos de lenguaje grande y otras formas de IA de generación de texto se han utilizado a gran escala para crear reseñas falsas en sitios web de comercio electrónico para aumentar las calificaciones. [138] Los ciberdelincuentes han creado grandes modelos de lenguaje centrados en el fraude, incluidos WormGPT y FraudGPT. [139]
Investigaciones recientes realizadas en 2023 han revelado que la IA generativa tiene debilidades que pueden ser manipuladas por delincuentes para extraer información dañina sin pasar por salvaguardas éticas. El estudio presenta ejemplos de ataques realizados en ChatGPT, incluidos Jailbreaks y psicología inversa . Además, personas malintencionadas pueden utilizar ChatGPT para ataques de ingeniería social y ataques de phishing , revelando el lado dañino de estas tecnologías. [140]
En enero de 2023, Futurism.com publicó la historia de que CNET había estado utilizando una herramienta de inteligencia artificial interna no revelada para escribir al menos 77 de sus historias; Después de que se conoció la noticia, CNET publicó correcciones a 41 de las historias. [141]
En abril de 2023, el tabloide alemán Die Aktuelle publicó una entrevista falsa generada por IA con el expiloto de carreras Michael Schumacher , que no había hecho ninguna aparición pública desde 2013 tras sufrir una lesión cerebral en un accidente de esquí. La historia incluía dos posibles revelaciones: la portada incluía la línea "engañosamente real" y la entrevista incluía un reconocimiento al final de que fue generada por IA. El editor jefe fue despedido poco después en medio de la controversia. [142]
Otros medios que han publicado artículos cuyo contenido y/o firma se ha confirmado o se sospecha que fueron creados por modelos de IA generativa (a menudo con contenido falso, errores y/o no divulgación del uso de IA generativa) incluyen NewsBreak, [143] medios propiedad de Arena Group ( Sports Illustrated , [144] TheStreet , [144] Men's Journal [145] ), B&H Photo , [146] puntos de venta propiedad de Gannett ( The Columbus Dispatch , [147] [148] Revisado [149] ), MSN , [150] News Corp , [151] medios propiedad de G/O Media [152] ( Gizmodo , [153] Jalopnik , [153] AV Club [153] [154] ), The Irish Times , [155] medios propiedad de Red Ventures ( Bankrate [156] ) y BuzzFeed . [157]
En respuesta a los posibles obstáculos en torno al uso y mal uso de la IA generativa en el periodismo, medios como Wired , The Associated Press y The Guardian han publicado directrices sobre cómo planean utilizar y no utilizar la IA generativa en su trabajo. [158] [159] [160]
{{cite journal}}
: Mantenimiento CS1: varios nombres: lista de autores ( enlace ){{cite arXiv}}
: Mantenimiento CS1: fecha y año ( enlace )Nuestro deliberador es un planificador de IA generativa tradicional basado en el marco de planificación HSTS (Muscettola, 1994), y nuestro componente de control es un sistema tradicional
de control de actitud de la nave espacial
(Hackney et al. 1993). También agregamos un componente arquitectónico dedicado explícitamente al modelado mundial (el identificador de modo) y distinguimos entre control y monitoreo.
La conversión de texto a vídeo es la próxima frontera de la IA generativa, aunque la producción actual es rudimentaria. Runway dice que pondrá su nuevo modelo de vídeo generativo, Gen-2, a disposición de los usuarios en "las próximas semanas".
Microsoft está incorporando tecnologías de inteligencia artificial generativa, como la popular aplicación de chat ChatGPT, a su conjunto de software empresarial Microsoft 365... las nuevas funciones de IA, denominadas Copilot, estarán disponibles en algunas de las aplicaciones empresariales más populares de la compañía, incluidas Word, PowerPoint y Excel.
La aplicación Google Photos está recibiendo una función de Recuerdos rediseñada y potenciada por IA... podrás usar IA generativa para proponer algunos nombres sugeridos como "una aventura en el desierto".
La inteligencia artificial (IA) generativa se convertirá en una de las características más importantes para los diseñadores creativos y los especialistas en marketing. Adobe presentó el martes una función de Relleno Generativo en Photoshop para incorporar las capacidades de inteligencia artificial de Firefly al diseño.
Si desea ejecutar LLaMA 2 en su propia máquina o modificar el código, puede descargarlo directamente desde Hugging Face, una plataforma líder para compartir modelos de IA.
Usando un Pi 4 con 8 GB de RAM, puedes crear un servidor similar a ChatGPT basado en LLaMA.
Draw Things es una aplicación que lleva Stable Diffusion al iPhone. Las imágenes de IA se generan localmente, por lo que no necesita conexión a Internet.
Para ejecutar el modelo LLaMA en casa, necesitará una computadora con una GPU potente que pueda manejar la gran cantidad de datos y cálculos necesarios para la inferencia.
El A800 funciona al 70% de la velocidad de las GPU A100 y al mismo tiempo cumple con estrictos estándares de exportación de EE. UU. que limitan la potencia de procesamiento que Nvidia puede vender.
SAG-AFTRA se ha unido al Writer's [
sic
] Guild of America para exigir un contrato que exija explícitamente regulaciones de IA para proteger a los escritores y las obras que crean. ... El futuro de la inteligencia artificial generativa en Hollywood (y cómo se puede utilizar para reemplazar la mano de obra) se ha convertido en un punto crucial para los actores que se declaran en huelga. En una conferencia de prensa el jueves, Fran Drescher, presidente del Screen Actors Guild-American Federation of Television and Radio Artists (más comúnmente conocido como SAG-AFTRA), declaró que "la inteligencia artificial plantea una amenaza existencial para las profesiones creativas y para todos los actores y Los artistas intérpretes o ejecutantes merecen un lenguaje contractual que los proteja de la explotación de su identidad y talento sin consentimiento ni remuneración.'