Detección de contenido mediante inteligencia artificial

El software de detección de inteligencia artificial tiene como objetivo determinar si algún contenido (texto, imagen, vídeo o audio) se generó mediante inteligencia artificial (IA).

Sin embargo, la confiabilidad de dicho software es un tema de debate ^[1] y existen preocupaciones sobre la posible aplicación incorrecta del software de detección de IA por parte de los educadores.

Problemas de precisión

Se ha demostrado que varias herramientas de detección de IA no son fiables en términos de detección precisa y exhaustiva del texto generado por IA. En un estudio realizado por Weber-Wulff et al., y publicado en 2023, los investigadores evaluaron 14 herramientas de detección, incluidas Turnitin y GPT Zero , y descubrieron que "todas obtuvieron una puntuación inferior al 80 % de precisión y solo 5 superaron el 70 %". ^[2]

Detección de texto

En el caso de los textos, esto se suele hacer para evitar un supuesto plagio , a menudo detectando la repetición de palabras como signos reveladores de que un texto fue generado por IA (incluidas las alucinaciones de IA ). A menudo, los profesores los utilizan para calificar a sus alumnos, normalmente de forma ad hoc . Tras el lanzamiento de ChatGPT y un software de generación de texto con IA similar, muchos establecimientos educativos han emitido políticas contra el uso de IA por parte de los estudiantes. ^[3] El software de detección de texto con IA también lo utilizan quienes evalúan a los solicitantes de empleo, así como los motores de búsqueda en línea . ^[4]

Los detectores actuales a veces pueden ser poco fiables y han marcado incorrectamente el trabajo de humanos como originado por IA ^[5]^[6]^[7] mientras que no han podido detectar el trabajo generado por IA en otros casos. ^[8] MIT Technology Review dijo que la tecnología "tuvo dificultades para detectar el texto generado por ChatGPT que había sido ligeramente reorganizado por humanos y ofuscado por una herramienta de paráfrasis". ^[9] También se ha demostrado que el software de detección de texto de IA discrimina a los hablantes no nativos de inglés. ^[4]

Dos estudiantes de la Universidad de California, Davis , casi se enfrentaron a la expulsión después de que sus profesores escanearan sus ensayos con una herramienta de detección de texto llamada Turnitin , que marcó los ensayos como generados por IA. Sin embargo, tras la cobertura de los medios de comunicación ^[10] y una investigación exhaustiva, los estudiantes fueron absueltos de cualquier irregularidad. ^[11]^[12]

En abril de 2023, la Universidad de Cambridge y otros miembros del Grupo Russell de universidades del Reino Unido decidieron abandonar la herramienta de detección de texto con inteligencia artificial de Turnitin, tras expresar su preocupación por su falta de fiabilidad. ^[13] La Universidad de Texas en Austin decidió abandonar el sistema seis meses después. ^[14]

En mayo de 2023, un profesor de la Universidad Texas A&M–Commerce utilizó ChatGPT para detectar si el contenido de sus estudiantes había sido escrito con este software, lo que según ChatGPT era el caso. Por ello, amenazó con suspender la asignatura a pesar de que ChatGPT no podía detectar la escritura generada por IA. ^[15] Ningún estudiante se vio impedido de graduarse debido a este problema, y todos los estudiantes, excepto uno (que admitió haber utilizado el software), fueron exonerados de las acusaciones de haber utilizado ChatGPT en su contenido. ^[16]

En mayo de 2024, los estudiantes de la Universidad de Pensilvania publicaron RAID, un punto de referencia para evaluar los detectores de texto de IA. ^[17] RAID incluye más de 6 millones de generaciones en 11 modelos y 11 ataques adversarios, lo que revela que los detectores actuales tienen dificultades con las estrategias adversarias y los modelos invisibles. Según la tabla de clasificación del punto de referencia RAID, Desklib AI Detector, con una puntuación de precisión del 92,4 %, ocupa el primer puesto.

Un artículo de Thomas Germain, publicado en Gizmodo en junio de 2024, informó sobre pérdidas de empleo entre escritores y periodistas independientes debido a que el software de detección de texto con IA clasificó erróneamente su trabajo como generado por IA. ^[18]

Detección anti-texto

Hay software disponible diseñado para evitar la detección de texto por IA. ^[19]

Un estudio publicado en agosto de 2023 analizó 20 resúmenes de artículos publicados en el Eye Journal , que luego fueron parafraseados utilizando GPT-4.0 . Los resúmenes parafraseados por IA se examinaron en busca de plagio utilizando QueText y en busca de contenido generado por IA utilizando Originality.AI. Luego, los textos se reprocesaron a través de un software adversarial llamado Undetectable.ai para reducir los puntajes de detección de IA. El estudio descubrió que la herramienta de detección de IA, Originality.AI, identificó el texto generado por GPT-4 con una precisión media del 91,3%. Sin embargo, después del reprocesamiento por Undetectable.ai, la precisión de detección de Originality.ai se redujo a una precisión media del 27,8%. ^[20]^[21]

Algunos expertos también creen que técnicas como la marca de agua digital son ineficaces porque pueden eliminarse o añadirse para generar falsos positivos. ^[22]

Detección de texto multilingüe

Una de las deficiencias de la mayoría de los programas de detección de contenido con IA es su incapacidad para identificar texto generado por IA en cualquier idioma. Los modelos de lenguaje grandes (LLM) como ChatGPT, Claude y Gemini pueden escribir en diferentes idiomas, pero las herramientas de detección de texto con IA tradicionales se han entrenado principalmente en inglés y algunos otros idiomas ampliamente hablados, como el francés y el español. Son menos las soluciones de detección con IA que pueden detectar texto generado por IA en idiomas como el farsi, el árabe o el hindi. ^{[ cita requerida ]}

Detección de imágenes, vídeos y audio

Existen varios programas de detección de imágenes con inteligencia artificial que se supone que detectan imágenes generadas por IA (por ejemplo, las que se originan en Midjourney o DALL-E ), pero no son completamente confiables. ^[23]^[24]

Otros afirman identificar deepfakes de vídeo y audio , pero esta tecnología tampoco es totalmente confiable todavía. ^[25]

A pesar del debate sobre la eficacia de las marcas de agua, Google DeepMind está desarrollando activamente un software de detección llamado SynthID, que funciona insertando una marca de agua digital que es invisible para el ojo humano en los píxeles de una imagen. ^[26]^[27]

Véase también

Referencias

^ "'No utilices detectores de IA para nada importante', dice la autora del blog definitivo 'AI Weirdness'. Su propio libro no pasó la prueba". Fortune . Consultado el 21 de octubre de 2023 .
^ Weber-Wulff, Débora; Anohina-Naumeca, Alla; Bjelobaba, Sonja; Foltýnek, Tomáš; Guerrero-Dib, Jean; Popoola, Olumida; Sigut, Petr; Waddington, Lorna (25 de diciembre de 2023). "Prueba de herramientas de detección de texto generado por IA". Revista Internacional para la Integridad Educativa . 19 (1): 26. arXiv : 2306.15666 . doi :10.1007/s40979-023-00146-z. ISSN 1833-2595.
^ Hern, Alex (31 de diciembre de 2022). "¿Plagio asistido por IA? El bot ChatGPT dice que tiene una respuesta para eso". The Guardian . Consultado el 11 de julio de 2023 .
^ ab Sample, Ian (10 de julio de 2023). «Los programas para detectar la IA discriminan a los hablantes no nativos de inglés, según muestra un estudio». The Guardian . Consultado el 10 de julio de 2023 .
^ Fowler, Geoffrey A. (2 de junio de 2023). «Detectar la IA puede ser imposible. Ese es un gran problema para los profesores». The Washington Post . Consultado el 10 de julio de 2023 .
^ Tangermann, Victor (9 de enero de 2023). «Hay un problema con esa aplicación que detecta texto escrito en GPT: no es muy precisa». Futurismo . Consultado el 10 de julio de 2023 .
^ "Probamos un nuevo detector ChatGPT para profesores. Detectó a un estudiante inocente". The Washington Post . 1 de abril de 2023 . Consultado el 10 de julio de 2023 .
^ Taylor, Josh (1 de febrero de 2023). «OpenAI, el creador de ChatGPT, lanza una herramienta «no totalmente fiable» para detectar contenido generado por IA». The Guardian . Consultado el 11 de julio de 2023 .
^ Williams, Rhiannon (7 de julio de 2023). «Las herramientas de detección de texto basadas en inteligencia artificial son muy fáciles de engañar». MIT Technology Review . Consultado el 10 de julio de 2023 .
^ "Las aplicaciones de detección de inteligencia artificial siguen acusando falsamente a los estudiantes de hacer trampa". Futurismo . 6 de junio de 2023 . Consultado el 21 de octubre de 2023 .
^ Jiménez, Kayla. "Los profesores están usando herramientas de detección de ChatGPT para acusar a los estudiantes de hacer trampa. Pero ¿qué pasa si el software está equivocado?". USA TODAY . Consultado el 21 de octubre de 2023 .
^ Klee, Miles (6 de junio de 2023). "La acusaron falsamente de hacer trampa con inteligencia artificial... y no será la última". Rolling Stone . Consultado el 21 de octubre de 2023 .
^ Staton, Bethan (3 de abril de 2023). "Las universidades expresan dudas sobre la herramienta para detectar el plagio impulsado por IA". Financial Times . Consultado el 10 de julio de 2023 .
^ Carter, Tom. "Algunas universidades están abandonando el software de detección de inteligencia artificial en medio de temores de que los estudiantes puedan ser acusados falsamente de hacer trampa mediante el uso de ChatGPT". Business Insider . Consultado el 21 de octubre de 2023 .
^ Verma, Prashnu (18 de mayo de 2023). "Un profesor acusó a su clase de usar ChatGPT, poniendo en peligro los diplomas". The Washington Post . Consultado el 10 de julio de 2023 .
^ "Instructor universitario criticado por acusar a estudiantes de usar ChatGPT". NBC News . 18 de mayo de 2023 . Consultado el 10 de julio de 2023 .
^ Dugan, Liam; Hwang, Alyssa; Trhlik, Filip; Ludan, Josh Magnus; Zhu, Andrew; Xu, Hainiu; Ippolito, Daphne; Callison-Burch, Chris (10 de junio de 2024), RAID: un punto de referencia compartido para la evaluación robusta de detectores de texto generados por máquina, doi : 10.48550/arXiv.2405.07940 , consultado el 17 de octubre de 2024
^ Germain, Thomas (12 de junio de 2024). "Los detectores de IA se equivocan. De todos modos, los escritores están siendo despedidos". Gizmodo . Consultado el 18 de junio de 2024 .
^ Beam, Christopher. "La carrera armamentista de detección de inteligencia artificial ha comenzado y los estudiantes universitarios están construyendo las armas". Wired . ISSN 1059-1028 . Consultado el 2 de diciembre de 2023 .
^ Taloni, Andrea; Scorcia, Vincenzo; Giannaccare, Giuseppe (2 de agosto de 2023). "Amenazas modernas en el ámbito académico: evaluación de los puntajes de detección de plagio e inteligencia artificial de ChatGPT" . Eye . 38 (2): 397–400. doi :10.1038/s41433-023-02678-7. ISSN 1476-5454. PMC 10810838. PMID 37532832.
^ Thompson, David (30 de noviembre de 2023). "Los investigadores dicen que la IA indetectable puede ser una 'amenaza moderna para el mundo académico'". The Science Times .
^ Knibbs, Kate. "Investigadores probaron marcas de agua de IA y las rompieron todas". Wired . ISSN 1059-1028 . Consultado el 21 de octubre de 2023 .
^ Thompson, Stuart A.; Hsu, Tiffany (28 de junio de 2023). "¿Qué tan fácil es engañar a las herramientas de detección de IA?". The New York Times . Consultado el 10 de julio de 2023 .
^ Rizwan, Choudhury (15 de octubre de 2023). "Experto desmiente la afirmación de una herramienta de inteligencia artificial de que la foto de Israel es falsa". Interesting Engineering . Consultado el 22 de octubre de 2023 .
^ Hsu, Tiffany; Myers, Steven Lee (18 de mayo de 2023). "Otra cara del auge de la IA: detectar lo que la IA produce". The New York Times . Consultado el 10 de julio de 2023 .
^ Pierce, David (29 de agosto de 2023). "Google creó una marca de agua para las imágenes de IA que no se puede editar". The Verge . Consultado el 21 de octubre de 2023 .
^ Wiggers, Kyle (29 de agosto de 2023). "DeepMind se asocia con Google Cloud para marcar con agua las imágenes generadas por IA". TechCrunch . Consultado el 21 de octubre de 2023 .