stringtranslate.com

Estilometría adversaria

La estilometría adversaria es la práctica de alterar el estilo de escritura para reducir el potencial de la estilometría para descubrir la identidad del autor o sus características. Esta tarea también se conoce como ofuscación de autoría o anonimización de autoría . La estilometría plantea un importante desafío a la privacidad en su capacidad para desenmascarar a autores anónimos o vincular seudónimos a otras identidades de un autor, lo que, por ejemplo, crea dificultades para denunciantes , activistas y estafadores y estafadores . Se espera que el riesgo para la privacidad crezca a medida que se desarrollen las técnicas de aprendizaje automático y los corpus de texto .

Toda estilometría contradictoria comparte la idea central de parafrasear fielmente el texto fuente de modo que el significado no cambie pero las señales estilísticas queden oscurecidas. Una paráfrasis tan fiel es un ejemplo contradictorio para un clasificador estilométrico. Existen varios enfoques amplios al respecto, con cierta superposición: imitación , sustituir el estilo del propio autor por el de otro; traducción , aplicando la traducción automática con la esperanza de que esto elimine el estilo característico en el texto fuente; y ofuscación , modificar deliberadamente el estilo de un texto para que no se parezca al del autor.

Es posible oscurecer el estilo manualmente, pero es laborioso; en algunas circunstancias, es preferible o necesario. Las herramientas automatizadas, ya sean semiautomáticas o totalmente automáticas, podrían ayudar a un autor. La mejor forma de realizar la tarea y el diseño de dichas herramientas es una cuestión de investigación abierta. Si bien se ha demostrado que algunos enfoques pueden frustrar determinados análisis estilométricos, en particular aquellos que no tienen en cuenta el potencial de confrontación, establecer la seguridad frente a análisis desconocidos es un problema. Garantizar la fidelidad de la paráfrasis es un desafío crítico para las herramientas automatizadas.

No está claro si la práctica de la estilometría adversaria es detectable en sí misma. Algunos estudios han encontrado que métodos particulares produjeron señales en el texto de salida, pero un estilometrista que no está seguro de qué métodos se pudieron haber utilizado puede no ser capaz de detectarlas de manera confiable.

Historia

Rao y Rohatgi (2000), un trabajo inicial sobre estilometría adversarial, [1] identificaron la traducción automática como una posibilidad, pero señalaron que la calidad de los traductores disponibles en ese momento presentaba graves desafíos. [2] Kacmarcik & Gamon (2006) es otro de sus primeros trabajos. Brennan, Afroz y Greenstadt (2012) realizaron la primera evaluación de métodos estilométricos contradictorios en textos reales. [1]

Brennan y Greenstadt (2009) introdujeron el primer corpus de textos escritos por autores contradictorios específicamente para evaluar métodos estilométricos; [3] otros corpus incluyen el Concurso Internacional de Imitación de Hemingway , el concurso Faux Faulkner y el blog engañoso A Gay Girl in Damascus . [4]

Motivaciones

Rao y Rohatgi (2000) sugieren que los documentos breves y no atribuidos (es decir, publicaciones anónimas ) no corren riesgo de identificación estilométrica, pero los autores seudónimos que no han practicado la estilometría adversativa al producir corpus de miles de palabras pueden ser vulnerables. [5] Narayanan et al. (2012) intentaron desanonimizar a gran escala a 100.000 autores de blogs con resultados mixtos: las identificaciones fueron significativamente mejores que el azar, pero solo coincidieron con precisión entre el blog y el autor una quinta parte de las veces; [6] la identificación mejoró con el número de publicaciones escritas por el autor en el corpus. [7] Incluso si un autor no está identificado, algunas de sus características aún pueden deducirse estilométricamente, [8] o la estilometría puede reducir el anonimato del conjunto de autores potenciales lo suficiente como para que otra información complete la identificación. [7] Detectar las características del autor (por ejemplo, género o edad) es a menudo más sencillo que identificar a un autor entre un conjunto grande y posiblemente abierto de candidatos. [9]

Las técnicas modernas de aprendizaje automático ofrecen poderosas herramientas de identificación; [10] Es probable que un mayor desarrollo de corpus y técnicas estilométricas computacionales plantee más problemas de privacidad. [11] Gröndahl y Asokan (2020a) dicen que la validez general de la hipótesis subyacente a la estilometría (que los autores tienen 'huellas dactilares de estilo' invariantes e independientes del contenido) es incierta, pero "el ataque de desanonimización es una verdadera preocupación por la privacidad". [12]

Entre los interesados ​​en practicar la estilometría adversaria y el engaño estilístico se encuentran los denunciantes que evitan las represalias; [13] periodistas y activistas; [10] autores de fraudes y engaños ; [14] autores de reseñas falsas ; [15] falsificadores literarios ; [16] delincuentes que ocultan su identidad a los investigadores; [17] y, en general, cualquier persona con deseo de anonimato o seudónimo. [13] Los autores, o agentes que actúan en nombre de los autores, también pueden intentar eliminar pistas estilísticas de las características del autor (por ejemplo, raza o género) de modo que el conocimiento de esas características no pueda usarse para discriminar (por ejemplo, mediante sesgos algorítmicos ). [18] [19] Otro posible uso de la estilometría adversaria es disfrazar el texto generado automáticamente como escrito por humanos. [20]

Métodos

Con la imitación, el autor intenta engañar a la estilometría haciendo coincidir su estilo con el de otro autor. [21] Una imitación incompleta, donde algunas de las características únicas del verdadero autor aparecen junto con las del autor imitado, puede ser una señal detectable para el uso de la estilometría adversaria. [22] La imitación se puede realizar automáticamente con sistemas de transferencia de estilo , aunque esto normalmente requiere un gran corpus en el estilo objetivo para que el sistema aprenda. [23]

Otro enfoque es la traducción, que emplea la traducción automática de un texto fuente para eliminar el estilo característico, a menudo a través de varios traductores en secuencia para producir una traducción de ida y vuelta . Esta traducción encadenada puede llevar a que los textos se modifiquen significativamente, incluso hasta el punto de hacerlos incomprensibles; Las herramientas de traducción mejoradas reducen este riesgo. Los textos con una estructura más sencilla pueden ser más fáciles de traducir automáticamente sin perder el significado original. [21] La traducción automática se desdibuja en una imitación estilística directa u ofuscación lograda a través de la transferencia de estilo automatizada, que puede verse como una "traducción" con el mismo idioma como entrada y salida. [24] [25] Con herramientas de traducción de baja calidad, se puede exigir a un autor que corrija manualmente errores de traducción importantes evitando al mismo tiempo el riesgo de reintroducir características estilísticas. [2] Wang, Juola y Riddell (2022) descubrieron que los errores graves introducidos por Google Translate eran raros, pero más comunes con varias traducciones intermedias; sin embargo, ocasionalmente oraciones simples o cortas y errores ortográficos en el texto de origen aparecían palabra por palabra en el resultado, potencialmente proporcionando una señal de identificación. [26] La traducción en cadena puede dejar huellas características de su aplicación en un documento, lo que puede permitir la reconstrucción de los idiomas intermedios utilizados y el número de pasos de traducción realizados. [23]

La ofuscación implica cambiar deliberadamente el estilo de un texto para reducir su similitud con otros textos mediante alguna métrica; Esto se puede realizar en el momento de escribir mediante una modificación consciente, o como parte de un proceso de revisión con retroalimentación de la métrica que se utiliza como entrada para decidir cuándo el texto se ha ofuscado lo suficiente. A diferencia de la traducción, los textos complejos pueden ofrecer más oportunidades para una ofuscación efectiva sin alterar el significado [27] y, de la misma manera, los géneros con más variaciones permitidas permiten una mayor ofuscación. [28] Sin embargo, los textos más largos son más difíciles de ofuscar completamente. [29] La ofuscación puede mezclarse con la imitación si el autor desarrolla un estilo objetivo novedoso, distinto de su estilo original. [30] Con respecto al enmascaramiento de las características del autor, la ofuscación puede tener como objetivo lograr una unión (agregando señales para características imitadas) o una intersección (eliminando señales y normalizando) de los estilos de otros autores. [31] Evitar las propias idiosincrasias del autor y producir un texto "normalizado" es un paso ofuscador crítico: un autor puede tener una tendencia única a escribir mal ciertas palabras, usar variantes particulares o formatear un documento de una manera característica. [2] [32] Las señales estilométricas varían en la facilidad con la que pueden enmascararse de manera adversaria; un autor puede cambiar fácilmente su vocabulario mediante una elección consciente, pero alterar el patrón gramatical o la frecuencia de las letras en su texto puede ser más difícil de lograr, aunque Juola y Vescovi (2011) informan que la imitación generalmente logra enmascarar más características que la ofuscación. [33] La ofuscación automatizada puede requerir grandes cantidades de datos de entrenamiento escritos por el autor. [29]

En cuanto a las implementaciones automatizadas de estilometría adversaria, dos posibles implementaciones son sistemas basados ​​en reglas para parafrasear; y arquitecturas codificador-decodificador, donde el texto pasa a través de un formato intermedio que es (destinado a ser) neutral en cuanto a estilo. [34] Otra división en los métodos automatizados es si hay retroalimentación de un sistema de identificación o no. [35] Con tal retroalimentación, encontrar paráfrasis para el enmascaramiento del autor se ha caracterizado como un problema de búsqueda heurística , explorando variantes textuales hasta que el resultado es estilísticamente lo suficientemente lejano (en el caso de ofuscación) o cercano (en el caso de imitación), que luego constituye un ejemplo contradictorio para ese sistema de identificación. [36] [37]

Evaluación

Cómo enmascarar mejor las características estilométricas en la práctica y qué tareas realizar manualmente, cuáles con ayuda de herramientas y cuáles de forma totalmente automática es un campo de investigación abierto, especialmente en documentos breves con una variabilidad potencial limitada. [38] [11] La estilometría adversaria manual puede ser preferida o incluso requerida si el autor no confía la tarea a las computadoras disponibles (como puede ser el caso de un denunciante, por ejemplo). [23] Las herramientas de software requieren mantenimiento ; Wang, Juola y Riddell (2022) informan que no existe ningún software de ofuscación mantenido adecuado para uso general. [39] Zhai y otros. (2022) identifican a DS-PAN (Castro-Castro, Ortega Bueno & Muñoz 2017) y Mutant-X (Mahmood et al. 2019) como el estado del arte de 2022 en ofuscación automatizada. [40] La modulación estilística manual es un esfuerzo significativo, con propiedades de escalabilidad deficientes; La asistencia con herramientas puede reducir la carga en diversos grados. [41] Los métodos automatizados deterministas pueden perder efectividad contra un clasificador entrenado de manera adversa, donde la salida del programa de transferencia de estilo se utiliza en el conjunto de entrenamiento del clasificador. [42]

Potthast, Hagen y Stein (2016) dan tres criterios para su uso en la evaluación de métodos de estilometría adversarios: seguridad , lo que significa que las características estilísticas se eliminan de manera confiable; solidez , lo que significa que el contenido semántico del texto no se altera inaceptablemente; y sensato , lo que significa que el resultado está "bien formado y pasa desapercibido". Comprometerse demasiado profundamente suele ser un resultado inaceptable, y en la práctica los tres se compensan entre sí. [43] Potthast, Hagen y Stein (2016) encuentran que evaluar automáticamente la sensibilidad, y específicamente si la producción es aceptablemente gramatical y está bien formada, es difícil; [44] la evaluación automatizada de la solidez es algo más prometedora, pero la revisión manual es el mejor método. [45]

A pesar de que la seguridad es una propiedad importante de un método estilométrico adversario, aún puede ser útil renunciar a ella si el potencial de identificación estilométrico concedido es posible mediante un análisis no estilométrico; por ejemplo, a un autor que habla sobre su propia educación en Gran Bretaña es poco probable que le importe si La estilometría puede revelar que su texto es típico del inglés británico . [46] [47]

Evaluar la seguridad de diferentes enfoques es complicado porque la resistencia a la identificación depende fundamentalmente de los métodos de identificación considerados. [48] ​​La propiedad de ser resistente a análisis desconocidos se llama transferibilidad . [49] Gröndahl y Asokan (2020b) identifican cuatro modelos de amenazas diferentes para los autores, que varían según su conocimiento de cómo se analizará su texto y qué datos de entrenamiento se utilizarán: acceso a consultas , con el analista más débil y el autor más fuerte que conoce ambos. los métodos de análisis y los datos de entrenamiento; acceso a la arquitectura , donde el autor conoce los métodos de análisis pero no los datos de entrenamiento; acceso a datos , donde el autor conoce los datos de entrenamiento pero no los métodos de análisis; y acceso sustituto , con el autor más débil y el analista más fuerte, donde el autor no conoce los métodos de análisis ni los datos de entrenamiento. [34] Además, cuando un autor elige un método, debe confiar en su modelo de amenaza y confiar en que es válido y que los análisis desconocidos capaces de detectar señales estilísticas restantes no se pueden realizar o no se realizarán, o que el enmascaramiento se transfiere con éxito; [50] Sin embargo, un estilometrista con conocimiento de cómo el autor intentó enmascarar su estilo puede explotar alguna debilidad en el método y hacerlo inseguro. [51] Gran parte de la investigación sobre métodos automatizados ha asumido que el autor tiene acceso a consultas, lo que puede no generalizarse a otras configuraciones. [52] Los métodos de enmascaramiento que utilizan internamente un conjunto de diferentes análisis como modelo para su adversario pueden transferirse mejor frente a análisis invisibles. [35]

Una pérdida total de solidez frustra el propósito de la comunicación, aunque cierto grado de cambio de significado puede ser tolerable si se preserva el mensaje central; requerir únicamente vinculación textual o permitir el resumen automático son otras opciones para perder algo de significado de una manera posiblemente tolerable. [53] Reescribir un texto de entrada para derrotar la estilometría, en lugar de eliminar conscientemente características estilísticas durante la composición, plantea desafíos para retener el significado textual. [54] Gröndahl y Asokan (2020a) evalúan el problema de la falta de solidez como "el desafío más importante" para la investigación de enfoques totalmente automáticos. [11]

Para la sensibilidad, si un texto es tan agramatical que resulta incomprensible o está tan mal formado que no puede encajar en su género, entonces el método ha fracasado, pero los compromisos que no lleguen a ese punto pueden ser útiles. [44] Si se pierde parcialmente la discreción, entonces existe la posibilidad de que se realicen análisis más costosos y menos escalables (por ejemplo, consultar a un lingüista forense) para confirmar las sospechas o reunir más pruebas. [55] El impacto de una falla total en la discreción varía dependiendo de la motivación para realizar la estilometría adversaria: para alguien que simplemente intenta permanecer en el anonimato (por ejemplo, un denunciante), la detección puede no ser un problema; para un falsificador literario, sin embargo, la detección sería desastrosa. [16] La estilometría adversaria puede dejar evidencia de su práctica, lo cual es un fracaso de discreción. [56] [57] En el corpus de Brennan-Greenstadt, se ha descubierto que los textos comparten un "estilo" común propio. [58] Sin embargo, Gröndahl y Asokan (2020a) evalúan la evidencia existente como insuficiente para demostrar que la estilometría adversa siempre es detectable, y solo se han estudiado métodos limitados. [59] Mejorar la fluidez del texto de salida puede reducir la detectabilidad de las herramientas automatizadas. [60] La detectabilidad general de la autoría contradictoria no se ha estudiado a fondo; si el estilometrista desconoce los métodos disponibles para ser utilizados por el autor, puede resultar imposible. [11]

Los problemas de identificación y verificación de autores en un entorno adversario son muy diferentes de reconocer a autores ingenuos o cooperativos. [61] Juola y Vescovi (2011) describen los intentos deliberados de enmascarar la autoría como un "problema para el estado actual del arte estilométrico", [62] y Brennan, Afroz y Greenstadt (2012) afirman que, a pesar del alto rendimiento de la estilometría en Al identificar autores no contradictorios, la aplicación manual de métodos contradictorios lo hace poco confiable. [63]

Kacmarcik y Gamon (2006) observan que los modelos estilométricos de bajas dimensiones que operan con un pequeño número de características son menos resistentes a la estilometría adversa. [64] Las investigaciones han encontrado que los autores varían en qué tan bien son capaces de modular su estilo, y algunos pueden realizar la tarea con éxito incluso sin capacitación. [39] Wang, Juola y Riddell (2022), una replicación y reproducción de Brennan, Afroz y Greenstadt (2012), descubrieron que los tres (imitación, traducción y ofuscación) reducían significativamente la efectividad de la atribución de autoría, siendo la ofuscación manual algo mayor. eficaz que la imitación o traducción manual, que funcionan de manera similar entre sí; el estudio original encontró que la imitación era superior. [65] Potthast, Hagen y Stein (2016) informaron que incluso los métodos automatizados simples de estilometría adversaria causaron grandes dificultades para los sistemas de identificación de autoría de última generación, aunque a un costo significativo de solidez y sensibilidad. [66] Los sistemas de identificación con reconocimiento de adversarios pueden funcionar mucho mejor contra la estilometría adversaria siempre que sepan qué posibles métodos de ofuscación se utilizaron, incluso si el identificador comete errores al analizar qué método de anonimización se utilizó. [67]

Ver también

Referencias

  1. ^ ab Brennan, Afroz y Greenstadt 2012, pág. 3-4.
  2. ^ abc Kacmarcik y Gamon 2006, pág. 445.
  3. ^ Juola y Vescovi 2011, pag. 117.
  4. ^ Afroz, Brennan y Greenstadt 2012, pág. 466.
  5. ^ Rao y Rohatgi 2000, 1.3 Contribuciones.
  6. ^ Gröndahl y Asokan 2020a, pag. 19.
  7. ^ ab Narayanan et al. 2012, pág. 301.
  8. ^ Emmery, Kádár y Chrupała 2021, p. 2388.
  9. ^ Shetty, Schiele y Fritz 2018, 1 Introducción.
  10. ^ ab Mahmood y col. 2019, pág. 54.
  11. ^ abcd Gröndahl y Asokan 2020a, pag. 28.
  12. ^ Gröndahl y Asokan 2020a, pag. 3.
  13. ^ ab Kacmarcik y Gamon 2006, pág. 444.
  14. ^ Afroz, Brennan y Greenstadt 2012, pág. 461.
  15. ^ Gröndahl y Asokan 2020a, pag. 4.
  16. ^ ab Potthast, Hagen y Stein 2016, pág. 5.
  17. ^ Juola y Vescovi 2011, pag. 115.
  18. ^ Xu y col. 2019, pág. 247.
  19. ^ Mireshghallah y Berg-Kirkpatrick 2021, p. 2009.
  20. ^ Uchendu, Le y Lee 2022, pág. 1.
  21. ^ ab Neal y col. 2018, pág. 6.
  22. ^ Kacmarcik y Gamon 2006, pág. 446.
  23. ^ abc Wang, Juola y Riddell 2022, p. 2.
  24. ^ Adelani y col. 2021, pág. 8687.
  25. ^ Wang, Juola y Riddell 2022, pag. 8.
  26. ^ Neal y col. 2018, pág. 6-7.
  27. ^ Neal y col. 2018, pág. 26.
  28. ^ ab Mahmood y col. 2019, pág. 55.
  29. ^ Afroz, Brennan y Greenstadt 2012, pág. 471.
  30. ^ Mireshghallah y Berg-Kirkpatrick 2021, p. 2009-2010.
  31. ^ Rao y Rohatgi 2000, 5 direcciones futuras.
  32. ^ Juola y Vescovi 2011, pag. 121-123.
  33. ^ ab Gröndahl y Asokan 2020b, pág. 177.
  34. ^ ab Haroon y col. 2021, pág. 1.
  35. ^ Bevendorff y col. 2019, pág. 1098.
  36. ^ Saedi y Dras 2020, pag. 181.
  37. ^ Neal y col. 2018, pág. 27.
  38. ^ ab Wang, Juola y Riddell 2022, p. 3.
  39. ^ Zhai y col. 2022, pág. 7374.
  40. ^ Gröndahl y Asokan 2020a, pag. 21-22.
  41. ^ Gröndahl y Asokan 2020b, pág. 176.
  42. ^ Potthast, Hagen y Stein 2016, pág. 6.
  43. ^ ab Potthast, Hagen y Stein 2016, pág. 12-13.
  44. ^ Potthast, Hagen y Stein 2016, pág. 11.
  45. ^ Almishari, Oguz y Tsudik 2014, pág. 6.
  46. ^ Xu y col. 2019, pág. 247-248.
  47. ^ Kacmarcik y Gamon 2006, pág. 448.
  48. ^ Haroon y otros. 2021, pág. 3.
  49. ^ Emmery, Kádár y Chrupała 2021, p. 2388-2389.
  50. ^ Potthast, Hagen y Stein 2016, pág. 9-10.
  51. ^ Gröndahl y Asokan 2020b, pág. 189.
  52. ^ Potthast, Hagen y Stein 2016, pág. 11-12.
  53. ^ McDonald y col. 2012, 7.1 Trabajo adicional.
  54. ^ Potthast, Hagen y Stein 2016, pág. 13.
  55. ^ Mahmood, Shafiq y Srinivasan 2020, pag. 2235.
  56. ^ Afroz, Brennan y Greenstadt 2012, pág. 462.
  57. ^ Juola 2012, pag. 93-94.
  58. ^ Gröndahl y Asokan 2020a, pag. 2.
  59. ^ Mahmood, Shafiq y Srinivasan 2020, pag. 2243.
  60. ^ Afroz, Brennan y Greenstadt 2012, pág. 464.
  61. ^ Juola y Vescovi 2011, pag. 123.
  62. ^ Brennan, Afroz y Greenstadt 2012, pág. 2.
  63. ^ Kacmarcik y Gamon 2006, pág. 451.
  64. ^ Wang, Juola y Riddell 2022, pag. 7-8.
  65. ^ Potthast, Hagen y Stein 2016, pág. 21.
  66. ^ Zhai y col. 2022, pág. 7373.

Bibliografía