Estudio del estilo de escritura
La estilometría es la aplicación del estudio del estilo lingüístico , generalmente al lenguaje escrito. [1] También se ha aplicado con éxito a la música, [2] la pintura, [3] y el ajedrez. [4]
La estilometría se utiliza a menudo para atribuir la autoría a documentos anónimos o disputados. [5] Tiene aplicaciones tanto legales como académicas y literarias, que van desde la cuestión de la autoría de las obras de Shakespeare hasta la lingüística forense y tiene similitudes metodológicas con el análisis de la legibilidad del texto .
La estilometría puede utilizarse para desenmascarar autores seudónimos o anónimos, o para revelar alguna información sobre el autor sin llegar a una identificación completa. Los autores pueden utilizar la estilometría adversarial para resistir esta identificación eliminando sus propias características estilísticas sin cambiar el contenido significativo de sus comunicaciones. Puede frustrar los análisis que no tienen en cuenta su posibilidad, pero la eficacia final de la estilometría en un entorno adversarial es incierta: la identificación estilométrica puede no ser fiable, pero tampoco se puede garantizar la no identificación; la práctica de la estilometría adversarial en sí misma puede ser detectable.
Historia
La estilometría surgió de técnicas anteriores de análisis de textos en busca de evidencia de autenticidad, identidad del autor y otras cuestiones.
La práctica moderna de la disciplina recibió publicidad a partir del estudio de los problemas de autoría en el drama renacentista inglés. Los investigadores y lectores observaron que algunos dramaturgos de la época tenían patrones distintivos de preferencias lingüísticas e intentaron usar esos patrones para identificar a los autores de obras inciertas o colaborativas. Los primeros esfuerzos no siempre tuvieron éxito: en 1901, un investigador intentó usar la preferencia de John Fletcher por " 'em", la forma contraída de "them", como un marcador para distinguir entre Fletcher y Philip Massinger en sus colaboraciones, pero empleó erróneamente una edición de las obras de Massinger en la que el editor había ampliado todas las instancias de " 'em" a "them". [6]
Los principios básicos de la estilometría fueron establecidos por el filósofo polaco Wincenty Lutosławski en Principes de stylométrie (1890). Lutosławski utilizó este método para desarrollar una cronología de los Diálogos de Platón . [7]
El desarrollo de las computadoras y su capacidad para analizar grandes cantidades de datos mejoró este tipo de esfuerzos en órdenes de magnitud. Sin embargo, la gran capacidad de las computadoras para el análisis de datos no garantizó una buena calidad de los resultados. A principios de la década de 1960, el reverendo AQ Morton realizó un análisis informático de las catorce epístolas del Nuevo Testamento atribuidas a San Pablo, que indicó que seis autores diferentes habían escrito ese conjunto de obras. Una comprobación de su método, aplicada a las obras de James Joyce , dio el resultado de que Ulises , la novela multiperspectiva y multiestilo de Joyce, fue compuesta por cinco individuos separados, ninguno de los cuales aparentemente tuvo parte en la elaboración de la primera novela de Joyce, Retrato del artista adolescente . [8]
Sin embargo, con el tiempo y la práctica, los investigadores y académicos han perfeccionado sus métodos para obtener mejores resultados. Un éxito notable en los primeros tiempos fue la resolución de la disputa sobre la autoría de doce de los Documentos Federalistas de Frederick Mosteller y David Wallace. [9]
Si bien todavía hay dudas sobre los supuestos y métodos iniciales (y tal vez siempre las habrá), pocos cuestionan ahora la premisa básica de que el análisis lingüístico de textos escritos puede producir información y conocimientos valiosos. (De hecho, esto era evidente incluso antes de la llegada de las computadoras: la aplicación exitosa de un análisis textual/lingüístico al canon de Fletcher por parte de Cyrus Hoy y otros produjo resultados claros a fines de la década de 1950 y principios de la de 1960).
Aplicaciones
Las aplicaciones de la estilometría incluyen estudios literarios, estudios históricos, estudios sociales, recuperación de información y muchos casos y estudios forenses. [10] [11] Recientemente, los debates de larga data sobre las sagas islandesas medievales anónimas han avanzado gracias a su utilización. [12] [13] [14] También se puede aplicar al código informático [15] y a la detección de plagio intrínseco , que consiste en detectar el plagio basándose en los cambios de estilo de escritura dentro del documento. [16] La estilometría también se puede utilizar para predecir si alguien es un hablante nativo o no nativo de inglés por su velocidad de mecanografía . [17]
La estilometría como método es vulnerable a la distorsión del texto durante la revisión. [18] También existe el caso del autor que adopta diferentes estilos a lo largo de su carrera, como se demostró en el caso de Platón , quien eligió diferentes políticas estilísticas como las adoptadas para los diálogos tempranos y medios que abordan el problema socrático. [19]
Características
Las características textuales de interés para la atribución de autoría son, por un lado, el cálculo de las ocurrencias de expresiones o construcciones idiosincrásicas (por ejemplo, comprobar cómo utiliza el autor la interpuntuación o con qué frecuencia utiliza construcciones pasivas sin agente) y, por otro lado, son similares a las utilizadas para el análisis de legibilidad, como las medidas de variación léxica y variación sintáctica. [20]
Dado que los autores a menudo tienen preferencias por ciertos temas, los experimentos de investigación en atribución de autoría eliminan principalmente palabras de contenido como sustantivos, adjetivos y verbos del conjunto de características, y solo conservan los elementos estructurales del texto para evitar sobreajustar sus modelos al tema en lugar de a las características del autor. [21] [22]
Las características estilísticas a menudo se calculan como promedios sobre un texto o sobre todas las obras recopiladas de un autor, lo que produce medidas como la longitud promedio de las palabras o la longitud promedio de las oraciones. Esto permite que un modelo identifique a los autores que tienen una clara preferencia por oraciones con muchas palabras o concisas, pero oculta la variación: un autor con una mezcla de oraciones largas y cortas tendrá el mismo promedio que un autor con oraciones consistentes de longitud media. Para capturar dicha variación, algunos experimentos utilizan secuencias o patrones sobre observaciones en lugar de frecuencias promedio observadas, notando, por ejemplo, que un autor muestra una preferencia por un cierto patrón de énfasis o estrés, [23] [24]
o que un autor tiende a seguir una secuencia de oraciones largas con una corta. [25] [26]
Uno de los primeros enfoques para la identificación de autoría, realizado por Mendenhall, puede decirse que consiste en agregar sus observaciones sin promediarlas. [27]
Los modelos de atribución de autoría más recientes utilizan modelos de espacio vectorial para capturar automáticamente lo que es específico del estilo de un autor, pero también se basan en una ingeniería de características juiciosa por las mismas razones que los modelos más tradicionales. [28] [29]
Estilometría adversarial
La estilometría adversarial es la práctica de alterar el estilo de escritura para reducir la posibilidad de que la estilometría descubra la identidad del autor o sus características. Esta tarea también se conoce como ofuscación de autoría o anonimización de autoría. La estilometría plantea un desafío significativo para la privacidad en su capacidad de desenmascarar autores anónimos o vincular seudónimos a otras identidades de un autor, lo que, por ejemplo, crea dificultades para denunciantes , activistas, y falsificadores y defraudadores . Se espera que el riesgo para la privacidad aumente a medida que se desarrollen las técnicas de aprendizaje automático y los corpus de texto .
Toda estilometría adversarial comparte la idea central de parafrasear fielmente el texto fuente de modo que el significado no cambie pero las señales estilísticas se oscurezcan. Una paráfrasis tan fiel es un ejemplo adversarial de un clasificador estilométrico. Existen varios enfoques generales para esto, con cierta superposición: imitación , sustituir el estilo propio del autor por el de otro; traducción , aplicar traducción automática con la esperanza de que esto elimine el estilo característico en el texto fuente; y ofuscación , modificar deliberadamente el estilo de un texto para que no se parezca al del propio autor.
Es posible ocultar el estilo manualmente, pero es laborioso; en algunas circunstancias, es preferible o necesario. Las herramientas automatizadas, ya sean semiautomáticas o totalmente automáticas, podrían ayudar a un autor. La mejor manera de realizar la tarea y el diseño de dichas herramientas es una pregunta de investigación abierta. Si bien se ha demostrado que algunos enfoques pueden derrotar análisis estilométricos particulares, particularmente aquellos que no tienen en cuenta el potencial de adversarialidad, establecer la seguridad frente a análisis desconocidos es un problema. Garantizar la fidelidad de la paráfrasis es un desafío crítico para las herramientas automatizadas.
No se sabe con certeza si la práctica de la estilometría adversarial es detectable en sí misma. Algunos estudios han descubierto que determinados métodos produjeron señales en el texto de salida, pero un estilometrista que no esté seguro de qué métodos se pudieron haber utilizado puede no ser capaz de detectarlos de manera fiable.
Investigación actual
La estilometría moderna utiliza computadoras para el análisis estadístico , inteligencia artificial y acceso al creciente corpus de textos disponibles a través de Internet . [45] Los sistemas de software como Signature [46] (software gratuito producido por Peter Millican de la Universidad de Oxford), JGAAP [47] (el Programa de Atribución de Autoría Gráfica de Java, software gratuito producido por el Dr. Patrick Juola de la Universidad Duquesne), stylo [48] [49] (un paquete R de código abierto para una variedad de análisis estilométricos, incluida la atribución de autoría, desarrollado por Maciej Eder, Jan Rybicki y Mike Kestemont) y Stylene [50] para holandés (software gratuito en línea del Prof. Walter Daelemans de la Universidad de Amberes y la Dra. Véronique Hoste de la Universidad de Gante) hacen que su uso sea cada vez más práctico, incluso para los no expertos.
Espacios y eventos académicos
Los métodos estilométricos se utilizan para varios temas académicos, como una aplicación de la lingüística, la lexicografía o el estudio literario, [1] en conjunto con el procesamiento del lenguaje natural y el aprendizaje automático, y se aplican a la detección de plagio, el análisis de autoría o la recuperación de información. [45]
Lingüística forense
La Asociación Internacional de Lingüistas Forenses (IAFL) organiza la Conferencia Bienal de la Asociación Internacional de Lingüistas Forenses (13ª edición en 2016 en Oporto ) y publica The International Journal of Speech, Language and the Law con la estilística forense como uno de sus temas centrales.
Aaaaa
La Asociación para el Avance de la Inteligencia Artificial (AAAI) ha organizado varios eventos sobre análisis subjetivo y estilístico del texto. [51] [52] [53]
CACEROLA
Talleres PAN (originalmente, análisis de plagio, identificación de autoría y detección de casi duplicados, luego, de manera más general, taller sobre descubrimiento de plagio, autoría y mal uso de software social) organizados desde 2007 principalmente en conjunto con conferencias de acceso a la información como ACM SIGIR , FIRE y CLEF . PAN formula tareas de desafío compartidas para la detección de plagio, [54] identificación de autoría, [55] identificación de género del autor, [56] perfil del autor , [57] detección de vandalismo, [58] y otras tareas de análisis de texto relacionadas, muchas de las cuales dependen de la estilometría.
Estudios de casos de interés
- En 1439, Lorenzo Valla demostró que la Donación de Constantino era una falsificación , un argumento basado en parte en una comparación del latín con el utilizado en documentos auténticos del siglo IV.
- En 1952, el sacerdote sueco Dick Helander fue elegido obispo de Strängnäs . La campaña fue competitiva y Helander fue acusado de escribir una serie de un centenar de cartas anónimas difamatorias sobre otros candidatos al electorado del obispado de Strängnäs. Helander fue condenado primero por escribir las cartas y perdió su puesto como obispo, pero más tarde fue exonerado parcialmente. Las cartas fueron estudiadas utilizando una serie de medidas estilométricas (y también características de la máquina de escribir) y los diversos casos judiciales y exámenes posteriores, muchos contratados por el propio Helander durante los años hasta su muerte en 1978, analizaron el método estilométrico y su valor como prueba con cierto detalle. [59] [60]
- En 1975, después de que Ronald Reagan fuera gobernador de California, comenzó a ofrecer comentarios semanales en la radio, que se difundían en cientos de estaciones. Después de que sus notas personales se hicieran públicas el día de su 90 cumpleaños en 2001, un estudio utilizó métodos estiloestadísticos para determinar cuáles de esas charlas fueron escritas por él y cuáles por varios de sus asistentes. [61]
- En 1996, el análisis estilométrico del controvertido libro Colores primarios , escrito bajo seudónimo, realizado por el profesor del Vassar College Donald Foster [62] atrajo la atención de un público más amplio tras identificar correctamente al autor como Joe Klein . (Este caso se resolvió sólo después de que un análisis de escritura a mano confirmara la autoría).
- En 1996, se utilizaron métodos estilométricos para comparar el manifiesto de Unabomber con cartas escritas por uno de los sospechosos, Theodore Kaczynski , lo que resultó en la detención de Kaczynski y su posterior condena. [63]
- En abril de 2015, investigadores que utilizaron técnicas de estilometría identificaron una obra, Double Falsehood , como obra de William Shakespeare . [64] [65] Los investigadores analizaron 54 obras de Shakespeare y John Fletcher , compararon la longitud promedio de las oraciones, estudiaron el uso de palabras inusuales y cuantificaron la complejidad y la valencia psicológica de su lenguaje.
- En 2016, MacDonald P. Jackson , profesor emérito de inglés en la Universidad de Auckland , Nueva Zelanda y miembro de la Royal Society of New Zealand , que había pasado toda su carrera académica analizando la atribución de autoría, escribió un libro titulado Who Wrote "The Night Before Christmas"?: Analyzing the Clement Clarke Moore Vs. Henry Livingston Question , [66] en el que evalúa los argumentos opuestos y, por primera vez, utiliza las técnicas de atribución de autor de la estilística computacional moderna para examinar la controversia de larga data. Jackson emplea una variedad de pruebas e introduce una nueva, el análisis estadístico de fonemas; concluye que Livingston es el verdadero autor de la obra clásica.
- En 2017, Simon Fuller y James O'Sullivan publicaron un estudio que afirmaba que el autor de bestsellers James Patterson no escribe nada en sus novelas aparentemente en coautoría. [67] [68] [69] Según O'Sullivan, su colaboración con el expresidente estadounidense Bill Clinton , The President is Missing , es una excepción a esta regla. [70]
- En 2017, un grupo de lingüistas, informáticos y académicos analizaron la autoría de Elena Ferrante . Basándose en un corpus creado en la Universidad de Padua que contiene 150 novelas escritas por 40 autores, analizaron el estilo de Ferrante basándose en siete de sus novelas. Pudieron comparar su estilo de escritura con el de otros 39 novelistas utilizando, por ejemplo, el estilo. [48] La conclusión fue la misma para todos ellos: Domenico Starnone es el autor secreto de Elena Ferrante. [71]
- En 2018, Mark Glickman , profesor titular de estadística en la Universidad de Harvard, trabajó con Ryan Song, exestudiante de estadística en Harvard, y Jason Brown, profesor de la Universidad de Dalhousie en Nueva Escocia, aplicando estilometría para encontrar que, muy probablemente, la canción de The Beatles " In My Life " fue compuesta por John Lennon, pero con un 50% de posibilidades de que Paul McCartney escribiera el octavo del medio . [72] [73]
- En 2019, el proyecto ETSO: Estilometría aplicada al teatro del Siglo de Oro español, [74] dirigido por Álvaro Cuéllar González y Germán Vega García-Luengos (Universidad de Valladolid) logró reunir 3000 obras del Siglo de Oro español. Tras aplicar el análisis estilométrico, se ratificó la atribución de Mujeres y criados a Lope de Vega [75] [76] , y se detectó un problema de autoría en La monja alférez , obra atribuida a Pérez de Montalbán que, gracias a estos análisis y a través de investigaciones históricas y filológicas, fue finalmente atribuida a Juan Ruiz de Alarcón . [77] [78] [79] [80] En 2023, el mismo proyecto encontró a Lope de Vega como autor de La francesa Laura , a pesar de que el manuscrito fue escrito años después de su muerte. [81] La comedia fue clasificada como obra tardía de Lope de Vega y datada de 1628 a 1630, pues su tratamiento adulador de Francia podía atribuirse a la momentánea buena relación entre España y Francia durante la Guerra de los Treinta Años , teniendo a Inglaterra como enemigo común. [82] En este análisis se comparan las 500 palabras más frecuentes del texto investigado con las 500 del resto de obras. En el caso de La francesa Laura , el hallazgo detectó que las 100 obras con las que se aproximaba eran casi todas de Lope de Vega. También se realizaron métodos de aprendizaje automático, como el análisis de máquinas de vectores de soporte , con un gran rango de parámetros. El tradicional análisis filológico sobre la autoría de las obras ha confirmado las investigaciones de la estilometría y la inteligencia artificial. [83]
- En 2020, Rachel McCarthy y James O'Sullivan argumentaron que Emily Brontë es la verdadera autora de Cumbres borrascosas , poniendo fin a las especulaciones de algunos críticos de que la novela podría haber sido escrita por uno de sus hermanos, específicamente Branwell o Charlotte . [84]
- En 2020, Hartmut Ilsemann utilizó Rolling Delta y Rolling Classify del paquete de programas R Stylo para demostrar que el corpus de Marlowe es estilísticamente no homogéneo y que el autor de los dos Tamerlanes apenas estaba presente en el corpus oficial restante de Marlowe. [85] [86] [87]
- En 2022, los investigadores italianos Simone Rebora y Massimo Salgaro demostraron, utilizando el método de "distancia Delta" de John F. Burrows, que Felix Salten es el autor más probable de la novela anónima Josefine Mutzenbacher de 1906, excluidas las páginas finales. [88]
- En 2023, el periodista sueco Lapo Lappin afirmó que dos novelas policiales de la autora sueca Camilla Läckberg podrían ser obra de un escritor fantasma, presumiblemente su editor Pascal Engman . Esta afirmación fue negada en un primer momento por la autora y su portavoz, [89] pero más tarde Läckberg admitió que ella y Pascal Engman trabajan muy de cerca y que él edita sus textos. [90]
Datos y métodos
Dado que la estilometría tiene casos de uso descriptivos, utilizados para caracterizar el contenido de una colección, y casos de uso identificatorios, por ejemplo, identificar autores o categorías de textos, los métodos utilizados para analizar los datos y las características anteriores varían desde aquellos diseñados para clasificar elementos en conjuntos o para distribuir elementos en un espacio de variación de características. La mayoría de los métodos son de naturaleza estadística, como el análisis de conglomerados y el análisis discriminante , generalmente se basan en datos y características filológicos y son dominios de aplicación fructíferos para los métodos modernos de aprendizaje automático .
Mientras que en el pasado la estilometría enfatizaba los elementos más raros o más llamativos de un texto, las técnicas contemporáneas pueden aislar patrones de identificación incluso en partes comunes del discurso. La mayoría de los sistemas se basan en estadísticas léxicas, es decir, utilizan las frecuencias de palabras y términos en el texto para caracterizar el texto (o su autor). En este contexto, a diferencia de la recuperación de información , los patrones de ocurrencia observados de las palabras más comunes son más interesantes que los términos temáticos que son menos frecuentes. [91] [92]
El método estilométrico principal es el invariante del autor : una propiedad que comparten todos los textos, o al menos todos los textos lo suficientemente largos como para permitir un análisis que arroje resultados estadísticamente significativos, escritos por un autor determinado. Un ejemplo de invariante del autor es la frecuencia de las palabras funcionales utilizadas por el autor.
En uno de estos métodos, se analiza el texto para encontrar las 50 palabras más comunes. Luego, el texto se divide en fragmentos de 5000 palabras y cada uno de los fragmentos se analiza para encontrar la frecuencia de esas 50 palabras en ese fragmento. Esto genera un identificador único de 50 números para cada fragmento. Estos números colocan cada fragmento de texto en un punto en un espacio de 50 dimensiones. Este espacio de 50 dimensiones se aplana en un plano utilizando el análisis de componentes principales (PCA). Esto da como resultado una visualización de puntos que corresponden al estilo de un autor. Si dos obras literarias se colocan en el mismo plano, el patrón resultante puede mostrar si ambas obras fueron del mismo autor o de diferentes autores.
Estadísticas gaussianas
Los datos estilométricos se distribuyen de acuerdo con la ley de Zipf-Mandelbrot . La distribución es extremadamente irregular y leptocúrtica , por lo que los investigadores no pudieron usar estadísticas para resolver, por ejemplo, problemas de atribución de autoría. Sin embargo, el uso de estadísticas gaussianas es perfectamente posible aplicando la transformación de datos . [93]
Redes neuronales
Las redes neuronales , un caso especial de métodos de aprendizaje automático estadístico, se han utilizado para analizar la autoría de textos. Los textos de autoría indiscutible se utilizan para entrenar una red neuronal mediante procesos como la retropropagación , de modo que el error de entrenamiento se calcula y se utiliza para actualizar el proceso para aumentar la precisión. A través de un proceso similar a la regresión no lineal, la red obtiene la capacidad de generalizar su capacidad de reconocimiento a nuevos textos a los que aún no ha sido expuesta, clasificándolos con un grado de confianza establecido. Tales técnicas se aplicaron a las afirmaciones de larga data de colaboración de Shakespeare con sus contemporáneos John Fletcher y Christopher Marlowe , [94] [95] y confirmaron la opinión, basada en estudios más convencionales, de que tal colaboración había ocurrido de hecho.
Un estudio de 1999 demostró que un programa de redes neuronales alcanzó una precisión del 70% al determinar la autoría de poemas que aún no había analizado. Este estudio de la Vrije Universiteit examinó la identificación de poemas de tres autores holandeses utilizando únicamente secuencias de letras como "den". [96]
Un estudio utilizó redes de creencias profundas (DBN) para el modelo de verificación de autoría aplicable para la autenticación continua (CA). [97]
Un problema con este método de análisis es que la red puede volverse sesgada en función de su conjunto de entrenamiento, posiblemente seleccionando autores que la red ha analizado con más frecuencia. [96]
Algoritmos genéticos
El algoritmo genético es otra técnica de aprendizaje automático que se utiliza para la estilometría. Se trata de un método que comienza con un conjunto de reglas. Un ejemplo de regla podría ser: "Si pero aparece más de 1,7 veces en cada mil palabras, entonces el texto es del autor X". Se presenta el texto al programa y utiliza las reglas para determinar la autoría. Las reglas se prueban con un conjunto de textos conocidos y a cada regla se le asigna una puntuación de idoneidad. Las 50 reglas con las puntuaciones más bajas no se utilizan. A las 50 reglas restantes se les aplican pequeños cambios y se introducen 50 reglas nuevas. Esto se repite hasta que las reglas evolucionadas atribuyan los textos correctamente.
Pares raros
Un método para identificar el estilo se denomina "pares raros" y se basa en los hábitos individuales de colocación . El uso de ciertas palabras puede, para un autor en particular, estar asociado idiosincrásicamente con el uso de otras palabras predecibles. [ cita requerida ]
Atribución de autoría en mensajería instantánea
La difusión de Internet ha desplazado la atención de la atribución de autoría hacia textos en línea (páginas web, blogs, etc.), mensajes electrónicos (correos electrónicos, tweets, publicaciones, etc.) y otros tipos de información escrita que son mucho más cortos que un libro promedio, mucho menos formales y más diversos en términos de elementos expresivos como colores , diseño , fuentes , gráficos , emoticones , etc. Los esfuerzos para tener en cuenta dichos aspectos a nivel de estructura y sintaxis se informaron en. [98] Además, se introdujeron señales idiosincrásicas y específicas del contenido (por ejemplo, modelos de temas y herramientas de revisión gramatical) para revelar elecciones estilísticas deliberadas. [99]
Se han empleado características estilométricas estándar para categorizar el contenido de un chat mediante mensajería instantánea [100] o el comportamiento de los participantes [101] , pero los intentos de identificar a los participantes del chat son todavía escasos y tempranos. Además, se ha descuidado la similitud entre las conversaciones habladas y las interacciones del chat, a pesar de ser una diferencia importante entre los datos del chat y cualquier otro tipo de información escrita.
Véase también
Notas
- ^ ab Argamon, Shlomo , Kevin Burns y Shlomo Dubnov , eds. La estructura del estilo: enfoques algorítmicos para comprender la manera y el significado. Springer Science & Business Media, 2010.
- ^ Westcott, Richard (15 de junio de 2006). "Cómo convertir la música de éxito en una ciencia". BBC News .
- ^ Sethi, Ricky (7 de junio de 2016). "Usar computadoras para comprender mejor el arte". The Conversation . Consultado el 1 de diciembre de 2021 .
- ^ McIlroy-Young, Reid; Wang, Yu; Sen, Siddhartha; Kleinberg, Jon; Anderson, Ashton (2021). Detección del estilo de toma de decisiones individual: exploración de la estilometría conductual en ajedrez. 35.ª Conferencia sobre sistemas de procesamiento de información neuronal.
- ^ Chen, Hsinchun; Yang, Christopher C.; Chau, Michael; Li, Shu-Hsing (2009). Intelligence and Security Informatics: Pacific Asia Workshop, PAISI 2009, Bangkok, Tailandia, 27 de abril de 2009. Actas . Berlín: Springer Science & Business Media. p. 15. ISBN. 9783642013928.
- ^ Samuel Schoenbaum , Evidencia interna y autoría dramática isabelina; un ensayo sobre historia literaria y método, pág. 171.
- ^ Lutoslawski, W. (1898). "Principes de stylométrie appliqués à la cronologie des œuvres de Platon". Revue des Études Grecques . 11 (41): 61–81. doi : 10.3406/reg.1898.5847. ISSN 0035-2039.
- ^ Samuel Schoenbaum , Evidencia interna y autoría dramática isabelina; un ensayo sobre historia literaria y método, pág. 196.
- ^ F. Mosteller y D. Wallace (1964). Inferencia y autoría en disputa: El federalista . Reading, MA : Addison-Wesley .
- ^ Chaski, Carole (2012). Solan, Lawrence M; Tiersma, Peter M (eds.). Identificación del autor en el ámbito forense. Oxford University Press. doi :10.1093/oxfordhb/9780199572120.001.0001. ISBN 9780199572120.
- ^ Chaski, Carole (22 de diciembre de 2005). Wecht, Cyril H.; Rago, John T. (eds.). Ciencia forense y derecho: aplicaciones investigativas en la justicia penal, civil y familiar. CRC Press. ISBN 978-1-4200-5811-6.
- ^ Michael MacPherson y Yoav Tirosh (2020). "Un análisis estilométrico de la saga Ljósvetninga". Gripla . 31 : 7–41.
- ^
- ^ Sigurður Ingibergur Björnsson, Steingrímur Páll Kárason y Jón Karl Helgason (2021). ""La estilometría y las huellas dactilares descoloridas de los autores de sagas"". En busca del culpable: aspectos de la autoría medieval, editado por Lukas Rösli y Stefanie Gropper : 97–122. doi : 10.1515/9783110725339-005 . ISBN 9783110725339.
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace ) - ^ Claburn, Thomas (16 de marzo de 2018). «Para su información: las herramientas de inteligencia artificial pueden desenmascarar a los codificadores anónimos a partir de sus ejecutables binarios». The Register . Consultado el 2 de agosto de 2018 .
- ^ Bensalem, Imene; Rosso, Paolo; Chikhi, Salim (2019). "Sobre el uso de n-gramas de caracteres como única evidencia intrínseca de plagio". Recursos lingüísticos y evaluación . 53 (3): 363–396. doi :10.1007/s10579-019-09444-w. hdl : 10251/159151 . S2CID 86630897.
- ^ Brizan, David (octubre de 2015). "Utilización de dinámicas de pulsaciones de teclas mejoradas lingüísticamente para predecir la cognición y la demografía de los mecanógrafos". Revista internacional de estudios humanos-computadoras . 82 : 57–68. doi :10.1016/j.ijhcs.2015.04.005.
- ^ Alican, Necip Fikri (2012). Repensando a Platón: una búsqueda cartesiana del Platón real . Ámsterdam: Rodopi. p. 183. ISBN 9789042035379.
- ^ Rowe, Christopher (2000). Historia de Cambridge del pensamiento político griego y romano. Cambridge, Reino Unido: Cambridge University Press. pág. 160. ISBN 0521481368.
- ^ Stamatatos, Efstathios (2009). "Un estudio de los métodos modernos de atribución de autoría". JASIST . 60 (3): 538–556. doi :10.1002/asi.21001. S2CID 6231242.
- ^ Stamatatos, Efstathios (2018). "Enmascaramiento de información relacionada con el tema para mejorar la atribución de autoría". JASIS . 69 (3).
- ^ Karlgren, Jussi; Esposito, Lewis; Gratton, Chantal; Kanerva, Pentti (2018). "Elaboración de perfiles de autoría sin utilizar información temática". Notas de trabajo de CLEF . CEUR-WS.
- ^ Corbara, Silvia; Moreo, Alejandro; Sebastiani, Fabrizio (2022). "Patrones de cantidad silábica como características rítmicas para la atribución de autoría latina". JASIST . 74 : 128–141. arXiv : 2110.14203 . doi :10.1002/asi.24660. S2CID 239998537.
- ^ Corbara, Silvia; Chulvi, Berta; Rosso, Paolo; Moreo, Alejandro (2022). "Características rítmicas y psicolingüísticas de las tareas de autoría en el Parlamento español: evaluación y análisis". La RI experimental se encuentra con el multilingüismo, la multimodalidad y la interacción . CLEF. Springer. págs. 79–92. doi :10.1007/978-3-031-13643-6_6.
- ^ Karlgren, Jussi; Eriksson, Gunnar (2007). "Autores, género y convención lingüística". Taller del SIGIR sobre análisis de plagio, identificación de autoría y detección de casi duplicados . SIGIR. PAN.
- ^ Eriksson, Linda (2014). Agregación secuencial de características textuales para la identificación de autores independientes del dominio (MSc). KTH Royal Institute of Technology.
- ^ Mendenhall, TC (1887). "Las curvas características de la composición". Science . 9 (214S): 237–246. doi :10.1126/science.ns-9.214S.237. PMID 17736020.
- ^ Chen, Beichen (2021). Incorporaciones para similitudes entre libros (PDF) (MSc). KTH Royal Institute of Technology.
- ^ Stamatatos, Efstathios; Kestemont, Mike; Kredens, Krzysztof; Pezik, Piotr; Heini, Annina (2022). "Descripción general de la tarea de verificación de autoría en PAN 2022". En Faggioli; Ferro; Potthast (eds.). CLEF 2022 Laboratorios y talleres, Cuadernos de notas. CEUR-WS . Consultado el 6 de septiembre de 2022 .
- ^ ab Argamon, Shlomo , Jussi Karlgren y James G. Shanahan. Análisis estilístico del texto para el acceso a la información. Documentos del taller celebrado en conjunción con la 28.ª Conferencia Anual Internacional de la ACM sobre Investigación y Desarrollo en Recuperación de Información, del 13 al 19 de agosto de 2005, Salvador, Bahía, Brasil. Instituto Sueco de Ciencias de la Computación, 2005.
- ^ "El sistema estilométrico característico". PhiloComp . Consultado el 3 de enero de 2014 .
- ^ "JGAAP". JGAAP. 4 de septiembre de 2012. Consultado el 15 de octubre de 2012 .
- ^ ab "El paquete Stylus para R". Computational Stylistics Group. 2014-10-24. Archivado desde el original el 2014-12-21 . Consultado el 2014-10-24 .
- ^ Eder, Maciej; Rybicki, Jan; Kestemont, Mike (2016). "Estilometría con R: un paquete para análisis de texto computacional" (PDF) . R Journal . 8 (1): 107–121. doi : 10.32614/RJ-2016-007 .
- ^ Daelemans, Walter y Hoste, Véronique (2013). STYLENE: un entorno para la investigación de la estilometría y la legibilidad en neerlandés (informe técnico). Serie de informes técnicos CLiPS. ISSN 2033-3544.
- ^ Yan Qu, James G. Shanahan y Janyce Wiebe . "Explorando la actitud y el afecto en el texto: teorías y aplicaciones". Informe técnico SS-04-07 del Simposio de primavera de la AAAI. AAAI Press, Menlo Park, CA. 2004.
- ^ Jussi Karlgren , Björn Gambäck y Pentti Kanerva . "Adquisición (y uso) de conocimiento lingüístico (y mundial) para el acceso a la información". (2002). Simposio de primavera de la AAAI. Informe técnico SS-02-09. AAAI Press, Menlo Park, CA. 2002.
- ^ Shlomo Argamon , Shlomo Dubnov y Julie Jupp. "Estilo y significado en el lenguaje, el arte, la música y el diseño" (2004). Simposio de otoño de la AAAI. Informe técnico FS-04-07.
- ^ Potthast, Martin, Benno Stein, Alberto Barrón-Cedeño y Paolo Rosso. "Un marco de evaluación para la detección de plagio". En Actas de la 23.ª conferencia internacional sobre lingüística computacional: pósteres, págs. 997-1005. Asociación de Lingüística Computacional, 2010.
- ^ Stamatatos, Efstathios, Walter Daelemans, Ben Verhoeven, Patrick Juola, Aurelio López-López, Martin Potthast y Benno Stein. "Resumen de la Tarea de Identificación de Autores en el PAN 2014". En CLEF (Notas de trabajo), págs. 877–897. 2014.
- ^ Rangel, Francisco, Paolo Rosso, Martin Potthast y Benno Stein. "Resumen de la quinta tarea de elaboración de perfiles de autores en PAN 2017: Identificación de género y variedad lingüística en Twitter". Documentos de notas de trabajo del CLEF (2017).
- ^ Rangel Pardo, Francisco Manuel, Fabio Celli, Paolo Rosso, Martin Potthast, Benno Stein y Walter Daelemans. "Resumen de la tercera tarea de elaboración de perfiles de autores en PAN 2015". En CLEF 2015 Evaluation Labs and Workshop Working Notes Papers, págs. 1–8. 2015.
- ^ Potthast, Martin, Benno Stein y Teresa Holfeld. "Resumen de la 1.ª Competencia Internacional de Detección de Vandalismo en Wikipedia". En CLEF (Notebook Papers/LABs/Workshops). 2010.
- ^ Procesamiento de texto, análisis y generación de texto: tipología y atribución de texto. Actas del simposio Nobel 51. Editado por Sture Allén . Estocolmo: Almqvist & Wiksell internacional 1982. Data lingüística, 16. Simposio Nobel, 51. ISBN 91-22-00594-3
- ^ Karlgren, Jussi (2003). "Helander: An Authorship Attribution Case" (Helander: un caso de atribución de autoría) . Consultado el 4 de octubre de 2017 .
- ^ Airoldi, Edoardo M .; Fienberg, Stephen E.; Skinner, Kiron K. (julio de 2007). "¿De quién son las ideas? ¿De quién son las palabras? Autoría de los discursos radiofónicos de Ronald Reagan" (PDF) . PS: Political Science & Politics . 40 (3): 501–506. CiteSeerX 10.1.1.190.5798 . doi :10.1017/S1049096507070874. S2CID 18730541.
- ^ Autor desconocido por Gavin McNett Salon 2 de noviembre de 2000
- ^ Belluck, Pam (10 de abril de 1996). «En el caso Unabom, dolor para la familia del sospechoso». The New York Times . Archivado desde el original el 10 de agosto de 2017. Consultado el 5 de julio de 2008 .
- ^ "Estudio descubre que una obra de Shakespeare en disputa lleva la marca del maestro". Los Angeles Times . 2015-04-10 . Consultado el 2015-04-13 .
- ^ Boyd, Ryan L.; Pennebaker, James W. (2015). "¿Escribió Shakespeare la doble falsedad? Identificación de individuos mediante la creación de firmas psicológicas con análisis de texto". Psychological Science . 26 (5): 570–582. doi :10.1177/0956797614566658. PMID 25854277. S2CID 13022405.
- ^ Jackson, MacDonald P (27 de abril de 2016). ¿Quién escribió "La noche antes de Navidad"? Análisis de la cuestión Clement Clarke Moore vs. Henry Livingston . McFarland & Co. ISBN 978-1476664439.
- ^ Fuller, Simon; O'Sullivan, James (2017). "Estructura por encima del estilo: autoría colaborativa y el resurgimiento del capitalismo literario". Digital Humanities Quarterly . 11 (1) . Consultado el 20 de abril de 2017 .
- ^ Lane, Anthony (18 de junio de 2018). «La colaboración conmocionante de Bill Clinton y James Patterson». The New Yorker . Consultado el 7 de junio de 2018 .
- ^ "Por qué no hace falta escribir mucho para ser el autor más vendido del mundo". The Conversation . 3 de abril de 2017 . Consultado el 20 de abril de 2017 .
- ^ O'Sullivan, James (7 de junio de 2018). "Bill Clinton y James Patterson son coautores, pero ¿quién escribió el artículo?". The Guardian . Consultado el 7 de junio de 2018 .
- ^ Savoy, Jacques (2018). "¿Es Starnone realmente el autor detrás de Ferrante?". Digital Scholarship in the Humanities . 33 (4): 902–918. doi :10.1093/llc/fqy016.
- ^ Reuell, Peter: "Tú dices Juan, yo digo Pablo. Pero ¿qué dice la estilometría?"
- ^ Glickman, Mark; Brown, Jason; Song, Ryan (2019). "(A) Datos en la vida: atribución de autoría en canciones de Lennon-McCartney". Harvard Data Science Review . 1 (1). arXiv : 1906.05427 . doi : 10.1162/99608f92.130f856e . S2CID 189762434.
- ^ El proyecto ETSO.
- ^ "Un monstruo de la naturaleza llamado Lope" [Un monstruo de la naturaleza llamado Lope]. abc (en español). 2018-11-28 . Consultado el 11 de agosto de 2019 .
- ^ "Rastreadores digitales en el Siglo de Oro" [Rastreadores digitales en el Siglo de Oro]. El Norte de Castilla (en español). 2018-12-23 . Consultado el 11 de agosto de 2019 .
- ^ Real, La Tribuna de Ciudad (09 de julio de 2019). "Juan Ruiz de Alarcón aumenta su obra cinco siglos después" [Juan Ruiz de Alarcón aumenta su obra cinco siglos después]. La Tribuna de Ciudad Real (en español) . Consultado el 11 de agosto de 2019 .
- ^ Migueláñez, Daniel (28 de julio de 2019). "El Holmes de la filología". PSOE Chamberí . No. 6. pág. 8. Archivado desde el original el 18 de julio de 2020 . Consultado el 11 de agosto de 2019 .
- ^ "Sor Juana Inés centró las 42 Jornadas de Teatro Clásico". Lanza Digital (en español europeo). 2019-07-14 . Consultado el 11 de agosto de 2019 .
- ^ "'La monja alférez' ya no es de Pérez de Montalbán, sino de Ruiz de Alarcón" ['La monja alférez' ya no es de Pérez de Montalbán, sino de Ruiz de Alarcón]. El Norte de Castilla (en español). 2019-07-10 . Consultado el 11 de agosto de 2019 .
- ^ "La inteligencia artificial ayuda a encontrar al destacado dramaturgo español Lope de Vega como autor de una obra a partir de un manuscrito escrito años después de su muerte". newsendip.com . 31 de enero de 2023 . Consultado el 8 de febrero de 2023 .
- ^ Jones, Sam (5 de febrero de 2023). «La inteligencia artificial descubre el trabajo perdido del titán de la «Edad de Oro» española». The Guardian . Consultado el 8 de febrero de 2023 .
- ^ Morales, Manuel (31 de enero de 2023). "La inteligencia artificial atribuye a Lope de Vega una obra anónima del fondo de manuscritos de la Biblioteca Nacional" El País (en español) . Consultado el 8 de febrero de 2023 .
- ^ McCarthy, Rachel; O'Sullivan, James (2020). "¿Quién escribió Cumbres borrascosas?". Digital Scholarship in the Humanities . 36 (2): 383–391. doi :10.1093/llc/fqaa031. hdl : 10468/10194 .
- ^ Ilsemann, Harmut (2020) "Phantom Marlowe: Paradigmenwechsel in Autorschaftsbestimmungen des englischen Renaissancedramas". Düren: Coctelera, ISBN 978-3-8440-7412-3
- ^ Ilsemann, Harmut (2020). "El corpus de Marlowe revisitado". Digital Scholarship in the Humanities . 36 (2): 333–360. doi :10.1093/llc/fqaa010.
- ^ Ilsemann, Harmut (2021). "Un breve suplemento a "The Marlowe Corpus Revisited" y Phantom Marlowe". Beca digital en humanidades . 37 (2): 462–468. doi :10.1093/llc/fqab078.
- ^ Rebora, Simone y Salgaro, Massimo (2022). "¿Es Felix Salten el autor de la novela Mutzenbacher (1906)? Sí y no" . Lengua y literatura: Revista internacional de estilística . 31 (2): 243–264. doi :10.1177/09639470221090384. S2CID 248135373.
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace ) - ^ AI avslöjar: Läckberg har antagligen spökskrivare – skjuter ned anklagelserna. Hufvudstadsbladet , 27 de septiembre de 2023 (en sueco).
- ^ "Läckberg om rykterna: 'Han petade i meningarna'". Hufvudstadsbladet (en sueco). Helsingfors. 21 de diciembre de 2023. p. 23.
- ^ Biber, Douglas. Variación en el habla y la escritura. Cambridge University Press, 1991.
- ^ Karlgren, Jussi ; Cutting, Douglass (1994). "Reconocimiento de géneros textuales con métricas simples mediante análisis discriminante". Actas de la 15.ª conferencia sobre lingüística computacional - . Vol. 2. pág. 1071. arXiv : cmp-lg/9410008 . Bibcode :1994cmp.lg...10008K. doi :10.3115/991250.991324. S2CID 1297432.
- ^ Van Droogenbroeck FJ, "Una reformulación esencial de la ley de Zipf-Mandelbrot para resolver aplicaciones de atribución de autoría mediante estadísticas gaussianas" (2019).
- ^ Matthews, Robert AJ; Merriam, Thomas V. N (1993). "Computación neuronal en estilometría I: una aplicación a las obras de Shakespeare y Fletcher". Computación literaria y lingüística . 8 (4): 203–209. doi :10.1093/llc/8.4.203.
- ^ Merriam, Thomas V. N; Matthews, Robert AJ (1994). "Computación neuronal en estilometría II: una aplicación a las obras de Shakespeare y Marlowe". Computación literaria y lingüística . 9 (1): 1–6. doi :10.1093/llc/9.1.1.
- ^ por JF Hoorn; SL Frank; W Kowalczyk; F van der Ham (3 de septiembre de 2012). "Identificación de poetas mediante redes neuronales utilizando secuencias de letras". Computación literaria y lingüística . 14 (3): 311–338. doi :10.1093/llc/14.3.311.
- ^ Brocardo, ML; Traore, I; Woungang, I; Obaidat, MS (2017). "Verificación de autoría utilizando sistemas de redes de creencias profundas". Int J Commun Syst . 30 (12): e3259. doi :10.1002/dac.3259. S2CID 40745740.
- ^ de Vel, O.; Anderson, A.; Corney, M.; Mohay, G. (1 de diciembre de 2001). "Extracción de contenido de correo electrónico para la identificación forense de autores". SIGMOD Rec . 30 (4): 55–64. CiteSeerX 10.1.1.408.4231 . doi :10.1145/604264.604272. ISSN 0163-5808. S2CID 1623521.
- ^ Argamon, Shlomo; Koppel, Moshe; Pennebaker, James W.; Schler, Jonathan (1 de febrero de 2009). "Perfilado automático del autor de un texto anónimo". Commun. ACM . 52 (2): 119–123. CiteSeerX 10.1.1.136.9952 . doi :10.1145/1461928.1461959. ISSN 0001-0782. S2CID 5413411.
- ^ "Clasificación de las comunicaciones de mensajería instantánea para análisis forense – TechRepublic". TechRepublic . Consultado el 26 de enero de 2016 .
- ^ Zhou, L.; Zhang, Dongsong (1 de enero de 2004). "¿Puede el comportamiento en línea revelar a los engañadores? Una investigación exploratoria del engaño en la mensajería instantánea". 37.ª Conferencia Internacional Anual de Hawái sobre Ciencias de Sistemas, 2004. Actas de la . pp. 9 pp.–. doi :10.1109/HICSS.2004.1265079. ISBN 978-0-7695-2056-8. Número de identificación del sujeto 7154702.
Referencias
- Afroz, Sadia; Brennan, Michael; Greenstadt, Rachel (2012). "Detección de engaños, fraudes y engaños en el estilo de escritura en línea". Simposio IEEE sobre seguridad y privacidad de 2012. págs. 461–475. doi : 10.1109/SP.2012.34 . ISBN . 978-1-4673-1244-8.
- Brennan, Michael; Afroz, Sadia; Greenstadt, Rachel (2012). "Estilometría adversaria: cómo eludir el reconocimiento de autoría para preservar la privacidad y el anonimato" (PDF) . ACM Transactions on Information and System Security . 15 (3): 1–22. doi :10.1145/2382448.2382450. S2CID 16176436.
- Brennan, Michael Robert; Greenstadt, Rachel. "Ataques prácticos contra las técnicas de reconocimiento de autoría". Aplicaciones innovadoras de la inteligencia artificial .
- Brocardo, Marcelo Luiz; Issa Traore; Sherif Saad; Isaac Woungang (2013). Verificación de autoría para mensajes cortos mediante estilometría . IEEE Intl. Conference on Computer, Information and Telecommunication Systems (CITS). doi :10.1109/CITS.2013.6705711.
- Can, Fazli; Patton, Jon M. (2004). "Cambio del estilo de escritura con el tiempo". Computers and the Humanities . 38 (1): 61–82. CiteSeerX 10.1.1.1.8850 . doi :10.1023/b:chum.0000009225.28847.77. S2CID 38242388.
- Emmery, Chris; Kádár, Ákos; Chrupała, Grzegorz (2021). "Estilometría adversaria en la naturaleza: ataques de sustitución léxica transferible en perfiles de autor". Actas de la 16.ª Conferencia del Capítulo Europeo de la Asociación de Lingüística Computacional: Volumen principal . págs. 2388–2402. arXiv : 2101.11310 . doi : 10.18653/v1/2021.eacl-main.203 . S2CID : 231719026.
- Gröndahl, Tommi; Asokan, N. (2020a). "Análisis de texto en contextos adversarios: ¿el engaño deja un rastro estilístico?". ACM Computing Surveys . 52 (3): 1–36. arXiv : 1902.08939 . doi :10.1145/3310331. S2CID 67856540.
- Hope, Jonathan (1994). La autoría de las obras de Shakespeare . Cambridge: Cambridge University Press. ISBN 9780521417372.
- Hoy, Cyrus (1956–1962). «Las acciones de Fletcher y sus colaboradores en el canon de Beaumont y Fletcher (I-VII)». Estudios en bibliografía . 7–15 .
- Juola, Patrick (2006). "Atribución de autoría" (PDF) . Fundamentos y tendencias en la recuperación de información . 1 (3): 3. CiteSeerX 10.1.1.219.1605 . doi :10.1561/1500000005. Archivado desde el original (PDF) el 24 de octubre de 2020 . Consultado el 13 de noviembre de 2008 .
- Kacmarcik, Gary; Gamon, Michael (17 de julio de 2006). "Ofuscación de la estilometría de los documentos para preservar el anonimato del autor". Actas de las sesiones de pósteres de la conferencia principal COLING/ACL 2006. págs. 444–451.
- Kenny, Anthony (1982). El cálculo del estilo: Introducción a la estadística para estudiantes de literatura y humanidades . Oxford: Pergamon Press.
- Mahmood, Asad; Ahmad, Faizan; Shafiq, Zubair; Srinivasan, Padmini; Zaffar, Fareed (2019). "Una chica no tiene nombre: Ofuscación automatizada de la autoría utilizando Mutant-X". Actas sobre tecnologías de mejora de la privacidad . 2019 (4): 54–71. doi : 10.2478/popets-2019-0058 . S2CID 197621394.
- Neal, Tempestt; Sundararajan, Kalaivani; Fatima, Aneez; Yan, Yiming; Xiang, Yingfei; Woodard, Damon (2018). "Técnicas y aplicaciones de estilometría topográfica". ACM Computing Surveys . 50 (6): 1–36. doi :10.1145/3132039. S2CID 21360798.
- Potthast, Martin; Hagen, Matthias; Stein, Benno (2016). Obfuscación del autor: un ataque al estado del arte en la verificación de la autoría (PDF) . Conferencia y laboratorios del Foro de Evaluación.
- Romaine, Suzanne (1982). Lingüística sociohistórica . Cambridge: Cambridge University Press.
- Saedi, Chakaveh; Dras, Mark (diciembre de 2020). "Ofuscación de autor a gran escala mediante el codificador automático variacional siamés: el sistema SiamAO". Actas de la Novena Conferencia Conjunta sobre Semántica Léxica y Computacional . págs. 179–189.
- Samuels, ML (1972). Evolución lingüística: con especial referencia al inglés . Cambridge: Cambridge University Press.
- Schoenbaum, Samuel (1966). Evidencia interna y autoría dramática isabelina: un ensayo sobre historia literaria y método . Evanston, IL, EE. UU.: Northwestern University Press.
- Van Droogenbroeck, Frans J. (2016) "Manejo de la distribución Zipf en la atribución de autoría computarizada"
- Van Droogenbroeck, Frans J. (2019) "Una reformulación esencial de la ley de Zipf-Mandelbrot para resolver aplicaciones de atribución de autoría mediante estadísticas gaussianas"
- Wang, Haining; Juola, Patrick ; Riddell, Allen (2022). "Reproducción y replicación de un experimento de estilometría adversarial". arXiv : 2208.07395 .
- Zenkov, Andrei V. (2018). "Un método de atribución de texto basado en las estadísticas de numerales". Revista de lingüística cuantitativa . 25 (3): 256–270. doi :10.1080/09296174.2017.1371915. S2CID 49692378.
- Zhai, Wanyue; Rusert, Jonathan; Shafiq, Zubair; Srinivasan, Padmini (2022). "Una niña tiene un nombre, y es ... Atribución de autoría adversaria para desofuscación". Actas de la 60.ª Reunión Anual de la Asociación de Lingüística Computacional (volumen 1: artículos largos) . págs. 7372–7384. arXiv : 2203.11849 . doi : 10.18653/v1/2022.acl-long.509 . S2CID 248780012.
Lectura adicional
Véase también la revista académica Literary and Linguistic Computing , ahora Digital Scholarship in the Humanities (publicada por la Universidad de Oxford ) y la revista Language Resources and Evaluation (anteriormente Computers and the Humanities ).
Enlaces externos
- Asociación para la Informática y las Humanidades
- Computación literaria y lingüística
- Grupo de estilística computacional
- Sistema estilométrico de firma
- Programa de atribución de autoría JGAAP
- Descubriendo el misterio de la última novela de J. K. Rowling