El detector Copyvio de Earwig [a] es una herramienta útil para ayudar a identificar posibles problemas de derechos de autor o plagio. Sin embargo, no es infalible: con frecuencia devuelve falsos negativos (no detecta algunos problemas de derechos de autor) y falsos positivos (señala posibles problemas que en realidad no son problemas). Si está revisando un artículo en busca de derechos de autor y plagio, no basta con comprobar Earwig .
A continuación se presentan algunas de las cuestiones clave, junto con consejos sobre cómo tenerlas en cuenta:
Aunque parezca obvio, es importante entender que si una fuente no está disponible en la web, Earwig no puede verificarla . Esto significa que Earwig no detectará el texto copiado de una fuente impresa. Es menos obvio que si el texto está disponible en línea pero no está indexado por Google (por ejemplo, escaneos de periódicos en bases de datos en línea o de libros en la biblioteca de Internet Archive), Earwig no lo detectará.
Un corolario de esto es que Earwig cubre algunos artículos de manera más efectiva que otros. Es probable que los artículos sobre cultura popular moderna y deportes se basen en gran medida en fuentes en línea que Earwig puede consultar; es menos probable que Earwig verifique de manera efectiva los temas más académicos, así como los que son anteriores al acceso generalizado a la web. Por ejemplo, Anyte es un artículo sobre un poeta griego antiguo relativamente desconocido. Earwig probablemente pueda verificar solo dos de las fuentes citadas en esta revisión: las páginas web del Museo de Brooklyn y del USGS, que se utilizan para respaldar solo unas pocas palabras. Por el contrario, esta revisión del artículo sobre la actriz Anya Taylor-Joy está respaldada principalmente por fuentes que Earwig probablemente pueda verificar.
Por lo tanto, al verificar si existen problemas de derechos de autor, es importante verificar manualmente algunas de las fuentes que Earwig no examinará, especialmente si el artículo se basa en gran medida en dichas fuentes. Revise los libros que están disponibles en Internet Archive; use la Biblioteca Wikipedia y el Intercambio de recursos para encontrar copias de los artículos. Si tiene acceso a una buena biblioteca en su zona, utilícela para encontrar fuentes impresas. Si está realizando algún tipo de revisión formal, pídale al autor del artículo que le proporcione escaneos de algunas de sus fuentes. Verifique las fuentes poco conocidas, ¡porque son aquellas en las que es probable que se pasen por alto los problemas!
Tenga en cuenta que, incluso en el caso de las fuentes web, lo que ve Earwig puede no ser lo que usted ve. En este ejemplo (al menos a fecha del 20 de noviembre de 2024), el contenido de este sitio web no se muestra correctamente para Earwig y aparece un mensaje de error que dice "su navegador no es compatible con esta experiencia", en lugar de marcar el texto "El Indianapolis Speedrome es la pista de carreras en forma de 8 más antigua en funcionamiento de los Estados Unidos, ya que se inauguró en 1941. Muchos historiadores creen que esta es la primera pista de carreras en forma de 8 en la que se cruzan los coches" como una posible copia ilegal. (De hecho, en este ejemplo, es el sitio web el que copia de Wikipedia: consulte §Earwig y los falsos positivos a continuación).
Incluso cuando Earwig comprueba una fuente, puede pasar por alto problemas. La paráfrasis minuciosa es la modificación superficial del material de otra fuente
; puede violar las políticas de Wikipedia sobre plagio y violación de derechos de autor.
Un artículo puede reformular un texto distintivo de tal manera que Earwig no lo marque, pero aun así viola las reglas de Wikipedia sobre derechos de autor y/o plagio. Por ejemplo, si un autor toma (tomando prestado el ejemplo de WP:CLOP ) la descripción de una llama de Hilaire Belloc en More Beasts (for Worse Children) como fuente:
La llama es una especie de cabra lanuda y peluda, de expresión indolente y garganta ondulada, como un literato fracasado.
Y lo reescribe para Wikipedia como:
Las llamas son una especie de cabras lanudas. Tienen una expresión de indolencia y una garganta que ondula como la de un escritor fracasado.
Entonces, además de ser culpables de escribir de manera poco enciclopédica, también son culpables de parafrasear minuciosamente, y, sin embargo, es probable que Earwig no se dé cuenta de esto.
Una vez más, la solución es comprobar las fuentes de forma aleatoria. Es probable que Earwig encuentre préstamos directos, pero hay que estar atento a las semejanzas estructurales excesivas entre la fuente y el texto. Esto se aplica especialmente a los recursos retóricos distintivos. La redacción más obvia de hechos básicos como "John Smith nació en 1967" es aceptable incluso si se trata de la misma frase utilizada en las fuentes, pero cuando se trata de comunicar ideas más complejas o de utilizar lenguaje figurado, las semejanzas estructurales son más preocupantes.
Tenga especial cuidado con el lenguaje florido que incluye comparaciones, especialmente cuando la prosa parece extraña. Esto suele ser un indicio de que una fuente ha sido parafraseada de manera inepta y demasiado fiel.
Si la fuente está en un idioma diferente al del artículo de Wikipedia, Earwig no puede detectar plagio ni violaciones de derechos de autor. No sabe lo que significa el texto que está viendo de la misma manera que lo sabe un humano. Si compara el comienzo de las Guerras de las Galias de Julio César en latín:
Gallia est omnis divisa in partes tres, quarum unam incolunt Belgae, aliam Aquitani, tertiam qui ipsorum lingua Celtae, nostra Galli appellantur.
Contra un artículo que dice:
La Galia está dividida en tres partes, de las cuales una está habitada por los belgas, otra por los aquitanos, la tercera por los que en su propia lengua se llaman celtas, y en la nuestra galos.
Entonces Earwig ve que los dos textos son completamente diferentes palabra por palabra y supone que todo está bien. No sabe que el artículo es un plagio de César. Sin embargo, los revisores manuales cuidadosos probablemente noten la estructura de oraciones no idiomáticas y verifiquen si el artículo es culpable de una traducción demasiado literal.
Si lee varios idiomas, las fuentes en idiomas extranjeros son buenas candidatas para realizar verificaciones puntuales al momento de realizar una revisión, no solo porque Earwig no puede manejarlas, sino también porque la mayoría de los lectores del artículo no las entenderán; es menos probable que otros revisores encuentren errores.
Si el mismo texto aparece en un artículo de Wikipedia y en una fuente en línea, Earwig lo identificará. Lo tratará exactamente de la misma manera, ya sea que esté atribuido o no, marcado con comillas o en una cita textual o incluido en un texto continuo sin ninguna indicación. De manera similar, si el artículo de Wikipedia y la fuente mencionan los mismos nombres propios, Earwig los marcará. El hecho de que Earwig diga que algo tiene una alta probabilidad de ser una violación de derechos de autor no significa necesariamente que haya algo incorrecto.
Según Earwig, esta revisión del artículo Mira Bellwether tiene un 46,2 % de posibilidades de ser una copia de este artículo publicado por Them . Los tres fragmentos de texto más largos que señala como problemáticos están todos citados y atribuidos correctamente. El cuarto más largo es el título de la fuente en sí, ¡incluido en la bibliografía de nuestro artículo! He visto a revisores quejarse de las altas puntuaciones de Earwig en las revisiones de GA antes, sin entender aparentemente qué significa esa puntuación o si es realmente problemática. El simple hecho de tener una alta similitud de texto, según los cálculos de Earwig, no es necesariamente un problema. (Y si hay un problema, simplemente jugar con el texto hasta que Earwig ya no se queje no necesariamente resuelve el problema).
Earwig tampoco sabe cuándo una fuente copia de Wikipedia. Si marca algo como copia no autorizada y usted determina que efectivamente se ha producido una copia no atribuida , es importante comprobar en qué dirección se ha producido la copia. Comprobar las copias archivadas de la página en archive.org puede resultar de ayuda con esto; si no existen tales copias, puede resultar de ayuda comprobar el historial de revisión del texto en cuestión en el artículo de Wikipedia. Si puede ver que evolucionó gradualmente con el tiempo, especialmente con la contribución de muchos editores independientes, es probable que haya sido original de Wikipedia; si se añadió todo en un único fragmento, es más probable que haya sido una copia no autorizada. (Aunque recuerde que incluso el texto que se añadió a un artículo de Wikipedia en un único fragmento puede haber sido escrito originalmente para Wikipedia y luego copiado por un sitio externo).
Lo ideal sería que no tuvieras que hacer nada. Por definición, un falso positivo no es un problema. Sin embargo, es posible que alguien que revise un artículo (probablemente como parte del proceso de Good Article ) eleve la puntuación otorgada por Earwig como una preocupación. Si esto te sucede, simplemente explícale al revisor por qué la puntuación otorgada por Earwig no es indicativa de un problema real de derechos de autor en este caso. Si sigue sin estar convencido, abre una discusión más amplia (por ejemplo, en WT:GAN para cuestiones relacionadas con las revisiones de Good Article).