Problema causado por los filtros de blasfemias en Internet
El problema de Scunthorpe es el bloqueo involuntario de contenido en línea por parte de un filtro de spam o un motor de búsqueda porque su texto contiene una cadena (o subcadena ) de letras que parecen tener un significado obsceno o inaceptable. Los nombres, las abreviaturas y los términos técnicos son los más citados como afectados por el problema.
El problema surge porque las computadoras pueden identificar fácilmente cadenas de texto dentro de un documento, pero interpretar palabras de este tipo requiere una capacidad considerable para interpretar una amplia gama de contextos , posiblemente en muchas culturas , lo que es una tarea extremadamente difícil. Como resultado, las reglas de bloqueo amplias pueden dar lugar a falsos positivos que afecten a muchas frases inocentes.
Etimología y origen
El problema recibió su nombre a raíz de un incidente ocurrido en 1996 en el que el filtro de blasfemias de AOL impidió a los residentes de la ciudad de Scunthorpe , en North Lincolnshire , Inglaterra, crear cuentas en AOL, porque el nombre de la ciudad contiene la subcadena " cunt ". [1] A principios de la década de 2000, los filtros de búsqueda segura de Google cometieron el mismo error, y los servicios y empresas locales que incluían Scunthorpe en sus nombres o URL se encontraban entre los excluidos por error de aparecer en los resultados de búsqueda. [2]
Soluciones alternativas
El problema de Scunthorpe es difícil de resolver por completo debido a la dificultad de crear un filtro capaz de comprender palabras en contexto. [3] [4]
Una solución consiste en crear una lista blanca de falsos positivos conocidos. El filtro puede ignorar cualquier palabra que aparezca en la lista blanca, incluso si contiene texto que de otro modo no estaría permitido. [5]
Otros ejemplos
Las decisiones erróneas por los filtros de obscenidad incluyen:
Nombres de dominios web y registros de cuentas rechazados
En abril de 1998, Jeff Gold intentó registrar el nombre de dominio shitakemushrooms.com, pero debido a la subcadena shit fue bloqueado por un filtro de InterNIC que prohibía las " siete palabras sucias ". [6] ( Shiitake , también comúnmente escrito shitake , es el nombre japonés del hongo comestible Lentinula edodes ).
En 2000, un noticiero de televisión canadiense sobre software de filtrado web descubrió que el sitio web de la Comunidad Urbana de Montreal ( Communauté Urbaine de Montréal , en francés) estaba completamente bloqueado porque su nombre de dominio era su acrónimo francés CUM (www.cum.qc.ca); [7] "cum" (entre otros significados) es un término del argot vulgar en inglés para referirse al semen .
En febrero de 2004, en Escocia, Craig Cockburn informó que no podía usar su apellido (pronunciado "Coburn", IPA : / ˈkoʊbərn / ) con Hotmail porque contiene la subcadena cock , una palabra del argot para el pene . Por otra parte, tuvo problemas con el correo electrónico de su lugar de trabajo porque su puesto de trabajo, especialista en software , contenía la subcadena Cialis , un medicamento para la disfunción eréctil que se menciona comúnmente en los correos electrónicos no deseados . Hotmail inicialmente le dijo que deletreara su nombre C0ckburn (con un cero en lugar de la letra "o"), pero luego revirtió la prohibición. [8] En 2010, tuvo un problema similar al registrarse en el sitio web de la BBC, donde nuevamente los primeros cuatro caracteres de su apellido causaron un problema para el filtro de contenido. [9]
En febrero de 2006, a Linda Callahan se le impidió inicialmente registrar su nombre en Yahoo! como dirección de correo electrónico porque contenía la subcadena Allah . Yahoo! revocó posteriormente la prohibición. [10]
En julio de 2008, Herman I. Libshitz no pudo registrar una dirección de correo electrónico que contenía su nombre en Verizon porque su apellido contenía la subcadena shit , y Verizon inicialmente rechazó su solicitud de excepción. En una declaración posterior, una portavoz de Verizon se disculpó por no aprobar la dirección de correo electrónico que deseaba. [11]
Búsquedas web bloqueadas
En los meses previos a enero de 1996, algunas búsquedas en Internet sobre el Super Bowl XXX estaban siendo filtradas, porque el número romano del juego también se utiliza para identificar pornografía . [12]
Gareth Roelofse, el diseñador web de RomansInSussex.co.uk , señaló en 2004: "Hemos descubierto que muchas estaciones de Internet de bibliotecas, redes escolares y cibercafés bloquean los sitios que contienen la palabra 'sexo' en el nombre de dominio. Esto supuso un reto para RomansInSussex.co.uk porque su público objetivo son los niños en edad escolar". [2]
En 2008, el filtro del servicio inalámbrico gratuito de la ciudad de Whakatāne en Nueva Zelanda bloqueó las búsquedas que incluían el nombre de la ciudad porque el análisis fonético del filtro consideró que "whak" sonaba como " fuck " ; el nombre de la ciudad está en maorí, y en el idioma maorí "wh" se pronuncia más comúnmente / f / . Posteriormente, la ciudad puso el nombre de la ciudad en la lista blanca del filtro . [13]
En julio de 2011, las búsquedas en Internet del nombre Jiang en China fueron bloqueadas tras las afirmaciones en el sitio de microblogging Weibo de que el ex secretario general del Partido Comunista Chino (PCCh), Jiang Zemin, había muerto. Como la palabra "Jiang", que significa "río", se escribe con el mismo carácter chino (江), las búsquedas relacionadas con ríos como el Yangtze (Cháng Jiāng) arrojaron el mensaje: "De acuerdo con las leyes, regulaciones y políticas pertinentes, los resultados de esta búsqueda no se pueden mostrar". [14]
En febrero de 2018, las búsquedas web en la plataforma de compras de Google fueron bloqueadas para artículos como pistolas de pegamento , Guns N' Roses y vino de Borgoña después de que Google parcheara apresuradamente su sistema de búsqueda luego de que mostrara resultados de armas y accesorios que violaban las políticas establecidas por Google. [15]
Correos electrónicos bloqueados
En 2001, Yahoo! Mail introdujo un filtro de correo electrónico que reemplazaba automáticamente las cadenas relacionadas con JavaScript por versiones alternativas, para evitar la posibilidad de secuencias de comandos entre sitios en correos electrónicos HTML . El filtro separaba con guiones los términos "JavaScript", " JScript ", " VBScript " y " LiveScript "; y reemplazaba " eval ", "mocha" y " expression " por los términos similares pero no del todo sinónimos "review", "espresso" y "statement", respectivamente. Se hicieron suposiciones al escribir los filtros: no se intentó limitar estos reemplazos de cadenas a secciones y atributos de script , ni respetar los límites de las palabras, en caso de que esto dejara algunas lagunas abiertas. Esto dio lugar a errores como medireview en lugar de medieval . [16] [17] [18]
En febrero de 2003, los miembros del Parlamento de la Cámara de los Comunes británica descubrieron que un nuevo filtro de spam bloqueaba los mensajes de correo electrónico que contenían referencias al proyecto de ley sobre delitos sexuales que se estaba debatiendo en ese momento, así como algunos mensajes relacionados con un documento de consulta del Partido Liberal Demócrata sobre la censura. [19] También bloqueaba los mensajes de correo electrónico enviados en galés porque no reconocía el idioma. [20]
En octubre de 2004, se informó que el Museo Horniman de Londres no recibía algunos de sus correos electrónicos porque los filtros trataban por error su nombre como una versión de las palabras horny man (hombre cachondo) . [21]
Bloqueado para palabras con múltiples significados
En octubre de 2004, los correos electrónicos que publicitaban la pantomima Dick Whittington enviados a las escuelas del Reino Unido fueron bloqueados por las computadoras de las escuelas debido al uso del nombre Dick , a veces utilizado como jerga para pene . [22]
En mayo de 2006, un hombre de Manchester (Reino Unido) descubrió que los correos electrónicos que había escrito a su ayuntamiento local para quejarse de una solicitud de planificación habían sido bloqueados porque contenían la palabra "erección" cuando se refería a una estructura. [23]
Los correos electrónicos bloqueados y las búsquedas web relacionadas con The Beaver , una revista con sede en Winnipeg , hicieron que la editorial cambiara su nombre a Canada's History en 2010, después de 89 años de publicación. [24] [25] La editora Deborah Morrison comentó: "En 1920, The Beaver era un nombre perfectamente apropiado. Y aunque su otro significado [ vulva ] no es nada nuevo, su ambigüedad comenzó a plantear un desafío completamente nuevo con el avance de Internet. El nombre se convirtió en un impedimento para nuestro crecimiento". [26]
En junio de 2010, Twitter bloqueó a un usuario de Luxemburgo 29 minutos después de que hubiera abierto su cuenta y publicado su primer tuit. El tuit decía: "¡Por fin! ¡Una pareja de carboneros ( Parus major ) se ha mudado a mi pajarera!". A pesar de incluir el nombre en latín para señalar que el tuit trataba sobre pájaros, todos los intentos de desbloquear la cuenta fueron en vano. [27]
A los residentes de Penistone , en el sur de Yorkshire, se les han bloqueado los correos electrónicos porque el nombre de la ciudad incluye la subcadena penis . [29]
Los habitantes de Clitheroe ( Lancashire , Inglaterra) se han visto repetidamente perjudicados porque el nombre de su ciudad incluye la subcadena clit , que es la abreviatura de " clítoris ". [30]
Los currículos que contienen referencias a graduaciones con honores latinos como cum laude , magna cum laude y summa cum laude han sido bloqueados por los filtros de spam debido a la inclusión de la palabra cum , que en latín significa con (en este uso), pero que a veces se usa como jerga para semen o eyaculación en el uso del inglés. [31]
Artículos de noticias
En junio de 2008, un sitio de noticias dirigido por el grupo de presión anti- LGBT American Family Association filtró un artículo de Associated Press sobre el velocista Tyson Gay , reemplazando las instancias de "gay" con " homosexual ", convirtiendo así su nombre en "Tyson Homosexual". [32] [33] Esta misma función había cambiado previamente el nombre del jugador de baloncesto Rudy Gay a "Rudy Homosexual". [34]
La palabra o cadena "ass" puede reemplazarse por "butt", lo que da como resultado "clbuttic" para "classic", "buttignment" para "assignment" y "buttbuttinate" para "assassinate". [35]
Juegos de vídeo
En 2008, Microsoft confirmó que su política de impedir el uso de palabras relacionadas con la orientación sexual había significado que el nombre de Richard Gaywood se consideraba ofensivo y no podía usarse en su "gamertag" ni en el campo "Nombre real" de su biografía. [36]
En 2011, el lanzamiento de Pokémon Negro y Blanco introdujo a Cofagrigus , que no podía intercambiarse en línea con otros jugadores sin un apodo porque su nombre de especie contenía la subcadena fag . Desde entonces, el sistema se ha actualizado para permitir a los jugadores intercambiarlo sin apodos. El mismo problema ocurrió con Nosepass , Probopass y Froslass debido a su inclusión de la subcadena ass . [37]
En enero de 2014, algunos filtros de ISP del Reino Unido bloquearon los archivos utilizados en el juego en línea League of Legends debido a los nombres "VarusExpirationTimer.luaobj " y "XerathMageChainsExtended.luaobj", que contienen la subcadena sex . Esto se corrigió más tarde. [38]
Otro
En 2013, las transferencias de archivos que llevaban el nombre de la ciudad sueca de Falun provocaron cortes en la conexión a Internet en Diakrit, una empresa con sede en China. Diakrit resolvió el problema renombrando los archivos. Fredrik Bergman, de Diakrit, cree que los nombres de los archivos activaron los censores del Gran Cortafuegos, que se utilizan para bloquear las discusiones sobre Falun Gong , un movimiento religioso prohibido fundado en China. [39]
En mayo de 2018, el sitio web de la tienda de comestibles Publix no permitía pedir un pastel que contenía la frase en latín summa cum laude . El cliente intentó solucionar el problema incluyendo instrucciones especiales, pero terminó con un pastel que decía "Summa --- Laude". [41] [42]
En mayo de 2020, a pesar del amplio escrutinio de los medios, algunos hashtags que hacían referencia directa al asesor político británico Dominic Cummings no pudieron ser tendencia en Twitter porque la subcadena cum activó un filtro antipornografía. [43]
En octubre de 2020, la plataforma de reuniones virtuales de una conferencia de paleontología bloqueó varias palabras, incluidas "hueso", " púbico " y "arroyo". [44]
En enero de 2021, Facebook se disculpó por silenciar y banear a usuarios después de haber marcado erróneamente el monumento de Devon Plymouth Hoe como misógino. [45]
En abril de 2021, la página oficial de Facebook de la comuna francesa de Bitche fue eliminada. En respuesta, los funcionarios de la comuna crearon una nueva página que hacía referencia en su lugar al código postal, Mairie 57230. Facebook se disculpó más tarde y restauró la página original. Como medida de precaución, los funcionarios de Rohrbach-lès-Bitche cambiaron el nombre de su página de Facebook a Ville de Rohrbach . [46] [47]
Detección de spam : métodos para prevenir el spam en el correo electrónicoPáginas que muestran descripciones breves de los objetivos de redireccionamiento
Wordfilter : script utilizado para censurar palabras o frases en Internet
Referencias
^ Clive Feather (25 de abril de 1996). Peter G. Neumann (ed.). "¡AOL censura el nombre de una ciudad británica!". The Risks Digest . 18 (7).
^ ab McCullagh, Declan (23 de abril de 2004). "El cinturón de castidad de Google es demasiado ajustado". CNET . Archivado desde el original el 16 de junio de 2011.
^ Oberhaus, Daniel (29 de agosto de 2018). "La vida en Internet es difícil cuando tu apellido es 'Butts'". Vice . Consultado el 31 de julio de 2022 .
^ Gellis, Cathy (31 de agosto de 2018). "El problema de Scunthorpe y por qué la IA no es una solución milagrosa para moderar el contenido de la plataforma a gran escala". Techdirt . Consultado el 31 de julio de 2022 .
^ Veale, Tony (2021). Tu ingenio es mi mando: cómo crear IA con sentido del humor. MIT Press. pág. 231. ISBN978-0-262-04599-5.OCLC 1221016857 .
^ Festa, Paul (27 de abril de 1998). "El dominio de la comida se considera "obsceno"". News.com . Archivado desde el original el 10 de mayo de 2020.
^ "Foire aux questions". radio-canada.ca. Archivado desde el original el 21 de octubre de 2012. Consultado el 24 de febrero de 2011 .
^ Barker, Garry (26 de febrero de 2004). «Cómo el señor Cockburn luchó contra el spam». The Sydney Morning Herald . Archivado desde el original el 3 de septiembre de 2009.
^ Cockburn, Craig (9 de marzo de 2010). "Falla de la BBC: no se permite mi nombre correcto". blog.siliconglen.com . Archivado desde el original el 30 de septiembre de 2020.
^ "¿Yahoo está prohibiendo a Alá?". Kallahar's Place. Archivado desde el original el 14 de enero de 2016. Consultado el 24 de febrero de 2011 .
^ Rubin, Daniel. "Cuando tu nombre se vuelve en tu contra". The Philadelphia Inquirer . Archivado desde el original el 5 de agosto de 2008. Consultado el 3 de agosto de 2008 .
^ "E-Rate And Filtering: A Review Of The Children's Internet Protection Act". Audiencias del Congreso. General. Energía y Comercio, Subcomité de Telecomunicaciones e Internet. 4 de abril de 2001.
^ "El nombre de F-Word Town es censurado por un filtro de Internet". Archivado desde el original el 1 de diciembre de 2008. Consultado el 27 de julio de 2011 .{{cite news}}: CS1 maint: bot: estado de URL original desconocido ( enlace )
^ Chin, Josh (6 de julio de 2011). "Tras los rumores de la muerte de Jiang, los ríos de China desaparecen" . The Wall Street Journal . Archivado desde el original el 13 de agosto de 2011.
^ Molloy, Mark (27 de febrero de 2018). «Los amantes del vino no pueden comprar bebidas de Borgoña en Google, ya que el gigante de Internet toma medidas drásticas contra las búsquedas de "armas"». The Telegraph . Archivado desde el original el 2 de marzo de 2018. Consultado el 27 de febrero de 2018 .
^ "Yahoo admite haber manipulado correos electrónicos". BBC News . 19 de julio de 2002. Archivado desde el original el 26 de enero de 2021 . Consultado el 21 de junio de 2013 .
^ "Noticias duras". Need To Know 2002-07-12 . 12 de julio de 2002 . Consultado el 21 de junio de 2013 .
^ Knight, Will (15 de julio de 2002). «El filtro de seguridad del correo electrónico genera nuevas palabras». New Scientist . Archivado desde el original el 24 de septiembre de 2020. Consultado el 21 de junio de 2013 .
^ "La revisión de correos electrónicos bloquea el debate sobre sexo entre los parlamentarios". BBC News . 4 de febrero de 2003. Archivado desde el original el 4 de febrero de 2021.
^ "Software bloquea el correo electrónico en galés de los diputados". BBC News . 5 de febrero de 2003. Archivado desde el original el 4 de febrero de 2021.
^ Kwintner, Adrian (5 de octubre de 2004). "El nombre del museo se confunde con pornografía". News Shopper .
^ Jones, Sam (13 de octubre de 2004). "El correo electrónico de Panto cae en el filtro de suciedad". The Guardian . Archivado desde el original el 4 de febrero de 2021.
^ "El filtro de correo electrónico bloquea la 'erección'". 30 de mayo de 2006. Archivado desde el original el 4 de febrero de 2021.
^ "La revista The Beaver cambia de nombre para poner fin a la confusión con la pornografía". The Sydney Morning Herald . Agence France-Presse . 13 de enero de 2010. Archivado desde el original el 9 de noviembre de 2020 . Consultado el 24 de febrero de 2021 .
^ Austen, Ian (24 de enero de 2010). «Los filtros web provocan el cambio de nombre de una revista». The New York Times . Archivado desde el original el 9 de noviembre de 2020. Consultado el 24 de febrero de 2021 .
^ Sheerin, Jude (29 de marzo de 2010). «Cómo los filtros antispam dictaron el destino de una revista canadiense». BBC News . Archivado desde el original el 16 de enero de 2021.
^ "Luxemburger Twitter-Neubenutzer nach 29 Minuten blockiert" [Nuevo usuario de Twitter de Luxemburgo bloqueado después de 29 minutos]. Tageblatt (en alemán). 22 de junio de 2010 . Consultado el 12 de junio de 2010 .[ enlace muerto ]
^ "Concejal de Black Country atrapado en una farsa de maricones". Birmingham Mail . 24 de febrero de 2011.
^ Tom Chatfield (17 de abril de 2013). "Las 10 mejores palabras que Internet le ha dado al inglés". The Guardian .
^ Keyes, Ralph (2010). Los innombrables: de las joyas familiares al fuego amigo: lo que decimos en lugar de lo que queremos decir. John Murray. ISBN978-1-84854-456-7.
^ Maher, Kris. "No dejes que los filtros de spam te roben el currículum". Career Journal . Archivado desde el original el 23 de octubre de 2006. Consultado el 11 de febrero de 2008 .
^ Frauenfelder, Mark (30 de junio de 2008). «Sitio de noticias homofóbicas cambia al atleta Tyson Gay por Tyson Homosexual». Boing Boing . Archivado desde el original el 4 de febrero de 2021.
^ Arthur, Charles (30 de junio de 2008). «La computadora corrige automáticamente el apellido 'gay' a... no, supongo». The Guardian . Archivado desde el original el 13 de noviembre de 2020.
^ Mantyla, Kyle (30 de junio de 2008). "Los peligros de la sustitución automática". Right Wing Watch . People for the American Way . Archivado desde el original el 25 de octubre de 2020 . Consultado el 24 de febrero de 2021 .
^ Moore, Matthew (2 de septiembre de 2008). "El error de Clbuttic: cuando los filtros de obscenidad fallan". The Telegraph . Archivado desde el original el 23 de febrero de 2020.
^ "Microsoft confirma que "Gaywood" es un apellido ofensivo, responde el señor Gaywood". Mayo de 2008. Archivado desde el original el 9 de noviembre de 2012.
^ Keating, Lauren (17 de febrero de 2016). «Estas son las palabras que Nintendo censura que aparezcan en la 3DS». Tech Times . Consultado el 14 de noviembre de 2023 .
^ Gibbs, Samuel (21 de enero de 2014). «El filtro de pornografía del Reino Unido bloquea la actualización del juego que contenía 'sexo'». The Guardian . Londres. Archivado desde el original el 11 de noviembre de 2020.
^ Mozur, Paul; Tejada, Carlos (13 de febrero de 2013). «El 'muro' de China golpea a las empresas». The Wall Street Journal . Archivado desde el original el 10 de septiembre de 2013. Consultado el 25 de mayo de 2013 .
^ "Los maricones y los guisantes caen en desgracia ante la censura de Facebook". Express & Star . Noviembre de 2013. Archivado desde el original el 10 de mayo de 2020.
^ Ferguson, Amber (22 de mayo de 2018). "Una madre orgullosa pide un pastel 'Summa Cum Laude' en línea. Publix lo censura: Summa... Laude". The Washington Post . Archivado desde el original el 22 de mayo de 2018. Consultado el 22 de mayo de 2018 .{{cite news}}: CS1 maint: bot: estado de URL original desconocido ( enlace )
^ Amatulli, Jenna (22 de mayo de 2018). "Publix censura la tarta de graduación 'Summa Cum Laude' de una adolescente". The Huffington Post . Archivado desde el original el 5 de septiembre de 2018.
^ Hern, Alex (27 de mayo de 2020). «Los filtros antipornografía impiden que Dominic Cummings sea tendencia en Twitter». The Guardian . Archivado desde el original el 20 de febrero de 2021.
^ Ferreira, Becky (15 de octubre de 2020). «Un filtro de blasfemias prohibió la palabra «hueso» en una conferencia de paleontología». Motherboard . Archivado desde el original el 23 de febrero de 2021.
^ Morris, Steven (27 de enero de 2021). «Facebook se disculpa por marcar Plymouth Hoe como término ofensivo». The Guardian . Archivado desde el original el 29 de enero de 2021.
^ Kempf, Cédric (12 de abril de 2021). "Insolite: Bitche est censurada por Facebook". Radio Mélodie (en francés).
^ Darmanin, Jules (13 de abril de 2021). «Facebook retira la página oficial de la ciudad francesa de Bitche». POLITICO . Consultado el 3 de julio de 2021 .