stringtranslate.com

problema de scunthorpe

Un ejemplo del problema de Scunthorpe en Wikipedia debido a una expresión regular que identifica " cunt " en el nombre de usuario.

El problema de Scunthorpe es el bloqueo involuntario de contenido en línea por parte de un filtro de spam o un motor de búsqueda porque su texto contiene una cadena (o subcadena ) de letras que parecen tener un significado obsceno o inaceptable. Los nombres, abreviaturas y términos técnicos que se citan con mayor frecuencia como afectados por el problema.

El problema surge porque las computadoras pueden identificar fácilmente cadenas de texto dentro de un documento, pero interpretar palabras de este tipo requiere una habilidad considerable para interpretar una amplia gama de contextos , posiblemente en muchas culturas , lo cual es una tarea extremadamente difícil. Como resultado, las reglas de bloqueo amplias pueden generar falsos positivos que afecten a muchas frases inocentes.

Etimología y origen

El problema recibió su nombre de un incidente ocurrido en 1996 en el que el filtro de malas palabras de AOL impidió a los residentes de la ciudad de Scunthorpe , en el norte de Lincolnshire , Inglaterra, crear cuentas en AOL, porque el nombre de la ciudad contiene la subcadena " cunt ". [1] A principios de la década de 2000, los filtros SafeSearch de Google cometieron el mismo error, y los servicios y empresas locales que incluían a Scunthorpe en sus nombres o URL se encontraban entre los excluidos por error de aparecer en los resultados de búsqueda. [2]

Soluciones alternativas

El problema de Scunthorpe es difícil de resolver por completo debido a la dificultad de crear un filtro capaz de comprender palabras en contexto. [3] [4]

Una solución implica crear una lista blanca de falsos positivos conocidos. El filtro puede ignorar cualquier palabra que aparezca en la lista blanca, aunque contenga texto que de otro modo no estaría permitido. [5]

Otros ejemplos

Las decisiones equivocadas tomadas por los filtros de obscenidad incluyen:

Nombres de dominio web y registros de cuentas rechazados

Búsquedas web bloqueadas

Correos electrónicos bloqueados

Bloqueado para palabras con múltiples significados

Artículos de noticias

Otro

Ver también

Referencias

  1. ^ Clive Feather (25 de abril de 1996). Peter G. Neumann (ed.). "¡AOL censura el nombre de una ciudad británica!". El compendio de riesgos . 18 (7).
  2. ^ ab McCullagh, Declan (23 de abril de 2004). "El cinturón de castidad de Google está demasiado apretado". CNET . Archivado desde el original el 16 de junio de 2011.
  3. ^ Oberhaus, Daniel (29 de agosto de 2018). "La vida en Internet es difícil cuando tu apellido es 'Butts'". Vicio . Consultado el 31 de julio de 2022 .
  4. ^ Gellis, Cathy (31 de agosto de 2018). "El problema de Scunthorpe y por qué la IA no es la panacea para moderar el contenido de la plataforma a escala". Techdirt . Consultado el 31 de julio de 2022 .
  5. ^ Veale, Tony (2021). Tu ingenio es mi orden: construir IA con sentido del humor. Prensa del MIT. pag. 231.ISBN 978-0-262-04599-5. OCLC  1221016857.
  6. ^ Festa, Paul (27 de abril de 1998). "Dominio alimentario encontrado" obsceno"". Noticias.com . Archivado desde el original el 10 de mayo de 2020.
  7. ^ "Foire aux preguntas". radio-canada.ca. Archivado desde el original el 21 de octubre de 2012 . Consultado el 24 de febrero de 2011 .
  8. ^ Barker, Garry (26 de febrero de 2004). "Cómo el señor C0ckburn luchó contra el spam". El Sydney Morning Herald . Archivado desde el original el 3 de septiembre de 2009.
  9. ^ Cockburn, Craig (9 de marzo de 2010). "La BBC falla: mi nombre correcto no está permitido". blog.siliconglen.com . Archivado desde el original el 30 de septiembre de 2020.
  10. ^ "¿Yahoo está prohibiendo a Alá?". El lugar de Kallahar. Archivado desde el original el 14 de enero de 2016 . Consultado el 24 de febrero de 2011 .
  11. ^ Rubin, Daniel. "Cuando tu nombre se vuelve en tu contra". El Philadelphia Inquirer . Archivado desde el original el 5 de agosto de 2008 . Consultado el 3 de agosto de 2008 .
  12. ^ "E-Rate y filtrado: una revisión de la Ley de protección infantil en Internet". Audiencias del Congreso. General. Energía y Comercio, Subcomité de Telecomunicaciones e Internet. 4 de abril de 2001.
  13. ^ "El nombre de F-Word Town es censurado por un filtro de Internet". Archivado desde el original el 1 de diciembre de 2008 . Consultado el 27 de julio de 2011 .{{cite news}}: Mantenimiento CS1: bot: estado de la URL original desconocido ( enlace )
  14. ^ Chin, Josh (6 de julio de 2011). "Tras los rumores de muerte de Jiang, los ríos de China desaparecen" . El periodico de Wall Street . Archivado desde el original el 13 de agosto de 2011.
  15. ^ Molloy, Mark (27 de febrero de 2018). "Los amantes del vino no pueden comprar bebidas de Borgoña en Google mientras el gigante de Internet toma medidas enérgicas contra las búsquedas de 'armas'". El Telégrafo . Archivado desde el original el 2 de marzo de 2018 . Consultado el 27 de febrero de 2018 .
  16. ^ "Yahoo admite haber dañado el correo electrónico". Noticias de la BBC . 19 de julio de 2002. Archivado desde el original el 26 de enero de 2021 . Consultado el 21 de junio de 2013 .
  17. ^ "Noticias duras". Necesito saber 2002-07-12 . 12 de julio de 2002 . Consultado el 21 de junio de 2013 .
  18. ^ Caballero, Will (15 de julio de 2002). "El filtro de seguridad del correo electrónico genera nuevas palabras". Científico nuevo . Archivado desde el original el 24 de septiembre de 2020 . Consultado el 21 de junio de 2013 .
  19. ^ "La investigación de correo electrónico bloquea el debate sexual de los parlamentarios". Noticias de la BBC . 4 de febrero de 2003. Archivado desde el original el 4 de febrero de 2021.
  20. ^ "El software bloquea el correo electrónico galés de los parlamentarios". Noticias de la BBC . 5 de febrero de 2003. Archivado desde el original el 4 de febrero de 2021.
  21. ^ Kwintner, Adrian (5 de octubre de 2004). "Se confunde el nombre del museo con el porno". Comprador de noticias .
  22. ^ Jones, Sam (13 de octubre de 2004). "El correo electrónico de Panto falla en el filtro de suciedad". El guardián . Archivado desde el original el 4 de febrero de 2021.
  23. ^ "El filtro de correo electrónico bloquea la construcción'". 30 de mayo de 2006. Archivado desde el original el 4 de febrero de 2021.
  24. ^ "Se cambió el nombre de la revista Beaver para poner fin a la confusión con la pornografía". El Sydney Morning Herald . Agencia France-Presse . 13 de enero de 2010. Archivado desde el original el 9 de noviembre de 2020 . Consultado el 24 de febrero de 2021 .
  25. ^ Austen, Ian (24 de enero de 2010). "Los filtros web provocan un cambio de nombre en una revista". Los New York Times . Archivado desde el original el 9 de noviembre de 2020 . Consultado el 24 de febrero de 2021 .
  26. ^ Sheerin, Jude (29 de marzo de 2010). "Cómo los filtros de spam dictaron el destino de la revista canadiense". Noticias de la BBC . Archivado desde el original el 16 de enero de 2021.
  27. ^ "Luxemburger Twitter-Neubenutzer nach 29 Minuten blockiert" [Nuevo usuario de Twitter de Luxemburgo bloqueado después de 29 minutos]. Tageblatt (en alemán). 22 de junio de 2010 . Consultado el 12 de junio de 2010 .[ enlace muerto ]
  28. ^ "Concejal del país negro atrapado en una farsa de maricones". Correo de Birmingham . 24 de febrero de 2011.
  29. ^ Tom Chatfield (17 de abril de 2013). "Las 10 mejores palabras que Internet le ha dado al inglés". El guardián .
  30. ^ Keyes, Ralph (2010). Innombrables: de las joyas familiares al fuego amigo: lo que decimos en lugar de lo que queremos decir. Juan Murray. ISBN 978-1-84854-456-7.
  31. ^ Maher, Kris. "No permita que los filtros de spam se apoderen de su currículum". Diario de carrera . Archivado desde el original el 23 de octubre de 2006 . Consultado el 11 de febrero de 2008 .
  32. ^ Frauenfelder, Mark (30 de junio de 2008). "El sitio de noticias homofóbico cambia al atleta Tyson Gay a Tyson Homosexual". Boing Boing . Archivado desde el original el 4 de febrero de 2021.
  33. ^ Arthur, Charles (30 de junio de 2008). "La computadora corrige automáticamente el apellido 'gay' a... no, adivinas". El guardián . Archivado desde el original el 13 de noviembre de 2020.
  34. ^ Mantyla, Kyle (30 de junio de 2008). "Los peligros del reemplazo automático". Vigilancia del ala derecha . Gente por el estilo americano . Archivado desde el original el 25 de octubre de 2020 . Consultado el 24 de febrero de 2021 .
  35. ^ Moore, Matthew (2 de septiembre de 2008). "El error clbuttico: cuando los filtros de obscenidad fallan". El Telégrafo . Archivado desde el original el 23 de febrero de 2020.
  36. ^ "Microsoft confirma que" Gaywood "es un apellido ofensivo, responde el Sr. Gaywood". Mayo de 2008. Archivado desde el original el 9 de noviembre de 2012.
  37. ^ Keating, Lauren (17 de febrero de 2016). "Estas son las palabras que los censores de Nintendo aparecen en la 3DS". Tiempos tecnológicos . Consultado el 14 de noviembre de 2023 .
  38. ^ Mozur, Pablo; Tejada, Carlos (13 de febrero de 2013). "El 'muro' de China golpea a los negocios". El periodico de Wall Street . Archivado desde el original el 10 de septiembre de 2013 . Consultado el 25 de mayo de 2013 .
  39. ^ "Los maricones y los guisantes caen en desgracia con los censores de Facebook". Expreso y estrella . Noviembre de 2013. Archivado desde el original el 10 de mayo de 2020.
  40. ^ Gibbs, Samuel (21 de enero de 2014). "El filtro de pornografía del Reino Unido bloquea la actualización del juego que contenía 'sexo'". El guardián . Londres. Archivado desde el original el 11 de noviembre de 2020.
  41. ^ Ferguson, Amber (22 de mayo de 2018). "Mamá orgullosa pide pastel 'Summa Cum Laude' en línea. Publix lo censura: Summa… Laude". El Washington Post . Archivado desde el original el 22 de mayo de 2018 . Consultado el 22 de mayo de 2018 .{{cite news}}: Mantenimiento CS1: bot: estado de la URL original desconocido ( enlace )
  42. ^ Amatulli, Jenna (22 de mayo de 2018). "Pastel de graduación 'Summa Cum Laude' de Publix Censors Teen". El Correo Huffington . Archivado desde el original el 5 de septiembre de 2018.
  43. ^ Hern, Alex (27 de mayo de 2020). "Los filtros anti-porno impiden que Dominic Cummings sea tendencia en Twitter". El guardián . Archivado desde el original el 20 de febrero de 2021.
  44. ^ Ferreira, Becky (15 de octubre de 2020). "Un filtro de malas palabras prohibió la palabra 'hueso' en una conferencia de paleontología". Tarjeta madre . Archivado desde el original el 23 de febrero de 2021.
  45. ^ Morris, Steven (27 de enero de 2021). "Facebook se disculpa por marcar Plymouth Hoe como término ofensivo". El guardián . Archivado desde el original el 29 de enero de 2021.
  46. ^ Kempf, Cédric (12 de abril de 2021). "Insolite: Bitche est censurada por Facebook". Radio Mélodie (en francés).
  47. ^ Darmanin, Jules (13 de abril de 2021). "Facebook elimina la página oficial de la ciudad francesa de Bitche". POLITICO . Consultado el 3 de julio de 2021 .