stringtranslate.com

filtro de palabras

Un filtro de palabras (a veces denominado simplemente " filtro " o " censura ") es un script que se utiliza normalmente en foros de Internet o salas de chat que escanea automáticamente las publicaciones o comentarios de los usuarios a medida que se envían y cambia o censura automáticamente palabras o frases concretas.

Los filtros de palabras más básicos buscan sólo cadenas de letras específicas y las eliminan o sobrescriben independientemente de su contexto. Los filtros de palabras más avanzados hacen algunas excepciones por contexto (como filtrar "trasero" pero no "mantequilla"), y los filtros de palabras más avanzados pueden usar expresiones regulares .

Funciones

Los filtros de palabras pueden cumplir varias funciones.

Eliminación de lenguaje vulgar.

Un filtro de malas palabras , también conocido como filtro de malas palabras o filtro de lenguaje , es un subsistema de software que modifica el texto para eliminar palabras consideradas ofensivas por el administrador o la comunidad de un foro en línea . Los filtros de malas palabras son comunes en salas de chat programadas de forma personalizada y en videojuegos en línea , principalmente MMORPG . Esto no debe confundirse con el filtrado de contenidos , que normalmente está integrado en los programas de navegación de Internet por parte de desarrolladores externos para filtrar o bloquear sitios web o tipos de sitios web específicos. Los filtros de malas palabras suelen ser creados o implementados por los desarrolladores del servicio de Internet.

Lo más habitual es que los filtros de palabras se utilicen para censurar el lenguaje que los operadores del foro o sala de chat consideran inapropiado. Los insultos suelen ser reemplazados parcialmente, completamente o reemplazados por palabras sin sentido. [1] Esto libera a los administradores o moderadores de la tarea de patrullar constantemente el foro para vigilar dicho lenguaje. Esto también puede ayudar al foro a evitar el software de control de contenido instalado en las computadoras o redes de los usuarios, ya que dicho software a menudo bloquea el acceso a páginas web que contienen lenguaje vulgar.

Las frases filtradas pueden reemplazarse permanentemente a medida que se guardan (ejemplo: phpBB 1.x), o la frase original puede guardarse pero mostrarse como texto censurado. En algunos programas, los usuarios pueden ver el texto detrás del filtro de palabras citando la publicación.

Los filtros de malas palabras normalmente aprovechan las funciones de reemplazo de cadenas integradas en el lenguaje de programación utilizado para crear el programa, para intercambiar una lista de palabras y frases inapropiadas con una variedad de alternativas. Las alternativas pueden incluir:

Algunos filtros de malas palabras hacen una búsqueda simple de una cadena. Otros tienen medidas que ignoran los espacios en blanco y otros llegan incluso a ignorar todos los caracteres no alfanuméricos y luego filtrar el texto sin formato. Esto significa que si la palabra "tú" estuviera configurada para ser filtrada, "tú" o "yo!u" también se filtrarían.

Control de clichés

Los clichés (palabras o frases particulares que se reutilizan constantemente en las publicaciones, también conocidos como "memes") a menudo se desarrollan en los foros. Algunos usuarios encuentran que estos clichés aumentan la diversión, pero otros los encuentran tediosos, especialmente cuando se usan en exceso. Los administradores pueden configurar el filtro de palabras para reemplazar el molesto cliché con una frase más vergonzosa o eliminarlo por completo.

Control de vandalismo

Los foros de Internet a veces son atacados por vándalos que intentan llenar el foro con repetidos mensajes sin sentido, o por spammers que intentan insertar enlaces a sus sitios web comerciales. El filtro de palabras del sitio puede configurarse para eliminar el texto sin sentido utilizado por los vándalos o para eliminar de las publicaciones todos los enlaces a sitios web concretos.

Filtro de cojera

Los filtros de cojera son filtros de palabras basados ​​en texto utilizados por sitios web basados ​​en Slash (como tableros de texto e imágenes ) para evitar que se publiquen comentarios basura en respuesta a historias. Algunas de las cosas que están diseñados para filtrar incluyen:

Eludiendo filtros

Dado que los filtros de palabras están automatizados y solo buscan secuencias particulares de caracteres , los usuarios que conocen los filtros a veces intentarán eludirlos cambiando sus letras lo suficiente para evitarlos. Un usuario que intente evitar un filtro de vulgaridad podría reemplazar uno de los caracteres de la palabra ofensiva por un asterisco, un guión o algo similar. Algunos administradores responden revisando los filtros de palabras para detectar sustituciones comunes; otros pueden convertir la evasión de filtros en un delito punible en sí mismo. [2] Un ejemplo simple de evadir un filtro de palabras sería ingresar símbolos entre letras o usar leet . Las técnicas más avanzadas de evasión de filtros de palabras incluyen el uso de imágenes, el uso de etiquetas ocultas o caracteres cirílicos (es decir, un ataque de suplantación de homógrafos ).

Otro método es utilizar un guión suave . Un guión suave solo se usa para indicar dónde se puede dividir una palabra al dividir líneas de texto y no se muestra. Al colocar esto a la mitad de una palabra, la palabra se divide y, en algunos casos, el filtro de palabras no la reconoce.

Algunos filtros más avanzados, como los del juego en línea RuneScape , pueden detectar la omisión. Sin embargo, la desventaja de los filtros de palabras sensibles es que también se filtran las frases legítimas.

Aspectos de censura

Los filtros de palabras están codificados en los foros o salas de chat de Internet y funcionan únicamente con el material enviado al foro o sala de chat en cuestión. Esto distingue los filtros de palabras del software de control de contenido , que normalmente se instala en la PC o red informática de un usuario final y que puede filtrar todo el contenido de Internet enviado hacia o desde la PC o red en cuestión. Dado que los filtros de palabras alteran las palabras de los usuarios sin su consentimiento, algunos usuarios todavía los consideran censura , mientras que otros los consideran una parte aceptable del derecho del operador del foro a controlar el contenido del foro.

Falsos positivos

Una peculiaridad común de los filtros de palabras, que a menudo los usuarios consideran cómica o irritante, es que a menudo afectan a palabras que no están destinadas a ser filtradas. Este es un problema típico cuando se filtran palabras cortas. Por ejemplo, con la palabra "culo" censurada, uno puede ver: "¿Necesitas distancia para reproducir música clásica?" en lugar de "¿Necesitas ayuda para tocar música clásica?" Se pueden filtrar varias palabras si se ignoran los espacios en blanco, lo que hace que "según se sospecha" se convierta en "sospechado". Prohibir una frase como "duro" dará como resultado que se filtren declaraciones inofensivas como "¡Eso fue difícil!" y "Perdón por haber sido duro contigo", en "¡Eso fue ae!" y "Lo siento, fui tú".

Algunas palabras que se han filtrado accidentalmente pueden convertirse en sustitutos de palabras profanas. Un ejemplo de esto se encuentra en el foro Mystcommunity . Allí, la palabra 'manuscrito' fue censurada accidentalmente por contener la palabra 'ano', lo que resultó en 'm****cript'. La palabra se adoptó como reemplazo de un juramento y se mantuvo cuando el foro cambió, y se utilizan muchos sustitutos, como " 'scripting " (aunque principalmente por los miembros mayores de la comunidad).

Los nombres de lugares pueden filtrarse involuntariamente debido a que contienen partes de malas palabras. En los primeros años de Internet, el topónimo británico Penistone a menudo se filtraba de los filtros de spam y malas palabras. [3]

Implementación

Muchos juegos, como World of Warcraft y, más recientemente, Habbo Hotel y RuneScape permiten a los usuarios desactivar los filtros. Otros juegos, especialmente los juegos multijugador masivo en línea gratuitos , como Knight Online , no tienen esa opción.

Otros juegos como Medal of Honor y Call of Duty (excepto Call of Duty: World at War , Call of Duty: Black Ops , Call of Duty: Black Ops 2 y Call of Duty: Black Ops 3 ) no ofrecen a los usuarios la opción para desactivar el lenguaje soez escrito, mientras que Gears of War lo hace.

Además de los juegos, los filtros de malas palabras se pueden utilizar para moderar el contenido generado por los usuarios en foros, blogs, aplicaciones de redes sociales, sitios web para niños y reseñas de productos. Hay muchas API de filtro de malas palabras, como WebPurify, que ayudan a reemplazar las malas palabras con otros caracteres (es decir, "@#$!"). Estas API de filtros de malas palabras funcionan con el método de búsqueda y reemplazo de malas palabras.

Ver también

Referencias

  1. ^ "¿Cuándo diablos obtuvimos un filtro de palabras?" . Consultado el 1 de octubre de 2006 .
  2. ^ "Términos de uso de GameFAQ". Preguntas frecuentes sobre el juego . Consultado el 4 de agosto de 2008 .
  3. ^ Sheerin, Jude (29 de marzo de 2010). "Cómo los filtros de spam dictaron el destino de la revista canadiense". BBC en línea . Consultado el 5 de abril de 2011 .

enlaces externos

reemplaza caracteres con caracteres Unicode similares de diferentes conjuntos de caracteres (por ejemplo, cirílico)