stringtranslate.com

Filtro de palabras

Un filtro de palabras (a veces llamado simplemente " filtro " o " censura ") es un script que se utiliza normalmente en foros de Internet o salas de chat y que escanea automáticamente las publicaciones o comentarios de los usuarios a medida que se envían y cambia o censura automáticamente palabras o frases específicas.

Los filtros de palabras más básicos buscan únicamente cadenas específicas de letras y las eliminan o sobrescriben independientemente de su contexto. Los filtros de palabras más avanzados hacen algunas excepciones en función del contexto (como filtrar "butt" pero no "butter") y los filtros de palabras más avanzados pueden usar expresiones regulares .

Funciones

Los filtros de palabras pueden cumplir diversas funciones.

Eliminación de lenguaje vulgar

Un filtro de malas palabras , también conocido como filtro de blasfemias o filtro de lenguaje, es un subsistema de software que modifica el texto para eliminar palabras consideradas ofensivas por el administrador o la comunidad de un foro en línea . Los filtros de malas palabras son comunes en las salas de chat programadas a medida y en los videojuegos en línea , principalmente los MMORPG . Esto no debe confundirse con el filtrado de contenido , que generalmente está integrado en los programas de navegación de Internet por desarrolladores externos para filtrar o bloquear sitios web específicos o tipos de sitios web. Los filtros de malas palabras generalmente son creados o implementados por los desarrolladores del servicio de Internet.

Por lo general, los filtros de palabras se utilizan para censurar el lenguaje que los operadores del foro o sala de chat consideran inapropiado. Los improperios suelen reemplazarse parcialmente, completamente o por palabras sin sentido. [1] Esto libera a los administradores o moderadores de la tarea de patrullar constantemente el foro para detectar ese tipo de lenguaje. Esto también puede ayudar al foro de mensajes a evitar el software de control de contenido instalado en las computadoras o redes de los usuarios, ya que ese software a menudo bloquea el acceso a páginas web que contienen lenguaje vulgar.

Las frases filtradas pueden reemplazarse permanentemente a medida que se guardan (ejemplo: phpBB 1.x), o la frase original puede guardarse pero mostrarse como texto censurado. En algunos programas, los usuarios pueden ver el texto detrás del filtro de palabras citando la publicación.

Los filtros de palabras malsonantes suelen aprovechar las funciones de reemplazo de cadenas integradas en el lenguaje de programación utilizado para crear el programa, para reemplazar una lista de palabras y frases inapropiadas por una variedad de alternativas. Las alternativas pueden incluir:

Algunos filtros de palabras malsonantes realizan una búsqueda simple de una cadena. Otros tienen medidas que ignoran los espacios en blanco y otros llegan al extremo de ignorar todos los caracteres no alfanuméricos y luego filtran el texto sin formato. Esto significa que si se configuró la palabra "you" para que se filtrara, también se filtrarían "yo u" o "yo!u".

Control de clichés

Los clichés (palabras o frases particulares que se reutilizan constantemente en las publicaciones, también conocidas como "memes") suelen aparecer en los foros. Algunos usuarios consideran que estos clichés son más divertidos, pero otros los consideran tediosos, especialmente cuando se usan en exceso. Los administradores pueden configurar el filtro de palabras para reemplazar el cliché molesto por una frase más embarazosa o eliminarlo por completo.

Control de vandalismo

Los foros de Internet a veces son atacados por vándalos que intentan llenar el foro con mensajes repetidos y sin sentido, o por spammers que intentan insertar enlaces a sus sitios web comerciales. El filtro de palabras del sitio puede configurarse para eliminar el texto sin sentido utilizado por los vándalos, o para eliminar todos los enlaces a sitios web específicos de las publicaciones.

Filtro de cojera

Los filtros de cojera son filtros de palabras basados ​​en texto que utilizan los sitios web basados ​​en Slash (como los foros de texto y de imágenes ) para evitar que se publiquen comentarios basura en respuesta a las historias. Algunas de las cosas que están diseñados para filtrar incluyen:

Evitar filtros

Dado que los filtros de palabras están automatizados y solo buscan secuencias particulares de caracteres , los usuarios conscientes de los filtros a veces intentarán eludirlos cambiando sus letras lo suficiente para evitar los filtros. Un usuario que intente evitar un filtro de vulgaridad podría reemplazar uno de los caracteres de la palabra ofensiva por un asterisco, un guión o algo similar. Algunos administradores responden revisando los filtros de palabras para detectar sustituciones comunes; otros pueden hacer que la evasión del filtro sea una ofensa punible por sí misma. [2] Un ejemplo simple de evadir un filtro de palabras sería ingresar símbolos entre letras o usar leet . Las técnicas más avanzadas de evasión de filtros de palabras incluyen el uso de imágenes, el uso de etiquetas ocultas o caracteres cirílicos (es decir, un ataque de suplantación de homógrafo ).

Otro método es utilizar un guión suave . Un guión suave solo se utiliza para indicar dónde se puede dividir una palabra al dividir líneas de texto y no se muestra. Al colocarlo a la mitad de una palabra, la palabra se divide y, en algunos casos, el filtro de palabras no la reconocerá.

Algunos filtros más avanzados, como los del juego en línea RuneScape , pueden detectar la omisión de palabras. Sin embargo, la desventaja de los filtros de palabras sensibles es que también se filtran frases legítimas.

Aspectos de la censura

Los filtros de palabras se codifican en los foros o salas de chat de Internet y funcionan únicamente con el material enviado al foro o sala de chat en cuestión. Esto distingue a los filtros de palabras del software de control de contenido , que normalmente se instala en la PC o red informática de un usuario final y que puede filtrar todo el contenido de Internet enviado hacia o desde la PC o red en cuestión. Dado que los filtros de palabras alteran las palabras de los usuarios sin su consentimiento, algunos usuarios aún los consideran censura , mientras que otros los consideran una parte aceptable del derecho del operador de un foro a controlar el contenido del foro.

Falsos positivos

Una peculiaridad común de los filtros de palabras, que los usuarios suelen considerar cómica o molesta, es que suelen afectar a palabras que no están destinadas a ser filtradas. Este es un problema típico cuando se filtran palabras cortas. Por ejemplo, con la palabra "culo" censurada, uno puede ver "¿Necesitas ayuda para reproducir música clásica?" en lugar de "¿Necesitas ayuda para reproducir música clásica?". Se pueden filtrar varias palabras si se ignoran los espacios en blanco, lo que hace que "como se sospecha" se convierta en "sospechoso". Prohibir una frase como "duro" hará que se filtren declaraciones inocuas como "¡Eso fue duro!" y "Lo siento, fui duro contigo", en "¡Eso fue un e!" y "Lo siento, fui tú".

Algunas palabras que han sido filtradas accidentalmente pueden convertirse en reemplazos de palabras profanas. Un ejemplo de esto se encuentra en el foro Mystcommunity . Allí, la palabra "manuscript" fue censurada accidentalmente por contener la palabra "anus", lo que resultó en "m****cript". La palabra fue adoptada como reemplazo de "swear" y se mantuvo cuando el foro se mudó, y se usan muchos sustitutos, como "scripting" (aunque principalmente por los miembros más antiguos de la comunidad).

Los nombres de lugares pueden filtrarse de forma involuntaria debido a que contienen partes de malas palabras. En los primeros años de Internet, el nombre de lugar británico Penistone solía filtrarse de los filtros de spam y malas palabras. [3]

Implementación

Muchos juegos, como World of Warcraft y, más recientemente, Habbo Hotel y RuneScape, permiten a los usuarios desactivar los filtros. Otros juegos, especialmente los juegos multijugador masivos en línea gratuitos , como Knight Online, no cuentan con esta opción.

Otros juegos como Medal of Honor y Call of Duty (excepto Call of Duty: World at War , Call of Duty: Black Ops , Call of Duty: Black Ops 2 y Call of Duty: Black Ops 3 ) no ofrecen a los usuarios la opción de desactivar el lenguaje inapropiado escrito en el guión, mientras que Gears of War sí lo hace.

Además de los juegos, los filtros de blasfemias se pueden utilizar para moderar el contenido generado por los usuarios en foros, blogs, aplicaciones de redes sociales, sitios web para niños y reseñas de productos. Hay muchas API de filtros de blasfemias como WebPurify que ayudan a reemplazar las malas palabras por otros caracteres (por ejemplo, "@#$!"). Estas API de filtros de blasfemias funcionan con el método de búsqueda y reemplazo de blasfemias.

Véase también

Referencias

  1. ^ "¿Cuándo diablos conseguimos un filtro de palabras?" . Consultado el 1 de octubre de 2006 .
  2. ^ "Condiciones de uso de GameFAQs". GameFAQs . Consultado el 4 de agosto de 2008 .
  3. ^ Sheerin, Jude (29 de marzo de 2010). "Cómo los filtros de spam dictaron el destino de una revista canadiense". BBC Online . Consultado el 5 de abril de 2011 .

Enlaces externos

reemplaza caracteres con caracteres Unicode similares de diferentes conjuntos de caracteres (por ejemplo, cirílico)