stringtranslate.com

Lingüística de Internet

La lingüística de Internet es un campo de la lingüística defendido por el lingüista inglés David Crystal . Estudia los nuevos estilos y formas lingüísticas que han surgido bajo la influencia de Internet y otros nuevos medios , como los mensajes de texto de los Servicios de mensajes cortos (SMS) . [1] [2] Desde el comienzo de la interacción hombre-ordenador (HCI) que dio lugar a la comunicación mediada por ordenador (CMC) y la comunicación mediada por Internet (IMC), expertos como Gretchen McCulloch [3] han reconocido que la lingüística tiene un papel contribuyente en ella, en términos de interfaz web y usabilidad. Estudiar el lenguaje emergente en Internet puede ayudar a mejorar la organización conceptual, la traducción y la usabilidad web. Dicho estudio tiene como objetivo beneficiar tanto a los lingüistas como a los usuarios de la web en conjunto. [4]

El estudio de la lingüística de Internet puede realizarse desde cuatro perspectivas principales: sociolingüística, educación, estilística y lingüística aplicada. [1] Se han desarrollado otras dimensiones como resultado de los avances tecnológicos, que incluyen el desarrollo de la Web como corpus y la difusión e influencia de las variaciones estilísticas generadas por la difusión de Internet, a través de los medios de comunicación y de las obras literarias . En vista del creciente número de usuarios conectados a Internet, el futuro lingüístico de Internet aún está por determinar, ya que siguen surgiendo nuevas tecnologías mediadas por ordenador y las personas adaptan sus idiomas para adaptarse a estos nuevos medios. [5] Internet sigue desempeñando un papel importante tanto en el estímulo de las personas como en la distracción del uso de los idiomas. [6]

Perspectivas principales

David Crystal ha identificado cuatro perspectivas principales para futuras investigaciones: la perspectiva sociolingüística, la perspectiva educativa, la perspectiva estilística y la perspectiva aplicada. [2] Las cuatro perspectivas están efectivamente interrelacionadas y se afectan entre sí.

Perspectiva sociolingüística

Esta perspectiva aborda la forma en que la sociedad percibe el impacto del desarrollo de Internet en los idiomas. [1] La llegada de Internet ha revolucionado la comunicación de muchas maneras; cambió la forma en que las personas se comunican y creó nuevas plataformas con un impacto social de gran alcance. Entre las vías más importantes se incluyen, entre otras, los mensajes de texto SMS, los correos electrónicos , los grupos de chat , los mundos virtuales y la Web. [2]

La evolución de estos nuevos medios de comunicación ha suscitado mucha preocupación en relación con el modo en que se utiliza el lenguaje. Según Crystal (2005), estas preocupaciones no carecen de fundamento ni son inéditas en la historia: surgen casi siempre cuando un nuevo avance tecnológico influye en los idiomas, como se vio en el siglo XV cuando se introdujo la imprenta , en el siglo XIX cuando se inventó el teléfono y en el siglo XX cuando la radiodifusión empezó a penetrar en nuestra sociedad. [2]

A nivel personal, las CMC como la mensajería de texto SMS y el correo electrónico móvil ( push mail ) han mejorado enormemente la comunicación instantánea. [2] Algunos ejemplos incluyen el iPhone y el BlackBerry .

En las escuelas, no es raro que los educadores y los estudiantes reciban cuentas de correo electrónico personalizadas para fines de comunicación e interacción. Las discusiones en el aula se están llevando cada vez más a Internet en forma de foros de discusión. Por ejemplo, en la Universidad Tecnológica de Nanyang , los estudiantes participan en el aprendizaje colaborativo en el portal de la universidad, edveNTUre, donde participan en discusiones en foros y cuestionarios en línea y ven podcasts en streaming preparados por sus instructores de curso, entre otros. iTunes U en 2008 comenzó a colaborar con las universidades cuando convirtieron el servicio de música de Apple en una tienda que ofrece conferencias académicas y materiales escolares de forma gratuita; se han asociado con más de 600 instituciones en 18 países, incluidas las universidades de Oxford , Cambridge y Yale . [7]

Se prevé que estas formas de redes sociales y medios académicos aumenten a medida que los educadores de todo el mundo sigan buscando nuevas formas de interactuar mejor con los estudiantes. Es habitual que los estudiantes de la Universidad de Nueva York interactúen con “oradores invitados que dan su opinión a través de Skype , personal de la biblioteca que brinda apoyo a través de mensajería instantánea y estudiantes que acceden a los recursos de la biblioteca desde fuera del campus”. [8] Esto afectará la forma en que se utiliza el lenguaje a medida que los estudiantes y los profesores comiencen a utilizar más estas plataformas CMC. [8]

En el ámbito profesional, es habitual que las empresas tengan sus ordenadores y portátiles conectados a Internet (mediante una conexión a Internet por cable o inalámbrica ) y que los empleados tengan cuentas de correo electrónico individuales. Esto facilita enormemente la comunicación interna (entre el personal de la empresa) y externa (con otras partes fuera de la propia organización). Las comunicaciones móviles, como los teléfonos inteligentes, se están abriendo camino cada vez más en el mundo corporativo. Por ejemplo, en 2008, Apple anunció su intención de intensificar activamente sus esfuerzos para ayudar a las empresas a incorporar el iPhone a su entorno empresarial, facilitado por los avances tecnológicos en la racionalización de las funciones integradas (correo electrónico push, calendario y gestión de contactos) mediante ActiveSync . [7]

En general, estas nuevas formas de comunicación que se han hecho posibles gracias a Internet han alterado la forma en que la gente utiliza el lenguaje: hay una mayor informalidad y, en consecuencia, un creciente temor a su deterioro. Sin embargo, como dice David Crystal, esto debería verse como algo positivo, ya que refleja el poder de la creatividad de un idioma. [2]

Temas

La sociolingüística de Internet también puede examinarse a través de cinco temas interconectados. [9]

  1. Multilingüismo : analiza la prevalencia y el estado de varios idiomas en Internet.
  2. Cambio lingüístico : desde una perspectiva sociolingüística, el cambio lingüístico se ve influido por las limitaciones físicas de la tecnología (por ejemplo, el texto mecanografiado) y las prioridades socioeconómicas cambiantes, como la globalización. Se analizan los cambios lingüísticos a lo largo del tiempo, con especial énfasis en la jerga de Internet .
  3. Discurso conversacional – Explora los cambios en los patrones de interacción social y práctica comunicativa en Internet.
  4. Difusión estilística: implica el estudio de la difusión de las jergas de Internet y las formas lingüísticas relacionadas hasta llegar al uso común. A medida que el lenguaje cambia, el discurso conversacional y la difusión estilística se superponen con el aspecto de la estilística del lenguaje.
    Ver más abajo: Perspectiva estilística .
  5. Metalenguaje y lingüística popular : implica observar la forma en que se etiquetan y discuten estas formas y cambios lingüísticos en Internet (por ejemplo, el impacto de la jerga de Internet resultó en la "muerte" del apóstrofe y la pérdida de la mayúscula).

Perspectiva educativa

La perspectiva educativa de la lingüística de Internet examina el impacto de Internet en el uso formal del lenguaje , específicamente en el inglés estándar , que a su vez afecta la educación lingüística . [2] El aumento y la rápida difusión del uso de Internet ha traído consigo nuevas características lingüísticas específicas solo de la plataforma de Internet. Estas incluyen, pero no se limitan a, un aumento en el uso del lenguaje escrito informal, inconsistencia en los estilos y estilísticas escritas y el uso de nuevas abreviaturas en chats de Internet y mensajes de texto SMS, donde las limitaciones de la tecnología en el recuento de palabras contribuyeron al surgimiento de nuevas abreviaturas. [1] Tales acrónimos existen principalmente por razones prácticas: para reducir el tiempo y el esfuerzo necesarios para comunicarse a través de estos medios, además de las limitaciones tecnológicas. Ejemplos de acrónimos comunes incluyen lol (por "reírse a carcajadas"; una expresión general de risa), omg ("oh my god") y gtg ("got to go"). [10]

La perspectiva educativa se ha establecido considerablemente en la investigación sobre el impacto de Internet en la educación de idiomas. Es un aspecto importante y crucial, ya que afecta e involucra la educación de las generaciones actuales y futuras de estudiantes en el uso apropiado y oportuno del lenguaje informal que surge del uso de Internet . Existe preocupación por la creciente infiltración del uso del lenguaje informal y el uso incorrecto de palabras en situaciones académicas o formales, como el uso de palabras casuales como "guy" o la elección de la palabra "preclude" en lugar de "precede" en trabajos académicos por parte de los estudiantes. También hay problemas con la ortografía y la gramática que ocurren con una mayor frecuencia entre los trabajos académicos de los estudiantes, como lo notan los educadores, siendo el uso de abreviaturas como "u" para "you" y "2" para "to" las más comunes. [11]

Los lingüistas y profesores como Eleanor Johnson sospechan que los errores generalizados en la escritura están estrechamente relacionados con el uso de Internet, donde los educadores han informado de nuevos tipos de errores ortográficos y gramaticales en los trabajos de los estudiantes. Sin embargo, no hay evidencia científica que confirme la conexión propuesta. [12] Naomi S. Baron sostiene en Always On que los escritos de los estudiantes sufren poco impacto por el uso de la comunicación mediada por Internet (IMC), como el chat de Internet, los mensajes de texto SMS y el correo electrónico. [13] Un estudio de 2009 publicado por el British Journal of Developmental Psychology descubrió que los estudiantes que enviaban mensajes de texto regularmente (enviaban mensajes por SMS usando un teléfono móvil) mostraban una gama más amplia de vocabulario, y esto puede tener un impacto positivo en su desarrollo de la lectura. [14]

Aunque el uso de Internet ha dado lugar a una estilística que no se considera apropiada para el uso académico y formal del lenguaje, su uso no puede obstaculizar la enseñanza de idiomas, sino más bien facilitarla. Internet ha demostrado de diferentes maneras que puede proporcionar beneficios potenciales para mejorar el aprendizaje de idiomas, especialmente en el aprendizaje de una segunda lengua o de una lengua extranjera . La enseñanza de idiomas a través de Internet en relación con la lingüística de Internet se aplica, de forma más significativa, a través del aspecto comunicativo (uso de correos electrónicos, foros de debate , mensajería instantánea , blogs , etc.). [15] La comunicación interactiva interactiva permite una mayor interacción entre los estudiantes de idiomas y los hablantes nativos del idioma, lo que permite una mayor corrección de errores y mejores oportunidades de aprendizaje del idioma estándar, lo que permite en el proceso la adquisición de habilidades específicas como la negociación y la persuasión. [15]

Perspectiva estilística

Esta perspectiva examina cómo Internet y sus tecnologías relacionadas han fomentado nuevas y diferentes formas de creatividad en el lenguaje, especialmente en la literatura. [2] Considera a Internet como un medio a través del cual han surgido nuevos fenómenos lingüísticos. Este nuevo modo de lenguaje es interesante de estudiar porque es una amalgama de lenguajes tanto hablados como escritos. Por ejemplo, la escritura tradicional es estática en comparación con la naturaleza dinámica del nuevo lenguaje en Internet, donde las palabras pueden aparecer en diferentes colores y tamaños de fuente en la pantalla de la computadora. [16] Sin embargo, este nuevo modo de lenguaje también contiene otros elementos que no se encuentran en los lenguajes naturales. Un ejemplo es el concepto de encuadre que se encuentra en los correos electrónicos y los foros de discusión. Al responder a los correos electrónicos, las personas generalmente usan el mensaje de correo electrónico del remitente como un marco para escribir sus propios mensajes. Pueden elegir responder a ciertas partes de un mensaje de correo electrónico y dejar fuera otras partes. En los foros de discusión, uno puede comenzar un nuevo hilo, y cualquier persona, independientemente de su ubicación física, puede responder a la idea o pensamiento que se expresó a través de Internet. Esto es algo que generalmente no se encuentra en el lenguaje escrito. [16]

Las investigaciones futuras también incluyen nuevas variedades de expresiones que Internet y sus diversas tecnologías están produciendo constantemente y sus efectos no sólo en los lenguajes escritos sino también en sus formas habladas. [2] El estilo comunicativo del lenguaje de Internet se observa mejor en los canales CMC a continuación, ya que a menudo hay intentos de superar las limitaciones tecnológicas, como los retrasos en el tiempo de transmisión, y restablecer señales sociales que a menudo son vagas en el texto escrito. [9]

Teléfonos móviles

Los teléfonos móviles (también llamados celulares) tienen un potencial expresivo más allá de sus funciones comunicativas básicas. Esto se puede ver en concursos de poesía por mensajes de texto como el organizado por The Guardian . [2] El límite de 160 caracteres impuesto por el teléfono celular ha motivado a los usuarios a ejercitar su creatividad lingüística para superarlos. Un ejemplo similar de nueva tecnología con restricciones de caracteres es Twitter , que tiene un límite de 280 caracteres. Ha habido debates sobre si estas nuevas formas abreviadas introducidas en los Tweets de los usuarios son "perezosas" o si son fragmentos creativos de comunicación. A pesar del debate en curso, no hay duda de que Twitter ha contribuido al panorama lingüístico con nuevas jergas y también ha traído consigo una nueva dimensión de la comunicación. [17]

El teléfono móvil también ha creado un nuevo género literario: las novelas para móviles . Una novela típica para móviles consta de varios capítulos, que los lectores descargan en entregas cortas. Estas novelas están en su forma "en bruto", ya que no pasan por procesos de edición como las novelas tradicionales. Están escritas en frases cortas, similares a los mensajes de texto. [18] Los autores de estas novelas también pueden recibir comentarios y nuevas ideas de sus lectores a través de correos electrónicos o canales de comentarios en línea. A diferencia de la escritura de novelas tradicionales, las ideas de los lectores a veces se incorporan a la trama, o los autores también pueden decidir cambiar la trama de su historia de acuerdo con la demanda y la popularidad de su novela (normalmente medida por el número de descargas). [19] A pesar de su popularidad, también ha habido críticas con respecto a la "falta de vocabulario diverso" de las novelas y la mala gramática. [20]

Blogs

Los blogs han traído consigo nuevas formas de escribir diarios y, desde una perspectiva lingüística, el lenguaje utilizado en los blogs está "en su forma más 'desnuda'", [2] publicado para que el mundo lo vea sin pasar por el proceso de edición formal. Esto es lo que hace que los blogs se destaquen porque casi todas las demás formas de lenguaje impreso han pasado por alguna forma de edición y estandarización. [21] David Crystal afirmó que los blogs eran "el comienzo de una nueva etapa en la evolución del lenguaje escrito". [2] Los blogs se han vuelto tan populares que se han expandido más allá de los blogs escritos, [22] con la aparición del fotoblog , el videoblog , el audioblog y el moblog . Estos desarrollos en los blogs interactivos han creado nuevas convenciones y estilos lingüísticos, y se espera que surjan más en el futuro. [21]

Mundos virtuales

Los mundos virtuales permiten comprender cómo los usuarios están adaptando el uso del lenguaje natural para comunicarse en estos nuevos medios. El lenguaje de Internet que ha surgido a través de las interacciones de los usuarios en salas de chat basadas en texto y mundos simulados por computadora ha llevado al desarrollo de jergas dentro de las comunidades digitales. Algunos ejemplos de estas son " pwn " y " noob ". Los emoticones son otros ejemplos de cómo los usuarios han adaptado diferentes expresiones para adaptarse a las limitaciones de la comunicación en el ciberespacio, una de las cuales es la "pérdida de emotividad". [23]

La comunicación en nichos como los juegos de rol (RPG) de dominios multiusuario (MUD) y mundos virtuales es altamente interactiva, con énfasis en la velocidad, brevedad y espontaneidad. Como resultado, la CMC es generalmente más vibrante, volátil, desestructurada y abierta. A menudo hay una organización compleja de secuencias y estructuras de intercambio evidentes en la conexión de hilos conversacionales y turnos cortos. Algunas de las estrategias de CMC utilizadas incluyen la capitalización de palabras como EMPHASIS , el uso de símbolos como el asterisco para encerrar palabras como se ve en *stress* y el uso creativo de la puntuación como ???!?!?!? . [9] Los símbolos también se utilizan para funciones del discurso, como el asterisco como marcador de reparación conversacional y las flechas y quilates como marcadores de deixis y referentes . [24] [25] Además de contribuir a estas nuevas formas en el lenguaje, los mundos virtuales también se están utilizando para enseñar idiomas. El aprendizaje de idiomas en mundos virtuales ofrece a los estudiantes simulaciones de entornos de la vida real, lo que les permite encontrar formas creativas de mejorar sus habilidades lingüísticas. Los mundos virtuales son buenas herramientas para el aprendizaje de idiomas entre los estudiantes más jóvenes porque ya ven esos lugares como un "lugar natural para aprender y jugar". [26]

Correo electrónico

Una de las tecnologías relacionadas con Internet más populares que se estudian desde esta perspectiva es el correo electrónico, que ha ampliado la estilística de los idiomas de muchas maneras. Un estudio realizado sobre el perfil lingüístico de los correos electrónicos ha demostrado que existe una combinación de estilos de habla y escritura en términos de formato, gramática y estilo. [27] El correo electrónico está reemplazando rápidamente a la escritura de cartas tradicionales debido a su comodidad, velocidad y espontaneidad. [28] A menudo se lo relaciona con la informalidad, ya que parece temporal y se puede borrar fácilmente. Sin embargo, a medida que este medio de comunicación madura, el correo electrónico ya no se limita al envío de mensajes informales entre amigos y familiares. En cambio, la correspondencia comercial se lleva a cabo cada vez más a través de correos electrónicos. Las personas que buscan empleo también utilizan el correo electrónico para enviar sus currículums a empleadores potenciales. El resultado de un movimiento hacia usos más formales será un medio que represente una gama de estilísticas formales e informales. [21]

Aunque se ha culpado al correo electrónico del aumento del uso del lenguaje informal por parte de los estudiantes en sus trabajos escritos, David Crystal sostiene que el correo electrónico "no es una amenaza para la enseñanza de idiomas", porque el correo electrónico, con su variedad de expresividad estilística, puede actuar como un ámbito para que los estudiantes de idiomas tomen sus propias decisiones lingüísticas de manera responsable. Además, la alta propensión de las generaciones más jóvenes a utilizar el correo electrónico puede mejorar sus habilidades de escritura y comunicación debido a los esfuerzos que están haciendo para formular sus pensamientos e ideas, aunque sea a través de un medio digital. [28]

Mensajería instantánea

Al igual que otras formas de comunicación en línea, la mensajería instantánea también ha desarrollado sus propias siglas y formas cortas. Sin embargo, la mensajería instantánea es bastante diferente del correo electrónico y los grupos de chat porque permite a los participantes interactuar entre sí en tiempo real mientras conversan en privado. [29] Con la mensajería instantánea, existe una dimensión adicional de familiaridad entre los participantes. Este mayor grado de intimidad permite una mayor informalidad en el lenguaje y "idiosincrasias tipográficas". También hay una mayor incidencia de variación estilística porque puede haber una gran diferencia de edad entre los participantes. Por ejemplo, una nieta puede ponerse al día con su abuela a través de la mensajería instantánea. A diferencia de los grupos de chat donde los participantes se reúnen con intereses compartidos, aquí no hay presión para adaptarse al lenguaje. [21]

Perspectiva aplicada

Número de usuarios de Internet por idioma, 2020

La perspectiva aplicada considera la explotación lingüística de Internet en términos de sus capacidades comunicativas, tanto las buenas como las malas. [1] Internet ofrece una plataforma en la que los usuarios pueden experimentar el multilingüismo. Aunque el inglés sigue siendo el idioma dominante en Internet, el número de usuarios de otros idiomas va aumentando gradualmente. [9] La página sobre el uso global de Internet ofrece información sobre el número de usuarios de Internet por idioma, nacionalidad y geografía. Este entorno multilingüe sigue aumentando en diversidad a medida que más comunidades lingüísticas se conectan a Internet. Por tanto, Internet es una plataforma en la que las lenguas minoritarias y en peligro de extinción pueden intentar recuperar su uso lingüístico y/o crear conciencia. Esto se puede ver en dos casos en los que ofrece a estas lenguas oportunidades de progreso en dos aspectos importantes: la documentación lingüística y la revitalización lingüística . [1]

Documentación del idioma

En primer lugar, Internet facilita la documentación lingüística. Los archivos digitales de medios como grabaciones de audio y vídeo no sólo ayudan a preservar la documentación lingüística, sino que también permiten su difusión global a través de Internet. [30] La publicidad sobre lenguas en peligro de extinción, como Webster (2003) [ Clarificar ] ha contribuido a estimular un interés mundial por la documentación lingüística.

Fundaciones como el Proyecto de Lenguas en Peligro de Hans Rausing (HRELP), financiado por Arcadia, también contribuyen a fomentar el interés por la documentación lingüística. El HRELP es un proyecto que busca documentar las lenguas en peligro de extinción, preservar y difundir materiales de documentación, entre otras cosas. Los materiales recopilados se ponen a disposición en línea a través de su programa Archivo de Lenguas en Peligro de Extinción (ELAR).

Otros materiales en línea que respaldan la documentación de las lenguas incluyen el boletín del Archivo de Lenguas, que ofrece noticias y artículos sobre temas relacionados con las lenguas en peligro de extinción. La versión web de Ethnologue también ofrece información breve sobre todas las lenguas vivas conocidas del mundo. Al poner a disposición de los investigadores recursos e información sobre lenguas en peligro de extinción y documentación sobre lenguas en Internet, se permite aprovechar estos materiales y, por lo tanto, preservar las lenguas en peligro de extinción.

Revitalización del lenguaje

En segundo lugar, Internet facilita la revitalización de las lenguas. A lo largo de los años, el entorno digital se ha desarrollado de diversas formas sofisticadas que permiten el contacto virtual. Desde los correos electrónicos, los chats hasta la mensajería instantánea, estos entornos virtuales han ayudado a salvar la distancia espacial entre los comunicadores. El uso de correos electrónicos se ha adoptado en los cursos de idiomas para alentar a los estudiantes a comunicarse en diversos estilos, como formatos de tipo conferencia, y también para generar debates. [31] De manera similar, el uso de correos electrónicos facilita la revitalización de las lenguas en el sentido de que los hablantes de una lengua minoritaria que se mudaron a un lugar donde no se habla su lengua materna pueden aprovechar Internet para comunicarse con su familia y amigos, manteniendo así el uso de su lengua materna. Con el desarrollo y el uso creciente de la comunicación telefónica de banda ancha como Skype , la revitalización de las lenguas a través de Internet ya no está restringida a los usuarios alfabetizados. [1]

Los educadores hawaianos han estado aprovechando Internet en sus programas de revitalización del idioma. [32] El sistema de tablón de anuncios gráfico Leoki (Powerful Voice) se estableció en 1994. El contenido, la interfaz y los menús del sistema están completamente en idioma hawaiano. Está instalado en todo el sistema escolar de inmersión e incluye componentes para correos electrónicos, chat, diccionario y periódico en línea, entre otros. En instituciones de educación superior, como colegios y universidades, donde aún no está instalado el sistema Leoki, los educadores hacen uso de otros programas y herramientas de Internet, como Daedalus Interchange, correos electrónicos y la Web, para conectar a los estudiantes de lengua hawaiana con la comunidad en general. [33]

Otro uso de Internet es que los estudiantes de lenguas minoritarias escriban sobre sus culturas nativas en sus lenguas nativas para audiencias distantes. Además, en un intento de preservar su lengua y cultura, los hablantes de occitano han estado aprovechando Internet para llegar a otros hablantes de occitano de todo el mundo. Estos métodos proporcionan razones para utilizar las lenguas minoritarias comunicándose en ella. [34] [35] Además, el uso de tecnologías digitales, que la generación joven considera "cool", les resultará atractivo y, a su vez, mantendrá su interés y uso de sus lenguas nativas. [1]

Explotación de Internet

Internet también puede ser explotada para actividades como el terrorismo , el fraude en Internet y los delitos contra los niños en Internet. En los últimos años, ha habido un aumento de los delitos que implican el uso de Internet, como los correos electrónicos y el Internet Relay Chat (IRC), ya que es relativamente fácil permanecer anónimo. [36] Estas conspiraciones conllevan preocupaciones por la seguridad y la protección. Desde un punto de vista lingüístico forense, hay muchas áreas potenciales para explorar. Si bien el desarrollo de un procedimiento de protección infantil en una sala de chat basado en el filtrado de términos de búsqueda es eficaz, todavía hay una mínima literatura orientada lingüísticamente para facilitar la tarea. [1] En otras áreas, se observa que la Web Semántica ha estado involucrada en tareas como la protección de datos personales , lo que ayuda a prevenir el fraude. [37]

Dimensiones

Las dimensiones que se abordan en esta sección incluyen la consideración de la Web como un corpus y cuestiones de identificación y normalización de idiomas. Se examinan los impactos de la lingüística de Internet en la vida cotidiana desde la perspectiva de la difusión e influencia de la estilística de Internet, las tendencias de cambio lingüístico en Internet y el discurso conversacional.

La Web como corpus

Como la Web es un enorme depósito de datos y recursos, los científicos y tecnólogos del lenguaje recurren cada vez más a ella para obtener datos sobre el lenguaje. [5] Los corpus se mencionaron formalmente por primera vez en el campo de la lingüística computacional en la reunión de la ACL de 1989 en Vancouver. Se encontraron con mucha controversia, ya que carecían de integridad teórica, lo que llevó a un gran escepticismo sobre su papel en el campo, [5] hasta la publicación de la revista "Using Large Corpora" en 1993 [38] , cuando la relación entre la lingüística computacional y los corpus se aceptó ampliamente. [5]

Para establecer si la Web es un corpus, vale la pena recurrir a la definición establecida por McEnery y Wilson (1996, p. 21): [39]

En principio, cualquier conjunto de más de un texto puede ser llamado corpus. ... Pero el término “corpus”, cuando se utiliza en el contexto de la lingüística moderna, tiende con mayor frecuencia a tener connotaciones más específicas que las que ofrece esta simple definición. Estas pueden considerarse bajo cuatro encabezados principales: muestreo y representatividad, tamaño finito, formato legible por máquina y referencia estándar.

—  Tony McEnery y Andrew Wilson, Lingüística de corpus

Acercándose más a la Web como corpus, Manning y Schütze (1999, p. 120) [40] simplifican aún más la definición:

En el procesamiento del lenguaje natural estadístico , normalmente se recibe como corpus una cierta cantidad de datos de un determinado dominio de interés, sin tener ninguna influencia en su construcción. En tales casos, disponer de más datos de entrenamiento suele ser más útil que cualquier preocupación por el equilibrio, y simplemente se debe utilizar todo el texto que esté disponible.

—  Christopher Manning y Hinrich Schütze, Fundamentos del procesamiento estadístico del lenguaje

Se utilizaron los recuentos de visitas para consultas de motores de búsqueda cuidadosamente construidas para identificar órdenes de clasificación para frecuencias de sentido de palabras, como entrada para un motor de desambiguación de sentido de palabras . [41] Este método se exploró más a fondo con la introducción del concepto de un corpus paralelo donde se reúnen las páginas web existentes que existen en paralelo en idiomas locales y principales. [42] Se demostró que es posible construir un corpus específico de un idioma a partir de un solo documento en ese idioma específico. [43]

Temas

Se ha debatido mucho sobre los posibles avances en el ámbito de la Web como corpus. El desarrollo del uso de la Web como fuente de datos para la desambiguación del sentido de las palabras se adelantó en el proyecto EU MEANING en 2002. [44] Se partió del supuesto de que, dentro de un dominio, las palabras suelen tener un único significado y que los dominios son identificables en la Web. Esto se exploró más a fondo mediante el uso de tecnología Web para recopilar anotaciones manuales del sentido de las palabras en el sitio Web Word Expert.

En áreas de modelado del lenguaje , se ha utilizado la Web para abordar la escasez de datos. Se han recopilado estadísticas léxicas para resolver los anexos de frases preposicionales, [45] mientras que se han utilizado documentos web para buscar un equilibrio en el corpus. [46]

En las áreas de recuperación de información, se integró un componente de la iniciativa de evaluación TREC de la comunidad como un componente de la Web. La muestra de la Web utilizada para este ejercicio asciende a unos 100 GB y está compuesta principalmente por documentos del dominio de nivel superior .gov. [47]

Corpus Nacional Británico

El Corpus Nacional Británico contiene amplia información sobre los significados dominantes y los patrones de uso de las 10.000 palabras que forman el núcleo del inglés.

La cantidad de palabras del Corpus Nacional Británico (alrededor de 100 millones) es suficiente para muchas estrategias empíricas de aprendizaje sobre el lenguaje para lingüistas y lexicógrafos, [5] [48] y es satisfactoria para las tecnologías que utilizan información cuantitativa sobre el comportamiento de las palabras como entrada (análisis sintáctico). [49] [50]

Sin embargo, para otros fines, es insuficiente, como resultado de la naturaleza zipfiana de las frecuencias de las palabras. Debido a que la mayor parte del acervo léxico aparece menos de 50 veces en el Corpus Nacional Británico, es insuficiente para sacar conclusiones estadísticamente estables sobre dichas palabras. Además, para algunas palabras más raras, significados raros de palabras comunes y combinaciones de palabras, no se han encontrado datos. Los investigadores encuentran que los modelos probabilísticos del lenguaje basados ​​en cantidades muy grandes de datos son mejores que los basados ​​en estimaciones de conjuntos de datos más pequeños y más limpios. [5]

La Web multilingüe

La Web es claramente un corpus multilingüe. [51] Se estima que el 71% de las páginas (453 millones de 634 millones de páginas web indexadas por el motor Excite) fueron escritas en inglés, seguido del japonés (6,8%), alemán (5,1%), francés (1,8%), chino (1,5%), español (1,1%), italiano (0,9%) y sueco (0,7%). [52]

Una prueba para encontrar palabras contiguas como "respiración profunda" reveló 868.631 páginas web que contenían los términos en AlltheWeb . La cantidad encontrada a través de los motores de búsqueda es más del triple de los recuentos generados por el British National Corpus, lo que indica el tamaño significativo del corpus en inglés disponible en la Web.

El enorme tamaño del texto disponible en la Web se puede ver en el análisis de datos controlados en los que se mezclaron corpus de diferentes idiomas en diversas proporciones. El tamaño de la Web en palabras estimado por AltaVista colocó al inglés en la cima de la lista con 76.598.718.000 palabras. El siguiente es el alemán, con 7.035.850.000 palabras junto con otros 6 idiomas con más de mil millones de visitas. Incluso los idiomas con menos visitas en la Web, como el esloveno, el croata, el malayo y el turco, tienen más de 100 millones de palabras en la Web. [53] Esto revela la fuerza y ​​la precisión potenciales de usar la Web como un Corpus dado su tamaño significativo, lo que justifica mucha investigación adicional como el proyecto que actualmente lleva a cabo el Corpus Nacional Británico para explotar su escala. [5]

Desafíos

En las áreas de modelado de lenguaje, existen limitaciones en la aplicabilidad de cualquier modelo de lenguaje, ya que las estadísticas para diferentes tipos de texto serán diferentes. [54] Cuando se pone en uso una aplicación de tecnología del lenguaje (se aplica a un nuevo tipo de texto), no es seguro que el modelo de lenguaje se desempeñe de la misma manera que cuando se aplica al corpus de entrenamiento. Se ha descubierto que existen variaciones sustanciales en el rendimiento del modelo cuando cambia el corpus de entrenamiento. [55] Esta falta de tipos de teorías limita la evaluación de la utilidad del trabajo de modelado de lenguaje.

Como los textos web son fáciles de producir (en términos de costo y tiempo) y muchos autores diferentes trabajan en ellos, a menudo resulta poco preocupante la precisión. Los errores gramaticales y tipográficos se consideran formas “erróneas” que hacen que la Web sea un corpus sucio. No obstante, puede seguir siendo útil incluso con algo de ruido. [5]

La cuestión de si se deben incluir los sublenguajes sigue sin resolverse. Quienes están a favor de esta idea sostienen que, si se eliminan todos los sublenguajes, se obtendrá una visión empobrecida del lenguaje. Como el lenguaje se compone de léxicos, gramática y una amplia gama de sublenguajes diferentes, deberían incluirse. Sin embargo, no fue hasta hace poco que se convirtió en una opción viable. Encontrar un punto intermedio incluyendo algunos sublenguajes es polémico porque es una cuestión arbitraria decidir cuáles incluir y cuáles no. [5]

La decisión de qué incluir en un corpus recae en los desarrolladores del mismo, y se ha hecho con pragmatismo. [5] Los desiderata y criterios utilizados para el Corpus Nacional Británico sirven como un buen modelo para un corpus de propósito general y de lenguaje general [56], en el que el enfoque de ser representativo se reemplaza por el de ser equilibrado. [5]

Los motores de búsqueda como Google sirven como medio de acceso predeterminado a la Web y a su amplia gama de recursos lingüísticos. Sin embargo, para los lingüistas que trabajan en el campo de los corpus, esto presenta una serie de desafíos. Entre ellos, se incluyen las instancias limitadas que presentan los motores de búsqueda (1.000 o 5.000 como máximo); el contexto insuficiente para cada instancia (Google proporciona un fragmento de unas diez palabras); los resultados seleccionados según criterios que están distorsionados (desde un punto de vista lingüístico) ya que los términos de búsqueda en los títulos y encabezamientos a menudo ocupan los primeros lugares de los resultados; la incapacidad de permitir que las búsquedas se especifiquen según criterios lingüísticos, como la forma de citar una palabra o la clase de palabra; la falta de fiabilidad de las estadísticas, con resultados que varían según la carga del motor de búsqueda y muchos otros factores. En la actualidad, en vista de los conflictos de prioridades entre las diferentes partes interesadas, la mejor solución es que los lingüistas intenten corregir estos problemas por sí mismos. Esto conducirá a una gran cantidad de posibilidades que se abren en el área de aprovechar el rico potencial de la Web. [5]

Representación

A pesar del gran tamaño de la Web, puede que no sea representativa de todos los idiomas y dominios del mundo, como tampoco lo son otros corpus. Sin embargo, la enorme cantidad de texto, en numerosos idiomas y tipos de idiomas y sobre una amplia gama de temas, la convierte en un buen punto de partida que abre un gran número de posibilidades en el estudio de los corpus. [5]

Impacto de su difusión e influencia

La estilística derivada del uso de Internet se ha extendido más allá de los nuevos medios a otras áreas y plataformas, incluidas, entre otras, las películas , la música y las obras literarias . La infiltración de la estilística de Internet es importante, ya que las obras son expuestas a un público masivo, lo que refuerza ciertos estilos lingüísticos específicos de Internet que pueden no ser aceptables en formas de lenguaje estándar o más formales.

Además de la jerga de Internet , los errores gramaticales y tipográficos son características de la escritura en Internet y otros canales de comunicación social. A medida que los usuarios de Internet se acostumbran a estos errores, se infiltran progresivamente en el uso cotidiano del lenguaje, tanto en forma escrita como hablada. [1] También es común presenciar este tipo de errores en obras de medios de comunicación, desde errores tipográficos en artículos de noticias hasta errores gramaticales en anuncios e incluso jerga de Internet en diálogos de obras de teatro.

Cuanto más se incorpora Internet a la vida diaria, mayor es el impacto que tiene en el lenguaje formal. Esto es especialmente cierto en las clases de Lengua y Literatura modernas a través del uso de teléfonos inteligentes, tabletas y redes sociales. Los estudiantes están expuestos al lenguaje de Internet más que nunca y, como tal, la estructura gramatical y la jerga de Internet se filtran en su escritura formal. La inmersión total en un idioma es siempre la mejor manera de aprenderlo. Mark Lester en su libro Teaching Grammar and Usage afirma: “El mayor problema que tienen los escritores básicos para desarrollar estrategias exitosas para lidiar con los errores es simplemente su falta de exposición al inglés escrito formal ... Pensaríamos que es absurdo esperar que un estudiante domine un idioma extranjero sin una amplia exposición a él”. [57] Dado que los estudiantes están inmersos en el lenguaje de Internet, esa es la forma y la estructura que están reflejando.

Además, el auge de Internet y la inmersión general de la gente en él ha generado una nueva ola de activismo en Internet que tiene un impacto en el público todos los días. [58]

Memes

El origen del término " meme " se remonta a Richard Dawkins , un etólogo , donde lo describe como "un sustantivo que transmite la idea de una unidad de transmisión cultural, o una unidad de imitación". [59] El término fue adaptado más tarde al ámbito de Internet por David Beskow, Sumeet Kumar y Kathleen Carley , donde etiquetaron a los memes de Internet como "cualquier unidad digital que transfiere cultura". [60] La definición de Shifman de los memes de Internet también incluye su condición de "(a) un grupo de elementos digitales que comparten características comunes de contenido, forma y/o postura, que (b) fueron creados con conocimiento de los demás, y (c) fueron circulados, imitados y/o transformados a través de Internet por muchos usuarios". [61]

Medios de comunicación

Se han dado casos de anuncios televisivos que utilizan la jerga de Internet, lo que refuerza la penetración de la estilística de Internet en el uso cotidiano del lenguaje. Por ejemplo, en el anuncio de Cingular en los Estados Unidos, se utilizaron acrónimos como "BFF Jill" (que significa "Mejor amiga para siempre, Jill"). Cada vez más empresas han adoptado el uso de la jerga de Internet en sus anuncios a medida que más personas crecen utilizando Internet y otras plataformas de CMC, en un intento de relacionarse y conectarse mejor con ellas. [62] Estos anuncios han recibido una respuesta relativamente entusiasta de sus audiencias. [62]

El uso de la jerga de Internet también se ha extendido al ámbito de la música, y se ha visto de forma significativa en la música popular . Un ejemplo reciente es la letra de la canción "LOL :-)" de Trey Songz , que incorporaba mucha jerga de Internet y menciones a Twitter y a los mensajes de texto. [63]

La difusión de la lingüística de Internet también está presente en las películas realizadas tanto por cineastas comerciales como independientes . Aunque se proyectan principalmente en festivales de cine , los DVD de películas independientes a menudo están disponibles para su compra a través de Internet, incluidas las transmisiones en vivo pagas, lo que hace que el acceso a las películas sea más fácil para el público. [64] La propia naturaleza de las películas comerciales que se proyectan en cines públicos permite una amplia exposición al público masivo, lo que resulta en una difusión más rápida y amplia de las jergas de Internet. La última [ aclaración necesaria ] película comercial se titula "LOL" (acrónimo de Laugh Out Loud o Laughing Out Loud ), protagonizada por Miley Cyrus y Demi Moore . [65] Esta película es una nueva versión de 2011 de la popular película francesa de 2008 de Lisa Azuelos con el mismo título " LOL (Laughing Out Loud) ". [66]

El uso de jergas de Internet no se limita al idioma inglés, sino que se extiende también a otros idiomas. El idioma coreano ha incorporado el alfabeto inglés en la formación de su jerga, mientras que otras se formaron a partir de errores ortográficos comunes que surgen de la escritura rápida. La nueva jerga coreana se refuerza aún más y se incorpora al lenguaje cotidiano a través de programas de televisión como telenovelas o comedias dramáticas como “ High Kick Through the Roof ”, estrenada en 2009.

El futuro lingüístico de Internet

Con el surgimiento de sistemas de comunicación cada vez más amplios mediados por computadoras e Internet, junto con la disposición con la que las personas se adaptan para satisfacer las nuevas demandas de un mundo tecnológicamente más sofisticado, se espera que los usuarios sigan bajo presión para alterar su uso del lenguaje para adaptarse a las nuevas dimensiones de la comunicación. [5]

A medida que aumenta rápidamente el número de usuarios de Internet en todo el mundo, el trasfondo cultural, los hábitos lingüísticos y las diferencias lingüísticas entre los usuarios se incorporan a la Web a un ritmo mucho más rápido. Se prevé que estas diferencias individuales entre los usuarios de Internet afecten significativamente al futuro de la lingüística en Internet, en particular en el aspecto de la Web multilingüe. Como se ha visto entre 2000 y 2010, la penetración de Internet ha experimentado su mayor crecimiento en países de habla no inglesa, como China e India, y en países de África [67] , lo que ha dado lugar a que más idiomas, aparte del inglés, penetren en la Web.

Además, se prevé que la interacción entre el inglés y otros idiomas sea un área de estudio importante. [68] A medida que los usuarios globales interactúan entre sí, las posibles referencias a diferentes idiomas pueden seguir aumentando, lo que dará como resultado la formación de nuevos estilos de Internet que se extiendan a todos los idiomas. Los idiomas chino y coreano ya han experimentado la infiltración del idioma inglés que condujo a la formación de su jerga multilingüe en Internet. [69]

En la actualidad, Internet ofrece una forma de educación y promoción de las lenguas minoritarias. Sin embargo, de forma similar a cómo la interacción entre idiomas ha dado lugar a la infiltración del inglés en los idiomas chino y coreano para formar nuevas jergas, [69] las lenguas minoritarias también se ven afectadas por las lenguas más comunes que se utilizan en Internet (como el inglés y el español). Si bien la interacción lingüística puede provocar una pérdida del estándar auténtico de las lenguas minoritarias, la familiaridad con la lengua mayoritaria también puede afectar a las lenguas minoritarias de forma adversa. [6] Por ejemplo, los usuarios que intentan aprender la lengua minoritaria pueden optar por leer y comprender sobre ella en una lengua mayoritaria y detenerse allí, lo que resulta en una pérdida en lugar de una ganancia en los hablantes potenciales de la lengua minoritaria. [70] Además, los hablantes de lenguas minoritarias pueden verse alentados a aprender las lenguas más comunes que se utilizan en la Web para obtener acceso a más recursos, lo que a su vez conduce a una disminución en el uso de su propia lengua. [71] El futuro de las lenguas minoritarias en peligro de extinción en vista de la expansión de Internet aún está por verse.

Véase también

Referencias

  1. ^ abcdefghij "Desarrollo del lenguaje a través de Internet". ScienceDaily . 28 de febrero de 2005.
  2. ^ abcdefghijkl Crystal, David (2005). "El alcance de la lingüística de Internet" (PDF) . Documento presentado en la reunión de la Asociación Estadounidense para el Avance de la Ciencia . Archivado desde el original (PDF) el 26 de julio de 2011.
  3. ^ Mcculloch, Gretchen (2019), Porque Internet , Libros en cinta, OCLC  1151437829.
  4. ^ Martín del Pozo, Maria Angeles (8 de mayo de 2005). " Lingüística y usabilidad web; artículo de investigación". No Solo Usabilidad . 4. ISSN  1886-8592 . Consultado el 15 de febrero de 2014 .
  5. ^ abcdefghijklmn Kilgarriff, Adam; Grefenstette, Gregory (septiembre de 2003). "Introducción al número especial sobre la Web como corpus" (PDF) . Computational Linguistics . 29 (3): 333–347. doi :10.1162/089120103322711569. S2CID  2649448.
  6. ^ ab Cunliffe, Daniel; Herring, Susan C. (diciembre de 2005). "Introducción a las lenguas minoritarias, multimedia y la Web". Nueva revisión de hipermedia y multimedia . 11 (2): 131–137. doi : 10.1080/13614560512331392186 . S2CID  39127569.
  7. ^ ab Cohen, Peter (7 de marzo de 2008). "iPhone Takes on the BlackBerry". PC World . Archivado desde el original el 7 de octubre de 2009. Consultado el 31 de octubre de 2010 .
  8. ^ ab Cohen, Peter (30 de marzo de 2010). "Las universidades utilizan las redes sociales para conectarse". The New York Times . Consultado el 31 de octubre de 2010 .
  9. ^ abcd Thurlow, Crispin (2001). "Internet y el lenguaje" (PDF) . En Mesthrie, R.; Asher, R. (eds.). Enciclopedia concisa de sociolingüística . Londres: Pergamon. págs. 287–289. ISBN. 978-0-08-043726-2Archivado desde el original (PDF) el 8 de octubre de 2012. Consultado el 9 de noviembre de 2010 .
  10. ^ Nazaryan, Ani; Gridchin, Aleksandr (2006). "La influencia de Internet en el lenguaje y el "estrés del correo electrónico"" (PDF) . Law and Politics . 4 (1): 23–27 . Consultado el 19 de octubre de 2010 .
  11. ^ Hayslett, Chandra M. (26 de noviembre de 2006). "No LOL Matter: Cyber ​​lingo shows up in academic" (No LOL importa: el lenguaje cibernético aparece en el ámbito académico). The Seattle Times . Consultado el 6 de noviembre de 2010 .
  12. ^ Abrams, Rachel (16 de enero de 2010). "Expertos divididos sobre los cambios en el lenguaje que ha experimentado Internet". VOANews . Consultado el 19 de octubre de 2010 .
  13. ^ Naomi, S. Baron (2008). Siempre activo. Oxford University Press. ISBN 978-0-19-531305-5.
  14. ^ "Los mensajes de texto 'mejoran la habilidad lingüística'". BBC. 25 de febrero de 2009. Consultado el 4 de noviembre de 2010 .
  15. ^ ab Xie, Tim (junio de 2008). "Globalización y educación lingüística". Presentación . Consultado el 19 de octubre de 2010 .
  16. ^ ab Cook, Franklin (2001). "Los lingüistas ven la jerga de Internet como un catalizador cultural". yourdictionary.com. Archivado desde el original el 13 de febrero de 2010. Consultado el 8 de noviembre de 2010 .
  17. ^ Clark, Roy Peter (4 de septiembre de 2009). "From Telegraph to Twitter: The Language of the Short Form". Poynter Online . Archivado desde el original el 19 de enero de 2010. Consultado el 21 de octubre de 2010 .
  18. ^ Onishi, Norimitsu (20 de enero de 2008). "Thumbs Race as Japan's Best Sellers Go Cellular". The New York Times . Consultado el 7 de noviembre de 2010 .
  19. ^ "Los teléfonos celulares se utilizan de forma novedosa". Associated Press. 18 de marzo de 2005. Consultado el 8 de noviembre de 2010 .
  20. ^ Galbraith, Patrick W. (2010). «Las novelas para teléfonos móviles alcanzan su madurez». Revista Metropolis . Archivado desde el original el 15 de octubre de 2009. Consultado el 8 de noviembre de 2010 .
  21. ^ abcd Crystal, David (2006). El lenguaje y la Internet . Cambridge University Press . ISBN 978-0-521-86859-4.
  22. ^ "El éxito de los blogs anuncia un futuro aún más prometedor". The Age . Melbourne. Associated Press. 18 de marzo de 2003. Consultado el 10 de noviembre de 2010 .
  23. ^ Cicognani, Anna (1998). "Sobre la naturaleza lingüística del ciberespacio y las comunidades virtuales". Realidad virtual . 3 (1): 16–24. doi :10.1007/BF01409794. S2CID  8145966.
  24. ^ Collister, Lauren B. (1 de marzo de 2012). "Los deícticos del discurso ∧ y <-- en una comunidad de World of Warcraft" (PDF) . Discourse, Context & Media . 1 (1): 9–19. doi :10.1016/j.dcm.2012.05.002.
  25. ^ Collister, Lauren Brittany (1 de febrero de 2011). "*-reparación en el discurso en línea" (PDF) . Revista de Pragmática . El lenguaje del espacio y el tiempo. 43 (3): 918–921. doi :10.1016/j.pragma.2010.09.025.
  26. ^ "La enseñanza de idiomas cobra una segunda vida: los mundos virtuales ofrecen nuevos métodos para enseñar idiomas" (Nota de prensa). Avatar English. 2007. Consultado el 8 de noviembre de 2010 .[ enlace muerto permanente ]
  27. ^ Baron, Naomi S. (1998). "Cartas por teléfono o discurso por otros medios: la lingüística del correo electrónico" (PDF) . Lengua y comunicación . 18 (2). Londres: 133–70. doi :10.1016/S0271-5309(98)00005-6. Archivado desde el original (PDF) el 29 de diciembre de 2009 . Consultado el 8 de noviembre de 2010 .
  28. ^ ab Olsen, Stefanie; Suri, Sabena (24 de agosto de 2007). "Dile adiós a la escritura de cartas tradicional". CNET News . Consultado el 10 de noviembre de 2010 .
  29. ^ Iniciativa de aprendizaje EDUCAUSE (noviembre de 2005). "7 cosas que debería saber sobre la mensajería instantánea" (PDF) . 7 cosas que debería saber sobre... Archivado desde el original (PDF) el 5 de enero de 2011 . Consultado el 10 de noviembre de 2010 .
  30. ^ Johnson, Heidi (2004). "Documentación y archivo de lenguas, o cómo construir un mejor corpus" (PDF) . En Austin, Peter K. (ed.). Documentación y descripción de lenguas . Vol. 2. Londres: SOAS . págs. 140–153.
  31. ^ Singhal, Meena (junio de 1997). "Internet y la enseñanza de lenguas extranjeras: beneficios y desafíos". The Internet TESFL Journal . III (6) . Consultado el 6 de noviembre de 2010 .
  32. ^ Warschauer, Mark (1998). "Tecnología y revitalización de las lenguas indígenas: análisis de la experiencia de Hawái". Revista Canadiense de Lenguas Modernas . 55 (1): 140–161. doi :10.3138/cmlr.55.1.139 . Consultado el 6 de noviembre de 2010 .
  33. ^ Warschauer, Mark (2000). "Lenguaje, identidad e Internet". En Kolko, B.; Nakamura, L.; Rodman, G. (eds.). Race in Cyberspace . Nueva York: Routledge . Consultado el 15 de febrero de 2014 .
  34. ^ Wright, Sue (2007). "El derecho a hablar la propia lengua: reflexiones sobre la teoría y la práctica". Política lingüística . 6 (2): 203–224. doi :10.1007/s10993-007-9050-y. S2CID  144836644.
  35. ^ Cazden, Courtney B. (2003). "Sostener las lenguas indígenas en el ciberespacio" (PDF) . En Reyhner, J.; Trujillo, O.; Carrasco, RL; Lockard, L. (eds.). Nutrir las lenguas nativas . Flagstaff: Northern Arizona University. págs. 53–57.
  36. ^ Asociación Británica para el Avance de la Ciencia (8 de septiembre de 2008). "Crímenes de texto, delitos sexuales y asesinatos: la ciencia de la lingüística forense". ScienceDaily . Consultado el 6 de noviembre de 2010 .
  37. ^ Lee, Ryan (2002). Protección de datos personales en la Web semántica (tesis doctoral). Instituto Tecnológico de Massachusetts . Consultado el 6 de noviembre de 2010 .
  38. ^ Church, Kenneth; Mercer, Robert (1993). «Introducción al número especial sobre lingüística computacional utilizando grandes corpus» (PDF) . Computational Linguistics . 19 (1): 1–24. Archivado desde el original (PDF) el 2018-02-15 . Consultado el 2018-02-14 .
  39. ^ McEnery, Tony; Wilson, Andrew (1996). Lingüística de corpus (PDF) . Edimburgo: Edinburgh University Press . ISBN 978-0-7486-0808-9.
  40. ^ Manning, Christopher; Schütze, Hinrich (1999). Fundamentos del procesamiento estadístico del lenguaje natural . Cambridge: MIT Press . ISBN 978-0-262-13360-9.
  41. ^ Mihalcea, Rada; Moldovan, Dan (1999). "Un método para la desambiguación del sentido de las palabras en textos no restringidos". Actas de la 37.ª reunión de la ACL . College Park, Maryland. págs. 152-158.
  42. ^ Resnik, Philip (1999). "Un método para la desambiguación del sentido de las palabras en textos no restringidos". Actas de la 37.ª reunión de la ACL . College Park, Maryland. págs. 152-158.
  43. ^ Jones, Rosie; Rayid, Ghani (2000). "Construcción automática de un corpus para una lengua minoritaria a partir de la Web". Actas del taller de estudiantes de la 38.ª reunión anual de la Asociación de Lingüística Computacional . Hong Kong. págs. 29–36.
  44. ^ Rigau, German; Magnini, Bernardo; Agirre, Eneko; Carroll, John (2002). "Significado: una hoja de ruta hacia las tecnologías del conocimiento". Actas del taller COLING sobre una hoja de ruta para la lingüística computacional . Taipei, Taiwán.
  45. ^ Volk, Martin (2001). "Explotación de la WWW como corpus para resolver ambigüedades en los anexos de PP". Actas de Lingüística de Corpus 2001. Lancaster, Inglaterra.
  46. ^ Villasenor-Pineda, L.; Montes-y-Gómez, M.; Pérez-Coutino, M.; Vaufreydaz, D. (2003). "Un método de balanceo de corpus para la construcción de modelos lingüísticos". Cuarta Conferencia Internacional sobre Procesamiento Inteligente de Textos y Lingüística Computacional (CICLing-2003) . Taipei, Taiwán. pp. 393–401. doi :10.1007/3-540-36456-0_40.
  47. ^ Hawking, David; Voorhees, Ellen ; Craswell, Nick; Bailey, Peter (1999). "Descripción general de la pista web TREC8". Actas de la Octava Conferencia de Recuperación de Texto . Gaithersburg, Maryland.
  48. ^ Baker, Colin; Fillmore, Charles; Lowe, John (1998). "El proyecto Berkeley FrameNet". Actas de COLING-ACL . Montreal. págs. 86–90.
  49. ^ Briscoe, Ted; Carroll, John (1997). "Extracción automática de subcategorización de corpus". Actas de la quinta Conferencia sobre Procesamiento Aplicado del Lenguaje Natural . Washington, DC. págs. 356–363. arXiv : cmp-lg/9702002 .
  50. ^ Korhonen, Anna (2000). "Uso de estimaciones semánticamente motivadas para ayudar a la adquisición de subcategorización". Actas de la Conferencia conjunta sobre métodos empíricos en NLK y corpus muy grandes . Hong Kong. págs. 216–223.
  51. ^ Ivković, D. (2013). El Festival de la Canción de Eurovisión en YouTube: un análisis basado en corpus de las actitudes lingüísticas. Language@Internet, 10, artículo 1. (urn:nbn:de:0009-7-35977).
  52. ^ Xu, JL (2000). "Búsqueda multilingüe en la World Wide Web". Actas de la Conferencia Internacional de Hawái sobre Ciencia de Sistemas (HICSS-33) . Maui, Hawái.
  53. ^ Grefenstette, Gregory; Nioche, Julien (2000). "Estimación del uso del inglés y de otros idiomas en la WWW". Actas de la RIAO (Recherche d'Informations Assiste ́e par Ordinateur) . París. pp. 237–246.
  54. ^ Biber, Douglas (1993). "Uso de corpus diversificados por registros para estudios generales del lenguaje". Computational Linguistics . 19 (2): 219–242.
  55. ^ Sekine, Satshi (1997). "La dependencia del dominio del análisis sintáctico". Actas de la Quinta Conferencia sobre Procesamiento Aplicado del Lenguaje Natural . Washington, DC. págs. 96–102.
  56. ^ Atkins, Sue; Clear, Jeremy; Ostler, Nicholas (enero de 1992). "Criterios de diseño de corpus". Computación literaria y lingüística . 7 (1): 1–16. doi :10.1093/llc/7.1.1.
  57. ^ Lester, Mark (2001). Enseñanza de la gramática y el uso de la lengua. Boston: Allyn and Bacon. ISBN 978-0205306558.
  58. ^ Kahn, Richard; Kellner, Douglas (febrero de 2004). "Nuevos medios y activismo en Internet: de la 'Batalla de Seattle' a los blogs". Nuevos medios y sociedad . 6 (1): 87–95. doi :10.1177/1461444804039908. ISSN  1461-4448. S2CID  46607277.
  59. ^ Dawkins, Richard (1989). El gen egoísta (Nueva edición). Oxford: Oxford University Press. ISBN 0-19-217773-7.OCLC 20012195  .
  60. ^ Beskow, David M.; Kumar, Sumeet; Carley, Kathleen M. (marzo de 2020). "La evolución de los memes políticos: detección y caracterización de memes de Internet con aprendizaje profundo multimodal". Procesamiento y gestión de la información . 57 (2): 102170. doi : 10.1016/j.ipm.2019.102170 . S2CID  214065563.
  61. ^ Shifman, Limor (2014). Memes en la cultura digital . MIT Press. pág. 41. ISBN 9780262525435.
  62. ^ ab Pawelski, Amanda. "Usando la jerga de Internet en la conversación hablada: ¡LOL!" (PDF) . Documento de investigación . Estados Unidos : Colorado State University. Archivado desde el original (PDF) el 2011-07-07 . Consultado el 2010-11-06 .
  63. ^ Songz, Trey . "LOL :-) Ft. Gucci Mane & Soulja Boy Tell 'Em". Canción . Trey Songz. Archivado desde el original el 10 de octubre de 2010 . Consultado el 7 de noviembre de 2010 .
  64. ^ Swanberg, Joe (Director) (2006). LOL – The Movie (Película). Estados Unidos: Swanberg, Joe . Consultado el 8 de noviembre de 2010 .
  65. ^ Kaufman, Gil (29 de octubre de 2010). "La distribuidora elige la película 'LOL' de Miley Cyrus". MTV News . MTV. Archivado desde el original el 1 de noviembre de 2010 . Consultado el 8 de noviembre de 2010 .
  66. ^ Azuelos, Lisa (Director) (2008). LOL (Laughing Out Loud) (Película). Francia: Azuelos, Lisa . Consultado el 8 de noviembre de 2010 .
  67. ^ Estadísticas mundiales de Internet (30 de junio de 2010). «Estadísticas de uso de Internet: estadísticas de población y usuarios de Internet en el mundo». Estadísticas . Miniwatts Marketing Group. Archivado desde el original el 22 de mayo de 2020. Consultado el 11 de noviembre de 2010 .
  68. ^ Ivkovic, D., y Lotherington, H. (2009). Multilingüismo en el ciberespacio: conceptualización del paisaje lingüístico virtual. Revista internacional de multilingüismo, 6(1), 17–36.
  69. ^ ab Butterfield, Jessica M.; Na, Pan. "Una comparación entre el inglés y el chino en Internet" (PDF) . Documento de investigación . Archivado desde el original (PDF) el 2009-03-26 . Consultado el 2010-11-11 .
  70. ^ Martín, Santiago Jorge Paricio; Cortés, Juan Pablo Martínez (mayo de 2010). «Nuevas vías para revitalizar las lenguas minoritarias: el impacto de Internet en el caso del aragonés». Digithum: Las humanidades en la era digital (12). Archivado desde el original el 15 de agosto de 2010. Consultado el 12 de noviembre de 2010 .
  71. ^ Crystal, David (2003). El inglés como lengua global . Cambridge: Cambridge University Press .

Lectura adicional