La silabificación ( / s ɪ ˌ l æ b ɪ ˈ f ɪ ˈ k eɪ ʃ ən / ) o silabación ( / s ɪ ˌ l æ b ɪ ˈ k eɪ ʃ ən / ), también conocida como separación de sílabas , es la separación de una palabra en sílabas , ya sea hablada, escrita [1] o con signos. [2]
La separación de sílabas en la escritura suele marcarse con un guion cuando se utiliza la ortografía inglesa (p. ej., syl-la-ble) y con un punto cuando se transcriben las sílabas pronunciadas en el Alfabeto Fonético Internacional (p. ej., [ˈsɪl.ə.bᵊɫ] ). Para fines de presentación, los tipógrafos pueden utilizar un punto de separación ( carácter Unicode U+00B7, p. ej., syl·la·ble), un "punto de separación" especial (U+2027, p. ej., syl‧la‧ble) o un espacio (p. ej., syl la ble).
Al final de una línea, una palabra se separa por escrito en partes, convencionalmente llamadas "sílabas", si no cabe en la línea y si moverla a la línea siguiente haría que la primera línea fuera mucho más corta que las demás. Esto puede ser un problema particular con palabras muy largas y con columnas estrechas en los periódicos. El procesamiento de textos ha automatizado el proceso de justificación , haciendo que la silabización de palabras más cortas sea a menudo innecesaria.
En algunos idiomas, las sílabas habladas también son la base de la silabificación en la escritura. Sin embargo, posiblemente debido a la débil correspondencia entre sonidos y letras en la ortografía del inglés moderno, la silabificación escrita en inglés se basa principalmente en principios etimológicos o morfológicos , en lugar de fonéticos . Por ejemplo, no es posible silabificar "learning" como learning-ning según la silabificación correcta de la lengua viva. Ver solo lear- al final de una línea podría inducir al lector a pronunciar la palabra incorrectamente, ya que el dígrafo ea puede tener muchos valores diferentes . La historia de la ortografía inglesa da cuenta de tales fenómenos.
Por lo tanto, la silabificación escrita en inglés trata de un concepto de "sílaba" que no corresponde al concepto lingüístico de unidad fonológica (en oposición a morfológica).
Como resultado, incluso la mayoría de los hablantes nativos de inglés son incapaces de dividir en sílabas las palabras según las reglas establecidas sin consultar un diccionario o usar un procesador de textos. Las escuelas no suelen ofrecer muchos más consejos sobre el tema que consultar un diccionario. Además, existen diferencias entre la división en sílabas británica y estadounidense e incluso entre diccionarios de la misma variedad de inglés.
En finés , italiano , portugués , japonés ( romaji ), coreano ( romanizado ) y otros idiomas con una ortografía casi fonémica, los escritores pueden, en principio, silabear correctamente cualquier palabra existente o de nueva creación utilizando únicamente reglas generales. En Finlandia, primero se enseña a los niños a silabear cada palabra hasta que produzcan la silabación correcta de manera fiable, después de lo cual se pueden omitir los guiones.
Un algoritmo de separación de palabras es un conjunto de reglas, especialmente codificadas para su implementación en un programa informático, que decide en qué puntos se puede separar una palabra en dos líneas con un guion. Por ejemplo, un algoritmo de separación de palabras podría decidir que impeachment se puede separar como impeach-ment o imp-peachment, pero no como impe-achment .
Una de las razones de la complejidad de las reglas de separación de palabras es que los diferentes dialectos del inglés tienden a diferir en la separación de palabras: el inglés americano tiende a trabajar en el sonido, pero el inglés británico tiende a mirar los orígenes de la palabra y luego al sonido. [ cita requerida ] También hay una gran cantidad de excepciones, lo que complica aún más las cosas. [ cita requerida ]
Se pueden encontrar algunas reglas generales en el libro de Mayor Keary "On Hyphenation – Anarchy of Pedantry". [3] Entre los enfoques algorítmicos para la separación de sílabas, el implementado en el sistema de composición tipográfica TeX es ampliamente utilizado. Está documentado detalladamente en los dos primeros volúmenes de Computers and Typesetting de Donald Knuth y en la disertación de Franklin Mark Liang. [4] El objetivo del trabajo de Liang era lograr que el algoritmo fuera lo más preciso posible y mantener las excepciones al mínimo.
En los patrones de separación de palabras originales de TeX para el inglés americano, la lista de excepciones contiene solo 14 palabras. [5]
Los puertos del algoritmo de separación de palabras TeX están disponibles como bibliotecas para varios lenguajes de programación, incluidos Haskell , JavaScript , Perl , PostScript , Python , Ruby , C# , y se puede hacer que TeX muestre guiones en el registro mediante el comando \showhyphens
.
En LaTeX , los usuarios pueden agregar corrección de separación de palabras mediante:
\hyphenation{palabras}
El \hyphenation
comando declara los puntos de separación permitidos, en los que las palabras son una lista de palabras separadas por espacios, en la que cada punto de separación se indica mediante un -
carácter. Por ejemplo,
\hyphenation{fortran er-go-no-mic}
declara que en el trabajo actual "fortran" no debe llevar guión y que si se debe llevar guión "ergonomic", será en uno de los puntos indicados. [6]
Sin embargo, existen varias limitaciones. Por ejemplo, el \hyphenation
comando stock solo acepta letras ASCII de manera predeterminada, por lo que no se puede utilizar para corregir la separación de palabras con caracteres no ASCII (como ä , é , ç ), que son muy comunes en muchos idiomas. Sin embargo, existen soluciones alternativas simples. [7] [8]