Latin Extended-B es el cuarto bloque (0180-024F) del estándar Unicode . Se incluye desde la versión 1.0, donde solo se asignaba a los puntos de código 0180-01FF y contenía 113 caracteres. Durante la unificación con ISO 10646 para la versión 1.1, el rango de bloques se amplió en 80 puntos de código y se asignaron otros 35 caracteres. En la versión 3.0 y posteriores, se asignaron los últimos 60 puntos de código disponibles en el bloque. Su nombre de bloque en Unicode 1.0 era Extended Latin . [3]
El bloque B de latín extendido contiene diez subtítulos para grupos de caracteres: latín no europeo e histórico, letras africanas para clics, dígrafos croatas que coinciden con las letras cirílicas serbias, combinaciones de vocales y diacríticas pinyin, letras fonéticas e históricas, adiciones para esloveno y croata, adiciones para rumano, adiciones varias, adiciones para livonio y adiciones para sinología. Las letras no europeas e históricas, los clics africanos, los dígrafos croatas, pinyin y la primera parte de las letras fonéticas e históricas estaban presentes en Unicode 1.0; se añadieron letras fonéticas e históricas adicionales para la versión 3.0; y otras letras fonéticas e históricas, así como el resto de los subbloques, fueron los caracteres añadidos para la versión 1.1.
El subtítulo de latín no europeo e histórico contiene los primeros 64 caracteres del bloque e incluye varias variantes de letras para su uso en Zhuang, transcripción fonética americanista , idiomas africanos y otros alfabetos de escritura latina. No contiene ninguna letra estándar con diacríticos.
Las cuatro letras africanas que significan clic se utilizan en la ortografía Khoisan.
Los dígrafos croatas que coinciden con las letras cirílicas serbias son tres conjuntos de tres asignaciones de mayúsculas y minúsculas (minúsculas, mayúsculas y mayúsculas del título) de dígrafos latinos utilizados para la compatibilidad con textos cirílicos, siendo el serbocroata un idioma digráfico .
Las 16 combinaciones de vocales-diacríticas del Pinyin se utilizan para representar los sonidos vocálicos estándar del chino mandarín con marcas de tono.
Las 35 letras fonéticas e históricas son en gran parte diversas letras latinas estándar y variantes con marcas diacríticas.
Las 24 adiciones para esloveno y croata son todas letras latinas estándar con diacríticos inusuales, como la doble grave y la breve invertida.
Las adiciones para el rumano son 4 caracteres que se unificaron erróneamente como si tuvieran una cedilla, cuando tienen una coma debajo. La confusión de S y T con cedilla vs. coma debajo continúa plagando la implementación del idioma rumano hasta el presente. [4]
El subtítulo Adiciones Varias contiene 39 caracteres de diversa descripción y origen.
Las adiciones para el idioma livonio son 10 letras con signos diacríticos para escribir el idioma livonio.
Las adiciones para sinología son tres letras minúsculas con rizos que se utilizan en el estudio del idioma chino clásico.
Las adiciones para la lingüística africanista son dos letras minúsculas con colas de guion utilizadas en la lingüística africanista.
Las adiciones para Sencoten son 5 letras con trazos para escribir Saanich .
La siguiente tabla muestra el número de letras del bloque Latin Extended-B.
Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque Latin Extended-B: