Latin Extended-B es el cuarto bloque (0180-024F) del estándar Unicode . Se ha incluido desde la versión 1.0, donde solo se asignaba a los puntos de código 0180-01FF y contenía 113 caracteres. Durante la unificación con ISO 10646 para la versión 1.1, el rango de bloques se amplió en 80 puntos de código y se asignaron otros 35 caracteres. En la versión 3.0 y posteriores, se asignaron los últimos 60 puntos de código disponibles en el bloque. El nombre de su bloque en Unicode 1.0 era Latín extendido . [3]
El bloque Latin Extended-B contiene diez subtítulos para grupos de caracteres: latín histórico y no europeo, letras africanas para clics, dígrafos croatas que coinciden con letras cirílicas serbias, combinaciones de vocales diacríticas en Pinyin, letras fonéticas e históricas, adiciones para esloveno y croata, Adiciones para rumano, Adiciones varias, Adiciones para livonia y Adiciones para sinología. Los clics africanos no europeos e históricos, los dígrafos croatas, Pinyin y la primera parte de las letras fonéticas e históricas estaban presentes en Unicode 1.0; se agregaron letras fonéticas e históricas adicionales para la versión 3.0; y otros Fonéticos e históricos, así como el resto de los subbloques fueron los caracteres agregados para la versión 1.1.
El subtítulo latino histórico y no europeo contiene los primeros 64 caracteres del bloque e incluye varias letras variantes para su uso en zhuang, transcripción fonética americanista , lenguas africanas y otros alfabetos de escritura latina. No contiene letras estándar con signos diacríticos.
Las cuatro letras africanas para clics se utilizan en la ortografía khoisan.
Los dígrafos croatas que coinciden con las letras cirílicas serbias son tres conjuntos de asignaciones de tres mayúsculas (minúsculas, mayúsculas y mayúsculas) de dígrafos latinos utilizados para la compatibilidad con textos cirílicos, siendo el serbocroata una lengua digráfica .
Las 16 combinaciones de vocales y diacríticos en Pinyin se utilizan para representar los sonidos vocálicos estándar del chino mandarín con marcas tonales.
Las 35 letras fonéticas e históricas son en gran medida varias letras latinas estándar y variantes con signos diacríticos.
Las 24 adiciones para esloveno y croata son todas letras latinas estándar con signos diacríticos inusuales, como la doble tumba y la breve invertida.
Las Adiciones para rumano son 4 caracteres que erróneamente se unificaron como si tuvieran cedilla, cuando debajo tienen una coma. La combinación de S y T con cedilla versus coma a continuación continúa afectando la implementación del idioma rumano hasta el presente. [4]
El subtítulo Adiciones varias contiene 39 caracteres de diversas descripciones y orígenes.
Las Adiciones para Livonia son 10 letras con signos diacríticos para escribir el idioma Livonia.
Las Adiciones para Sinología son tres letras minúsculas con rizos utilizadas en el estudio del idioma chino clásico.
Las Adiciones para la lingüística africanista son dos letras minúsculas con colas oscilantes que se utilizan en la lingüística africanista.
Las Adiciones para Sencoten son 5 letras con trazos para escribir Saanich .
La siguiente tabla muestra el número de letras en el bloque Latín Extendido-B.
Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque Latin Extended-B: