Traducido para el proyecto NuLies por David Marín Carreño El código del núcleo de Linux ha sido reescrito para utilizar Unicode para incluir los caracteres en fuentes. Descargando una tabla sencilla Unicode-a-fuente, tanto los juegos de caracteres de 8 bits como los modos UTF-8 son cambiados para utilizar la fuente tal y como se indica. Esto cambia bastante la semántica de las tablas de caracteres de 8 bits. Las cuatro tablas de caracteres son ahora: Mapa símbolos Nombre de mapa Código de escape (G0) LAT1_MAP Latin-1 (ISO 8859-1) ESC ( B GRAF_MAP Pseudográficos DEC VT100 ESC ( 0 IBMPC_MAP Código de página IBM 437 ESC ( U USER_MAP Definido por el usuario ESC ( K En concreto, ESC ( U ya no será "directamente a fuente", ya que la fuente será completamente distinta al juego de caracteres IBM. Esto permite, por ejemplo, utilizar gráficos de bloque incluso cuando está cargada una fuente Latin-1. De acuerdo con el estándar Unicode ISO 10646 el rango de caracteres U+F000 a U+F8FF ha sido reservado para ser definido por el sistema operativo (el estándar Unicode se refiere a esto como "Zona Corporativa", pero como no esa definición no es adecuada para Linux, la llamaremos "Zona Linux"). U+F000 fue tomado como el punto de comienzo ya que permite que el comienzo de la zona de mapeado directo comience en una potencia de dos grande (en el caso de que sean necesarias alguna vez las fuentes de 1024 ó 2048 caracteres). Esto deja U+E000 hasta U+EFFF como zona final de usuario. Los Unicodes en el rango de U+F000 hasta U+F1FF han sido codificados para apuntar directamante a la fuente cargada, evitando la tabla de traducción. El mapa definido por el usuario ahora está puesto por defecto a U+F000 a U+F1FF, emulando el comportamiento anterior. Este rango puede expandirse en el futuro. Caracteres reales asignados a la Zona Linux ------------------------------------------- Además, los siguientes caracteres no presentes en Unicode 1.1.4 (al menos, no los he encontrado) han sido definidos; son utilizados por el mapa de gráficos DEC VT: U+F800 DEC VT GRAPHICS HORIZONTAL LINE SCAN 1 U+F801 DEC VT GRAPHICS HORIZONTAL LINE SCAN 3 U+F803 DEC VT GRAPHICS HORIZONTAL LINE SCAN 7 U+F804 DEC VT GRAPHICS HORIZONTAL LINE SCAN 9 Los DEC VT220 utilizan una matriz de caracteres 6x10, y estos caracteres forman una progresión suave en el juego de caracteres gráficos DEC VT. He omitido el carácter HORIZONTAL LINE SCAN 5 ya que también es utilizado como carácter de gráficos de bloque, y ha sido codificado como U+2500 FORMS LIGHT HORIZONTAL. Sin embargo, dejé el U+F802 vacío por si surge la necesidad de incluirlo. Soporte para idioma Klingon --------------------------- Desafortunadamente, Unicode/ISO 10646 no sitúa puntos de código para el lenguaje Klingon, probablemente temiendo la explosión de puntos de código si se incluyesen muchas lenguas ficticias. Hay también razones políticas (los japoneses, por ejemplo, no están muy contentos con todo el asunto de los 16 bits para empezar). Sin embargo, como Linux es un sistema operativo llevado por hackers, parece que existe un soporte valioso de lenguas de hackers. Por lo tanto, he decidido añadirlo a la lista en la Zona Linux. Se han propuesto muchos glifos y signos para el alfabeto Klingon. Sin embargo, ya que el juego de símbolos parece ser bastante consistente, variando sólo las formas, manteniendo la práctica Unicode, estas diferencias se consideran variantes de fuente. El klingon tiene un alfabeto de 26 caracteres, un sistema numérico de posicionamiento con 10 dígitos, y se escribe de izquierda a derecha y de arriba a abajo. La puntuación sólo parece utilizarse en transliteración latina; parece escribir cada frase en su propia línea, de manera centrada. Se ha dejado espacio reservado para la puntuación si se considera necesaria. Este código ha sido respaldado por el Instituto de Lengua Klingon. Para más información, contacte con ellos en: http://www.kli.org/ Como los caracteres situados al comienzo de la Zona Linux han sido los de tipo dingbats/símbolos/cuestionarios, y esto es una lengua, lo he colocado al final, en un campo de 16 celdas, manteniendo la práctica Unicode. U+F8D0 KLINGON LETTER A U+F8D1 KLINGON LETTER B U+F8D2 KLINGON LETTER CH U+F8D3 KLINGON LETTER D U+F8D4 KLINGON LETTER E U+F8D5 KLINGON LETTER GH U+F8D6 KLINGON LETTER H U+F8D7 KLINGON LETTER I U+F8D8 KLINGON LETTER J U+F8D9 KLINGON LETTER L U+F8DA KLINGON LETTER M U+F8DB KLINGON LETTER N U+F8DC KLINGON LETTER NG U+F8DD KLINGON LETTER O U+F8DE KLINGON LETTER P U+F8DF KLINGON LETTER Q - Written in standard Okrand Latin transliteration U+F8E0 KLINGON LETTER QH - Written in standard Okrand Latin transliteration U+F8E1 KLINGON LETTER R U+F8E2 KLINGON LETTER S U+F8E3 KLINGON LETTER T U+F8E4 KLINGON LETTER TLH U+F8E5 KLINGON LETTER U U+F8E6 KLINGON LETTER V U+F8E7 KLINGON LETTER W U+F8E8 KLINGON LETTER Y U+F8E9 KLINGON LETTER GLOTTAL STOP U+F8F0 KLINGON DIGIT ZERO U+F8F1 KLINGON DIGIT ONE U+F8F2 KLINGON DIGIT TWO U+F8F3 KLINGON DIGIT THREE U+F8F4 KLINGON DIGIT FOUR U+F8F5 KLINGON DIGIT FIVE U+F8F6 KLINGON DIGIT SIX U+F8F7 KLINGON DIGIT SEVEN U+F8F8 KLINGON DIGIT EIGHT U+F8F9 KLINGON DIGIT NINE Otras escrituras ficticias y artificiales ----------------------------------------- Tras la asignación del bloque Klingon Unicode Linux, John Cowan, , ha establecido un registro con escrituras ficticias y artificiales. El Registro Unicode ConScript está accesible en http://locke.ccil.org/~cowan/csur/; los rangos asignados llegan al final de la zona de usuario, y por lo tanto no pueden ser asignados de manera normativa, pero se recomienda a la gente que codifique escrituras ficticias que utilicen estos códigos, para lograr una interoperabilidad. Para el klingon, CSUR ha utilizado la codificación Linux. H. Peter Anvin Traducción para NuLies: David Marín Carreño David Martínez Moreno,