Unicode Y el carácter que codifica en general es una área sujeta compleja enorme y soy sólo provisionalmente conversant con las posibilidades inherentes therein. Sé que utilizando UTF-8 tiende para mostrarme el menos número de untranslatable caracteres en el texto que puedo de hecho leído (IE: mayoritariamente inglés) y aquello es según lo que yo ha estudiado el tema. Las mesas abajo son un ejemplo, pero en ninguna parte acercarse un estandard'.
Honestamente, justo eché esta mesa genérica junta porque
ilustra qué la instrumentación puede subsume existiendo estándares.
Estos Unicode las mesas proporcionarán una manera nativa de introducir texto de sistemas
de escritura múltiple de modo que pueda ser utilizado con las
funciones de búsqueda interna de la instrumentación. hay probablemente
muchos "texto Más" Intuitivo formatos de mesa que esta importación directa,
pero esto es utilizable, si incómodo.
Incluyendo el Unicode
las mesas harán la instrumentación independiente de la necesidad para cualquier
teclado allende la Instrumentación
Chorded Teclado para introducir el texto en cualquier carácter pone
cubierto por Unicode.
EBCDIC
(De hecho "Extendido, Binario Coded Decimal, Código
de Intercambio") es la mesa de carácter utilizada por teletipos y el Sistema
de IBM/360, el cual era el 8 Kilobyte mainframe el ordenador utilizado
en el 1960s. Aquello es bien, 8K de RAM. Si necesitaste más espacial
que que, tuviste que página él en y fuera de la memoria
de cinta atrás-arriba.
Aquellas imágenes de película viejas de (GRANDES SCARY ORDENADOR!) Devana para devanar las cintas que giran madly de hecho está mostrando la lectura de ordenador y escribiendo su 8K de RAM mientras él slogs a través de algún "Negocio Común rutina de clase" de Lengua Orientada. Naturalmente, esto era cuándo memoria de núcleo magnético estuvo utilizado y un 'bit' ocupado un chunk de ferrita que te podría ver sin vuestros bifocales (y todavía, éramos felices).
Este bloque es justo uno parte pequeña del Unicode 3.1 (ISO 10646-2) estándar ( pienso). La instrumentación puede codificar 24 bits en una área sola, así que tendríamos que ser capaces de importar la parte útil entera del UCS espacio de dirección sin modificación. Elegí EBCDIC, porque:
Habrá muchos otro byte solo y doble mapas de carácter
dentro de esta Área del espacio de dirección de la Instrumentación, esto justo
pasa para ser el utilicé como un ejemplo.
Este bloque no de hecho utiliza los Tipos en absoluto. El número en
cada célula es el "Nombre Simbólico" del Linux "charmap" schema.
El "Carácter que Codifica" el número podría haber sido una elección mejor,
pero elegí el aquello era más fácil de escanear (las mesas de HTML
abajo estuvieron creadas por un Java programa que escribí).
Este bloque requeriría la Ocupación lath. Aquello lo pondría
en algún lugar en la #02 área de Especialización. Actualmente estoy planeando
encima dedicando el entero #02 área a traducción de carácter por
importador el fondo seis bytes del Unicode estándar de mapeo
directamente a esta área. probablemente habrá un bloque o dos en
la "Área de Interfaz del usuario" que proporcionará nombres de conjunto de carácter
de ISO como un índice externo a estas mesas (porque el Unicode
mesas, tristemente, no sigue la Instrumentación
plan de indexación estándar).
Los plazos están organizados a cuatro mesas, cada conteniendo cuatro
sub-mesas (o bancos) cuáles constan de dieciséis células. Cada célula contiene un
nombre de carácter estándar. El headings antes de las cuatro mesas
abajo son totalmente genéricos. Las filas oscuras y las columnas dentro de cada
mesa son también absolutamente genéricos.
Soy realmente sólo utilizando este formato fuera de hábito. Si hay cualquier
patrón al diseño de carácter abajo es puramente coincidente.
sub-Mesa0 | col1 | col2 | Ambos | |
#00 - NULL (NUL) | #01 - INICIO DE ENCABEZAR (SOH) | #02 - INICIO DE TEXTO (STX) | #03 - FIN DE TEXTO (ETX) | |
Fila1 | #04 - FIN DE TRANSMISIÓN (EOT) | #05 - CONSULTA (ENQ) | #06 - RECONOCER (ACK) | #07 - BELL (BELIO) |
Fila2 | #08 - BACKSPACE (BS) | #TABULACIÓN de 09 CARACTERES (HT) | #0Un - TACHAR ALIMENTAR (LF) | #0B - TABULACIÓN de LÍNEA (VT) |
Ambos | #0C - FORMAR ALIMENTAR (FF) | #0D - RETORNO DE CARRO (CR) | #0E - CAMBIAR FUERA (ASÍ QUE) | #0F - CAMBIO EN (SI) |
sub-Mesa1 | col1 | col2 | Ambos | |
#10 - DATALINK ESCAPADA (DLE) | #CONTROL de 11 DISPOSITIVOS UN (DC1) | #CONTROL de 12 DISPOSITIVOS DOS (DC2) | #CONTROL de 13 DISPOSITIVOS TRES (DC3) | |
Fila1 | #CONTROL de 14 DISPOSITIVOS CUATRO (DC4) | #15 - NEGATIVO RECONOCER (NAK) | #16 - SÍNCRONO IDLE (SYN) | #17 - FIN DE BLOQUE de TRANSMISIÓN (ETB) |
Fila2 | #18 - CANCELAR (LATA) | #19 - FIN DE MEDIO (EM) | #1Un - SUSTITUTO (SUB) | #1B - ESCAPADA (ESC) |
Ambos | #1C - ARCHIVO SEPARATOR (ES4) | #1D - GRUPO SEPARATOR (ES3) | #1E - RÉCORD SEPARATOR (ES2) | #1F - UNIDAD SEPARATOR (ES1) |
sub-Mesa2 | col1 | col2 | Ambos | |
#20 - ESPACIAL | #21 - | #22 - | #23 - | |
Fila1 | #24 - | #SEÑAL de 25 PORCENTAJES | #26 - AMPERSAND | #27 - APÓSTROFO |
Fila2 | #28 - PARÉNTESIS IZQUIERDO | #29 - PARÉNTESIS CORRECTO | #2Un - ASTERISCO | #2B - SEÑAL de PLUS |
Ambos | #2C - COMA | #2D - GUIÓN-MINUS | #2E - PUNTO Y APARTE | #2F - SOLIDUS |
sub-Mesa3 | col1 | col2 | Ambos | |
#30 - DÍGITO CERO | #31 - DÍGITO UN | #32 - DÍGITO DOS | #33 - DÍGITO TRES | |
Fila1 | #34 - DÍGITO CUATRO | #35 - DÍGITO CINCO | #36 - DÍGITO SEIS | #37 - DÍGITO SIETE |
Fila2 | #38 - DÍGITO OCHO | #39 - DÍGITO NUEVE | #3Un - COLON | #3B - PUNTO Y COMA |
Ambos | #3C - MENOS-QUE SEÑAL | #3D - EQUALS SEÑAL | #3E - más GRANDE-QUE SEÑAL | #3F - SIGNO DE INTERROGACIÓN |
sub-Mesa0 | col1 | col2 | Ambos | |
#40 - | #41 - MAYÚSCULA LATINA Un | #42 - MAYÚSCULA LATINA B | #43 - MAYÚSCULA LATINA C | |
Fila1 | #44 - MAYÚSCULA LATINA D | #45 - MAYÚSCULA LATINA E | #46 - MAYÚSCULA LATINA F | #47 - G de MAYÚSCULA LATINA |
Fila2 | #48 - MAYÚSCULA LATINA H | #49 - MAYÚSCULA LATINA yo | #4Un - MAYÚSCULA LATINA J | #4B - MAYÚSCULA LATINA K |
Ambos | #4C - MAYÚSCULA LATINA L | #4D - MAYÚSCULA LATINA M | #4E - MAYÚSCULA LATINA N | #4F - MAYÚSCULA LATINA O |
sub-Mesa1 | col1 | col2 | Ambos | |
#50 - MAYÚSCULA LATINA P | #51 - MAYÚSCULA LATINA Q | #52 - MAYÚSCULA LATINA R | #53 - MAYÚSCULA LATINA S | |
Fila1 | #54 - MAYÚSCULA LATINA T | #55 - MAYÚSCULA LATINA U | #56 - MAYÚSCULA LATINA V | #57 - MAYÚSCULA LATINA W |
Fila2 | #58 - MAYÚSCULA LATINA X | #59 - MAYÚSCULA LATINA Y | #5Un - MAYÚSCULA LATINA Z | #5B - |
Ambos | #5C - | #5D - | #5E - | #5F - LÍNEA BAJA |
sub-Mesa2 | col1 | col2 | Ambos | |
#60 - | #61 - LETRA PEQUEÑA LATINA Un | #62 - LETRA PEQUEÑA LATINA B | #63 - LETRA PEQUEÑA LATINA C | |
Fila1 | #64 - LETRA PEQUEÑA LATINA D | #65 - LETRA PEQUEÑA LATINA E | #66 - LETRA PEQUEÑA LATINA F | #67 - G de LETRA PEQUEÑO LATINO |
Fila2 | #68 - LETRA PEQUEÑA LATINA H | #69 - LETRA PEQUEÑA LATINA yo | #6Un - LETRA PEQUEÑA LATINA J | #6B - LETRA PEQUEÑA LATINA K |
Ambos | #6C - LETRA PEQUEÑA LATINA L | #6D - LETRA PEQUEÑA LATINA M | #6E - LETRA PEQUEÑA LATINA N | #6F - LETRA PEQUEÑA LATINA O |
sub-Mesa3 | col1 | col2 | Ambos | |
#70 - LETRA PEQUEÑA LATINA P | #71 - LETRA PEQUEÑA LATINA Q | #72 - LETRA PEQUEÑA LATINA R | #73 - LETRA PEQUEÑA LATINA S | |
Fila1 | #74 - LETRA PEQUEÑA LATINA T | #75 - LETRA PEQUEÑA LATINA U | #76 - LETRA PEQUEÑA LATINA V | #77 - LETRA PEQUEÑA LATINA W |
Fila2 | #78 - LETRA PEQUEÑA LATINA X | #79 - LETRA PEQUEÑA LATINA Y | #7Un - LETRA PEQUEÑA LATINA Z | #7B - |
Ambos | #7C - LÍNEA VERTICAL | #7D - | #7E - | #7F - ELIMINAR (DEL) |
sub-Mesa0 | col1 | col2 | Ambos | |
#80 - ACOLCHANDO CARÁCTER (PLATAFORMA) | #81 - OCTETO ALTO PRESET (HOP) | #82 - ROMPER PERMITTED AQUÍ (BPH) | #83 - NINGUNA ROTURA AQUÍ (NBH) | |
Fila1 | #84 - ÍNDICE (IND) | #85 - LÍNEA PRÓXIMA (NEL) | #86 - INICIO DE ÁREA SELECCIONADA (SSA) | #87 - FIN DE ÁREA SELECCIONADA (ESA) |
Fila2 | #TABULACIÓN de 88 CARACTERES PONE (HTS) | #TABULACIÓN de 89 CARACTERES CON JUSTIFICACIÓN (HTJ) | #8Un - TABULACIÓN de LÍNEA PONE (VTS) | #8B - DELANTERO de LÍNEA PARCIAL (PLD) |
Ambos | #8C - LÍNEA PARCIAL BACKWARD (PLU) | #8D - la línea INVERSA ALIMENTA (RI) | #8E - SOLO-CAMBIO DOS (SS2) | #8F - SOLO-CAMBIO TRES (SS3) |
sub-Mesa1 | col1 | col2 | Ambos | |
#CONTROL de 90 DISPOSITIVOS CUERDA (DCS) | #91 - USO PRIVADO UN (PU1) | #92 - USO PRIVADO DOS (PU2) | #93 - PONE TRANSMITE ESTADO (STS) | |
Fila1 | #94 - CANCELAR CARÁCTER (CCH) | #95 - el mensaje que ESPERA (MW) | #96 - INICIO DE GUARDED ÁREA (BALNEARIO) | #97 - FIN DE GUARDED ÁREA (EPA) |
Fila2 | #98 - INICIO DE CUERDA (SOS) | #99 - CARÁCTER GRÁFICO SOLO INTRODUCER (SGCI) | #9Un - CARÁCTER SOLO INTRODUCER (SCI) | #9B - SECUENCIA de CONTROL INTRODUCER (CSI) |
Ambos | #9C - CUERDA TERMINATOR (ST) | #9ORDEN de D SISTEMAS OPERATIVOS (OSC) | #9E - MENSAJE de INTIMIDAD (PM) | #9F - ORDEN de PROGRAMA de la APLICACIÓN (APC) |
sub-Mesa2 | col1 | col2 | Ambos | |
#Un0 - | #Un1 - | #Un2 - | #Un3 - | |
Fila1 | #Un4 - | #Un5 - | #Un6 - BARRA ROTA | #Un7 - |
Fila2 | #Un8 - | #Un9 - | #AA - | #AB - |
Ambos | #AC - NO FIRMAR | #ANUNCIO - | #AE - | #AF - |
sub-Mesa3 | col1 | col2 | Ambos | |
#B0 - | #B1 - | #B2 - | #B3 - | |
Fila1 | #B4 - | #B5 - | #B6 - | #B7 - |
Fila2 | #B8 - | #B9 - | #BA - | #BB - |
Ambos | #BC - | #BD - | #SER - | #BF - |
sub-Mesa0 | col1 | col2 | Ambos | |
#C0 - | #C1 - | #C2 - | #C3 - | |
Fila1 | #C4 - | #C5 - MAYÚSCULA LATINA Un CON ANILLO ENCIMA | #C6 - MAYÚSCULA LATINA AE | #C7 - |
Fila2 | #C8 - | #C9 - | #CA - | #CB - |
Ambos | #CC - | #CD - | #CE - | #CF - |
sub-Mesa1 | col1 | col2 | Ambos | |
#D0 - | #D1 - | #D2 - | #D3 - | |
Fila1 | #D4 - | #D5 - | #D6 - | #D7 - |
Fila2 | #D8 - MAYÚSCULA LATINA O CON GOLPE | #D9 - | #DA - | #DB - |
Ambos | #DC - | #DD - | #DE - | #DF - |
sub-Mesa2 | col1 | col2 | Ambos | |
#E0 - | #E1 - | #E2 - | #E3 - | |
Fila1 | #E4 - | #E5 - LETRA PEQUEÑA LATINA Un CON ANILLO ENCIMA | #E6 - LETRA PEQUEÑA LATINA AE | #E7 - |
Fila2 | #E8 - | #E9 - | #EA - | #EB - |
Ambos | #EC - | #ED - | #EE - | #EF - |
sub-Mesa3 | col1 | col2 | Ambos | |
#F0 - | #F1 - | #F2 - | #F3 - | |
Fila1 | #F4 - | #F5 - | #F6 - | #F7 - |
Fila2 | #F8 - LETRA PEQUEÑA LATINA O CON GOLPE | #F9 - | #FA - | #FB - |
Ambos | #FC - | #FD - | #FE - | #FF - |