Las codificaciones le permiten especificar la codificación de caracteres que se utilizará para el texto.
El nombre IANA se utiliza en la sentencia de codificación de un archivo XML o en la directiva charset de un archivo HTML.
Los editores HTML y XML dan soporte a las codificaciones siguientes:
| Codificación XML (nombre IANA) |
Descripción |
|---|---|
| BIG5 |
Big5, Chino tradicional |
| EUC-JP |
Codificación EUC, japonés |
| EUC-KR |
Codificación EUC, coreano |
| GB2312 |
GBK, chino simplificado |
| GB18030 | Chino, estándar nacional |
| IBM864 | Árabe PC (codificación a la que no da soporte la página Diseño del diseñador de páginas). |
| ISO-2022-JP |
ISO 2022, japonés |
| ISO-2022-KR |
ISO 2022, coreano |
| ISO-8859-1 |
ISO Latin-1 |
| ISO-8859-2 | Europa central/este (eslavo) |
| ISO-8859-3 | Europa del sur |
| ISO-8859-4 | ISO 8859-4, cirílico |
| ISO-8859-5 | ISO 8859-5, cirílico |
| ISO-8859-6 |
Árabe (lógico) |
| ISO-8859-7 | Griego |
| ISO-8859-8-I |
Hebreo (Lógico) |
| ISO-8859-8 |
Hebreo (codificación soportada pero a la que no da soporte la página Diseño del diseñador de páginas). |
| ISO-8859-9 | Turco |
| SHIFT_JIS |
Shift-JIS, japonés |
| TIS-620 | TISI, tailandés |
| US-ASCII |
US ASCII |
| UTF-8 |
ISO 10646/Unicode, codificación de un solo byte |
| UTF-16 |
ISO 10646/Unicode, codificación de dos bytes |
| UTF-16BE |
Unicode BigEndian |
| UTF-16LE |
Unicode LittleEndian |
| WINDOWS-874 | Tailandés, Microsoft |
| WINDOWS-1252 |
ISO Latin-1 |
| WINDOWS-1255 |
Hebreo |
| WINDOWS-1256 |
Árabe |
| X-EUC-JP | Codificación EUC, japonés (alias para EUC-JP) |
| X-SJIS | Shift-JIS, japonés (alias de SHIFT_JIS) |