As codificações permitem-lhe especificar a codificação de caracteres do texto.
O nome IANA é utilizado na declaração de codificação de um ficheiro XML ou numa directiva de conjunto de caracteres num ficheiro HTML.
Os editores HTML e XML suportam as codificações seguintes:
| Codificação XML (Nome IANA) |
Descrição |
|---|---|
| BIG5 |
Big5, Chinês tradicional |
| EUC-JP |
Codificação EUC, Japonês |
| EUC-KR |
Codificação EUC, Coreano |
| GB2312 |
GBK, Chinês simplificado |
| GB18030 | Padrão nacional, Chinês |
| IBM864 | Árabe PC (codificação não suportada pela concepção da página do designer da página.) |
| ISO-2022-JP |
ISO 2022, Japonês |
| ISO-2022-KR |
ISO 2022, Coreano |
| ISO-8859-1 |
ISO Latim-1 |
| ISO-8859-2 | Europeu Central/Leste (Eslavo) |
| ISO-8859-3 | Europeu Meridional |
| ISO-8859-4 | ISO 8859-4, Cirílico |
| ISO-8859-5 | ISO 8859-5, Cirílico |
| ISO-8859-6 |
Árabe (Lógico) |
| ISO-8859-7 | Grego |
| ISO-8859-8-I |
Hebraico (codificação lógica) |
| ISO-8859-8 |
Hebraico (Visual)(codificação suportada, mas não suportada pela concepção da página do designer da página) |
| ISO-8859-9 | Turco |
| SHIFT_JIS |
Shift-JIS, Japonês |
| TIS-620 | TISI, Tailandês |
| US-ASCII |
US ASCII |
| UTF-8 |
ISO 10646/Unicode, codificação de um byte |
| UTF-16 |
ISO 10646/Unicode, codificação de dois bytes |
| UTF-16BE |
Unicode BigEndian |
| UTF-16LE |
Unicode LittleEndian |
| WINDOWS-874 | Tailandês, Microsoft |
| WINDOWS-1252 |
ISO Latim-1 |
| WINDOWS-1255 |
Hebraico |
| WINDOWS-1256 |
Árabe |
| X-EUC-JP | Codificação EUC, Japonês (nome alternativo para EUC-JP) |
| X-SJIS | Shift-JIS, Japonês (nome alternativo para SHIFT_JIS) |