Outils :Vous avez un site web ? Un blog ?
Technorati reactions rencontre |
| Kodierungen |
| Techniken |
Der Universal Character Set (UCS) ist eine Zeichenkodierung, die im internationalen Standard ISO/IEC 10646 definiert ist. Für alle praktischen Belange ist dies dasselbe wie Unicode.
Er wird von ISO/IEC/JTC1/SC2/WG2 entwickelt.
Ursprünglich wurden diese beiden Formate definiert:
Die Gruppe arbeitet sehr eng mit dem Unicode-Konsortium zusammen, die die Standards ständig in neuen Versionen synchronisieren. Aufgrund dessen sind alle Kodierungen aus Interoperabilitätsgründen auf die bei Unicode erlaubten 1.112.064 (= 220+216, abzüglich 211 Surrogate-Paare von UTF-16) Zeichen (von U+00000 bis U+0D7FF, sowie U+0E000 bis U+10FFFF) beschränkt.
In der Version ISO/IEC 10646-3:2003 werden die gleichen Formate UTF-8, UTF-16 und UTF-32 beschrieben wie in Unicode 4.0.