unicode编码?unicode编码转换工具
一、unicode编码是不等长编码吗
包括定长格式,也有不定长的部分
二、unicode字符集是unicode联盟开发的一种多少位字符编码标准
最初的unicode编码是固定长度的,16位,也就是2两个字节代表一个字符,这样一共可以表示65536个字符。显然,这样要表示各种语言中所有的字符是远远不够的。Unicode4.0规范考虑到了这种情况,定义了一组附加字符编码,附加字符编码采用2个16位来表示,这样最多可以定义1048576个附加字符,目前unicode4.0只定义了45960个附加字符。
Unicode只是一个编码规范,目前实际实现的unicode编码只要有三种:UTF-8,UCS-2和UTF-16,三种unicode字符集之间可以按照规范进行转换。
三、什么是unicode格式
Unicode是一种可能的宽字符集。由Unicode协会开发的能表示几乎世界上所有书写语言的字符编码标准。Unicode字符清单有多种代表形式,包括UTF-8、UTF-16和UTF-32。大多Windows界面使用UTF-16。Unicode传输格式8(UTF-8)在ASCII码基础上发展的协议字符设置。
UTF-8协议提供ASCII码的扩展支持,UCS-2码的翻译,国际16进制Unicode编码字符设置。
与使用字符数据的ASCII或扩展ASCII编码相比,UTF-8可获得更大范围的名称。Unicode字符系统(UCS)作为Unicode标准一部分的国际标准字符集参考。现在广泛使用的UCS标准的版本是UCS-2,该版本指定的16位字符数值已作为世界上大多数语言的编码标准而被接受,并得到了承认。直接选unicode就可以了。如果没有特殊字符,ansi保存也没事。