数据库字符集?oracle数据库里面怎么查看字符集
大家好,今天来为大家解答数据库字符集这个问题的一些问题点,包括oracle数据库里面怎么查看字符集也一样很多人还不知道,因此呢,今天就来为大家分析分析,现在让我们一起来看看吧!如果解决了您的问题,还望您关注下本站哦,谢谢~
MySQL中数据库的默认字符集和校对规则有哪些
1. ASCII
用途:用来映射简单的单字节字符,比如大小写英文字母、阿拉伯数字、常用的标点符、运算符、控制字符等。
编码范围:U+0000- U+007F
注意:对于用这类字符的场景够用了,但是却无法表达比如汉字,日文等编码。
2. UNICODE
用途:用来映射包含 ASCII以内的其他的所有字符。
编码范围:U+0000- U+10FFFF
注意:ASCII是 UNICODE的子集,ASCII编码的字符可以无损转换为 UNICODE编码的字符。
MySQL常用字符集
1. Latin1
Latin1是 cp1252或者 ISO-8859-1的别名。ISO-8859-1编码是单字节编码,向下兼容 ASCII。
编码范围:U+0000- U+00FF
ISO-8859-1收录的字符除 ASCII收录的字符外,还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。
单字节内的空间都被 ISO-8859-1编码占用,所以能够用 ISO-8859-1编码存储、传输其他任何编码的字节流。
比如把一个 Utf8mb4的编码或者 GBK的编码存入 Latin1,不会有任何问题。因为 Latin1保留了原始的字节流,这也就是 MySQL长期以来把 Latin1做默认字符集的原因。
但是由于 Latin1对任何字符都存放字节流,造成了字符个数的浪费。
比如:
CHAR(10) CHARACTER SET LATIN1;CHAR(10) CHARACTER SET UTF8;
该字段中存储字符个数 UTF8是 Latin1的三倍!!!
2. GB18030
GB18030是中国官方标准字符集,向前兼容 GBK、GB2312,是这两个的超集。用 1、2、4个字节分别表示一个符号。比如对一般中文字符,默认是用两个字节编码存储。Windows系统,默认用的就是 GB18030。
若只是存储中文字符,那 GB18030最佳。
原因有两点:
1)占用空间小,比如比 UTF8小。
2)存储的汉字根据拼音来排序,检索快。
3. UTF8
UTF8是 Unicode的编码实现,可以存储 UNICODE编码对应的任何字符,这也是使用最多的一种编码。最大的特点就是变长的编码方式,用 1到 4个字节表示一个符号,可以根据不同的符号编码字节长度。
字母或数字用 1字节,汉字用 3字节,emoji表情符号用 4字节。UTF8字符集目前是使用最广泛的。
注意!MySQL里常说的 UTF8是 UTF8MB3的别名,UTF8MB3是 UTF8MB4的子集,UTF8MB4才是真正的 4字节 UTF8字符集!
UTF8MB3表示最大支持 3个字节存储字符,UTF8MB4表示最大 4个字节存储字符。根据实际需要和未来展望,MySQL 8.0已经默认用 UTF8MB4基础字符集。
oracle数据库里面怎么查看字符集
1、查询Oracle Server端的字符集:
有很多种方法可以查出oracle server端的字符集,比较直观的查询方法是以下这种:
SQL>select userenv(‘language’) from dual;
结果如下:AMERICAN _ AMERICA. ZHS16GBK。
2、查询dmp文件的字符集:
用Oracle的exp工具导出的dmp文件也包含了字符集信息,dmp文件的第2和第3个字节记录了dmp文件的字符集。如果dmp文件不大,比如只有几M或几十M,可以用UltraEdit打开(16进制方式),看第2第3个字节的内容,如0354,然后用以下SQL查出它对应的字符集:
SQL> select nls_charset_name(to_number('0354','xxxx')) from dual;
ZHS16GBK
3、查询Oracle client端的字符集:
这个比较简单。在Windows平台下,就是注册表里面相应OracleHome的NLS_LANG。还可以在Dos窗口里面自己设置,比如:
set nls_lang=AMERICAN_AMERICA.ZHS16GBK
如果检查的结果发现Server端与Client端字符集不一致,请统一修改为同Server端相同的字符集。
怎样查看数据库的字符集
Oracle数据库查看和修改服务器端的字符集的方法是本文主要要介绍的内容,接下来救让我们一起来了解一下这部分内容。
A、oracle server端字符集查询
select userenv('language') from dual
其中NLS_CHARACTERSET为server端字符集
NLS_LANGUAGE为 server端字符显示形式
B、查询oracle client端的字符集
$echo$NLS_LANG
如果发现你select出来的数据是乱码,请把client端的字符集配置成与linux操作系统相同的字符集。如果还是有乱码,则有可能是数据库中的数据存在问题,或者是oracle服务端的配置存在问题。
C、server端字符集修改
将数据库启动到RESTRICTED模式下做字符集更改:
SQL> conn/as sysdba Connected.
SQL> shutdown immediate;
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL> startup mount ORACLE instance started.
Total System Global Area 236000356 bytes
Fixed Size 451684 bytes
Variable Size 201326592 bytes
Database Buffers 33554432 bytes
Redo Buffers 667648 bytes
Database mounted.
SQL> ALTER SYSTEM ENABLE RESTRICTED SESSION;
System altered.
SQL> ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;
System altered.
SQL> ALTER SYSTEM SET AQ_TM_PROCESSES=0;
System altered.
SQL> alter database open;
Database altered.
SQL> ALTER DATABASE CHARACTER SET ZHS16GBK;
ALTER DATABASE CHARACTER SET ZHS16GBK ERROR at line 1:
ORA-12712: new character set must be a superset of old character set
提示我们的字符集:新字符集必须为旧字符集的超集,这时我们可以跳过超集的检查做更改:
SQL> ALTER DATABASE character set INTERNAL_USE ZHS16GBK;
Database altered.
SQL> select* from v$nls_parameters;
略
19 rows selected.
重启检查是否更改完成:
SQL> shutdown immediate;
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL> startup ORACLE instance started.
Total System Global Area 236000356 bytes
Fixed Size 451684 bytes
Variable Size 201326592 bytes
Database Buffers 33554432 bytes
Redo Buffers 667648 bytes
Database mounted.
Database opened.
SQL> select* from v$nls_parameters;
略
19 rows selected.
我们看到这个过程和之前ALTER DATABASE CHARACTER SET操作的内部过程是完全相同的,也就是说INTERNAL_USE提供的帮助就是使Oracle数据库绕过了子集与超集的校验。
这一方法在某些方面是有用处的,比如测试;应用于产品环境大家应该格外小心,除了你以外,没有人会为此带来的后果负责。
结语(我们不妨再说一次):
对于DBA来说,有一个很重要的原则就是:不要把你的数据库置于危险的境地!
这就要求我们,在进行任何可能对数据库结构发生改变的操作之前,先做有效的备份,很多DBA没有备份的操作中得到了惨痛的教训。
D、client端字符集修改
在/home/oracle与/root用户目录下的。bash_profile中
添加或修改 export NLS_LANG="AMERICAN_AMERICA.UTF8"语句
关于数据库字符集到此分享完毕,希望能帮助到您。