前几天遇到一个US7ASCII字符集的数据库,无论在客户端如何设置字符集都无法通过程序正确读出数据库中的中文汉字,辛苦地查了很多资料,都说是ORACLE的一大BUG,如何解决这一问题呢?在不断的试验中发现,采用OLEDB方式+设置客户端字符集与服务器端字符集使其一致的方法可以在程序中正确读出汉字。兴奋之余,感叹为什么oracle和微软提供的DLL没有考虑到不同字符集之间,数据的一致性问题,从oracle8I到oracle11g跨度如此之久!!!

附字符集说明引用自网上的文章

一、什么是oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE

支持国家语言的体系结构允许你使用本地化语言来存储,处理,检索数据。它使数据库工具,错误消息,排序次序,日期,时间,货币,数字,和日历自动适应本地化语言和平台。

影响oracle数据库字符集最重要的参数是NLS_LANG参数。它的格式如下:

NLS_LANG =

language_territory.charset

它有三个组成部分(语言、地域和字符集),每个成分控制了NLS子集的特性。其中:

Language 指定服务器消息的语言,territory

指定服务器的日期和数字格式,charset 指定字符集。如:AMERICAN _ AMERICA. ZHS16GBK

从NLS_LANG的组成我们可以看出,真正影响数据库字符集的其实是第三部分。所以两个数据库之间的字符集只要第三部分一样就可以相互导入导出数据,前面影响的只是提示信息是中文还是英文。

二、如何查询Oracle的字符集

很多人都碰到过因为字符集不同而使数据导入失败的情况。这涉及三方面的字符集,一是oracel

server端的字符集,二是oracle

client端的字符集;三是dmp文件的字符集。在做数据导入的时候,需要这三个字符集都一致才能正确导入。

1、查询oracle server端的字符集

有很多种方法可以查出oracle

server端的字符集,比较直观的查询方法是以下这种:SQL>select

userenv(‘language’) from dual;

结果类似如下:AMERICAN _ AMERICA.

ZHS16GBK

2、如何查询dmp文件的字符集

用oracle的exp工具导出的dmp文件也包含了字符集信息,dmp文件的第2和第3个字节记录了dmp文件的字符集。如果dmp文件不大,比如只有几M或几十M,可以用UltraEdit打开(16进制方式),看第2第3个字节的内容,如0354,然后用以下SQL查出它对应的字符集:

SQL> select

nls_charset_name(to_number('0354','xxxx')) from dual;

ZHS16GBK

如果dmp文件很大,比如有2G以上(这也是最常见的情况),用文本编辑器打开很慢或者完全打不开,可以用以下命令(在unix主机上):

cat exp.dmp |od -x|head -1|awk

'{print $2 $3}'|cut -c 3-6

然后用上述SQL也可以得到它对应的字符集。

3、查询oracle client端的字符集

这个比较简单。在windows平台下,就是注册表里面相应OracleHome的NLS_LANG。还可以在dos窗口里面自己设置,比如:

set

nls_lang=AMERICAN_AMERICA.ZHS16GBK

这样就只影响这个窗口里面的环境变量。

在unix平台下,就是环境变量NLS_LANG。

$echo $NLS_LANG

AMERICAN_AMERICA.ZHS16GBK

如果检查的结果发现server端与client端字符集不一致,请统一修改为同server端相同的字符集。

三、修改oracle的字符集

上文说过,oracle的字符集有互相的包容关系。如us7ascii就是zhs16gbk的子集,从us7ascii到zhs16gbk不会有数据解释上的问题,不会有数据丢失。在所有的字符集中utf8应该是最大,因为它基于unicode,双字节保存字符(也因此在存储空间上占用更多)。

一旦数据库创建后,数据库的字符集理论上讲是不能改变的。因此,在设计和安装之初考虑使用哪一种字符集十分重要。根据Oracle的官方说明,字符集的转换是从子集到超集受支持,反之不行。如果两种字符集之间根本没有子集和超集的关系,那么字符集的转换是不受oracle支持的。对数据库server而言,错误的修改字符集将会导致很多不可测的后果,可能会严重影响数据库的正常运行,所以在修改之前一定要确认两种字符集是否存在子集和超集的关系。一般来说,除非万不得已,我们不建议修改oracle数据库server端的字符集。特别说明,我们最常用的两种字符集ZHS16GBK和ZHS16CGB231280之间不存在子集和超集关系,因此理论上讲这两种字符集之间的相互转换不受支持。

1、修改server端字符集(不建议使用)

在oracle

8之前,可以用直接修改数据字典表props$来改变数据库的字符集。但oracle8之后,至少有三张系统表记录了数据库字符集的信息,只改props$表并不完全,可能引起严重的后果。正确的修改方法如下:

$sqlplus /nolog

SQL>conn / as

sysdba;

若此时数据库服务器已启动,则先执行SHUTDOWN

IMMEDIATE命令关闭数据库服务器,然后执行以下命令:

SQL>STARTUP MOUNT;

SQL>ALTER SYSTEM

ENABLE RESTRICTED SESSION;

SQL>ALTER SYSTEM SET

JOB_QUEUE_PROCESSES=0;

SQL>ALTER SYSTEM SET

AQ_TM_PROCESSES=0;

SQL>ALTER DATABASE

OPEN;

SQL>ALTER DATABASE

CHARACTER SET ZHS16GBK;

SQL>ALTER DATABASE

national CHARACTER SET ZHS16GBK;

SQL>SHUTDOWN

IMMEDIATE;

SQL>STARTUP

2、修改dmp文件字符集

上文说过,dmp文件的第2第3字节记录了字符集信息,因此直接修改dmp文件的第2第3字节的内容就可以‘骗’过oracle的检查。这样做理论上也仅是从子集到超集可以修改,但很多情况下在没有子集和超集关系的情况下也可以修改,我们常用的一些字符集,如US7ASCII,WE8ISO8859P1,ZHS16CGB231280,ZHS16GBK基本都可以改。因为改的只是dmp文件,所以影响不大。

具体的修改方法比较多,最简单的就是直接用UltraEdit修改dmp文件的第2和第3个字节。比如想将dmp文件的字符集改为ZHS16GBK,可以用以下SQL查出该种字符集对应的16进制代码:

SQL> select

to_char(nls_charset_id('ZHS16GBK'), 'xxxx') from dual;

0354

然后将dmp文件的2、3字节修改为0354即可。

如果dmp文件很大,用ue无法打开,就需要用程序的方法了。网上有人用java存储过程写了转换的程序(用java存储过程的好处是通用性教好,缺点是比较麻烦)。我在windows下测试通过。但要求oracle数据库一定要安装JVM选项。

oracle us7ascii 中文,US7ASCII字符集中汉字显示问题相关推荐

  1. python读取us7ascii字符集Oracle数据库中文乱码问题的解决方案

    python读取us7ascii字符集Oracle数据库中文乱码问题的解决方案 参考文章: (1)python读取us7ascii字符集Oracle数据库中文乱码问题的解决方案 (2)https:// ...

  2. ORACLE字符集为US7ASCII,插入数据,中文乱码问题解决

    1.可以通过select * from nls_database_parameters where parameter ='NLS_CHARACTERSET';查到ORACLE的字符集 US7ASCI ...

  3. oracle改变字符集影响,影响ORACLE汉字显示的字符集问题

    在国内外大中型数据库管理系统中,把ORACLE作为数据库管理平台的用户比较多.ORACLE 不论是数据库管理能力还是安全性都是无可非议的,但是,它在汉字信息的显示方面着实给中国用户带来不少麻烦,笔者多 ...

  4. Oracle一个中文汉字占用几个字节

    Oracle 一个中文汉字 占用几个字节,要根据Oracle中字符集编码决定   查看oracle server端字符集 select userenv('language') from dual; 如 ...

  5. oracle中文占3,Oracle一个中文汉字占用几个字节

    Oracle一个中文汉字占用几个字节,要根据Oracle中字符集编码决定. --查看oracle server端字符集 select userenv('language') from dual; -- ...

  6. python画图显示不了中文_完美解决Python matplotlib绘图时汉字显示不正常的问题

    Matplotlib是一个很好的作图软件,但是python下默认不支持中文,所以需要做一些修改,方法如下: 1.在python安装目录的Lib目录下创建ch.py文件. 文件中代码为: 保存,以后通过 ...

  7. php 入库乱码,解决php 中文字符入库或显示乱码的简单示例

    这篇文章主要为大家详细介绍了解决php 中文字符入库或显示乱码的简单示例,具有一定的参考价值,可以用来参考一下. 感兴趣的小伙伴,下面一起跟随512笔记的小编小韵来看看吧!大家以后在编写过程中, 一定 ...

  8. vscode中文备注出现方框标注显示此字符非ascii字符如何取消

    描述:vscode中文备注出现方框标注显示此字符非ascii字符如何取消 步骤: 点击方框-选择禁止显示此字符非ascii字符显示

  9. oracle 汉字显示问号

    oracle 查表汉字显示问号,不管是plsql 还是从系统sqlplus登录,汉字的显示都是问号. 解决方法如下: 查看当前字符集 select userenv('language') from d ...

最新文章

  1. 20 个 Pandas 数据实战案例,干货多多
  2. LINUX 系统 安装Jexus 5.6和mono3.4 部署.net 环境
  3. OpenCV霍夫直线houghlines点集的实例(附完整代码)
  4. python 语音识别机器人控制系统_python人脸识别+语音识别 的监控系统
  5. skysat重访周期_重访小恶梦
  6. python discuz搜索api_python如何模拟搜索引擎分词
  7. 建议重写equals方法时也一并重写hashCode方法
  8. redis超时原因排查
  9. mysql5.6.4安装_win 7 64 mysql 5.6.4 安装
  10. 7 php 内存泄漏_APP内存优化之内存泄漏
  11. 网狐棋牌游戏用户数据库QPAccountsDB开发文档
  12. dmx512 java_什么书通过软件层讲解DMX512协议
  13. STC-ISP烧录软件
  14. 2020区块链百强榜暨战疫优秀企业评选|链塔智库
  15. leapftp怎么下载文件,用leapftp怎么下载文件
  16. 详解无刷直流电机的工作原理
  17. html caption 靠左,HTML caption align 属性 | Paoo教程
  18. 《正确去掉Win7快捷方式小箭头》
  19. Socket网络编程学习笔记 (10)简易聊天室案例
  20. android+捕获google账户+cancel按钮,MVVM: 这是一个android MVVM 框架,基于谷歌dataBinding技术实现...

热门文章

  1. 查找练习 hash——出现过的数字
  2. fatal error: GL/glew.h: 没有那个文件或目录
  3. SLS多云日志采集、处理及分析
  4. 全球加速产品 方便更多学生获得申请名校的机会
  5. 2020将至,谈谈中小企业创业的那些事儿
  6. 地理文本处理技术在高德的演进(下)
  7. 混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践
  8. CSDN 十大技术主题盘点-云原生篇
  9. 市值突破3000亿,Fortinet发布2021Q2财报
  10. 【重磅快讯】T11 2019数据智能技术峰会举办,AI将成为行业颠覆者