在工作中经常会用到GB2312和BIG5,Unicode/UTF8等编码之间的互相转化,也有很多程序员对这个问题不断的提问,现在我把我的

实现告诉大家.

#include "Utf8.h"

void ConvertGBKToUtf8(char *strGBK , int maxlen )
{
    int len=MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, NULL,0);
    unsigned short * wszUtf8 = new unsigned short[len+1];
    memset(wszUtf8, 0, len * 2 + 2);
    MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, wszUtf8, len);
 
    len = WideCharToMultiByte(CP_UTF8, 0, wszUtf8, -1, NULL, 0, NULL, NULL);
    char *szUtf8=new char[len + 1];
    memset(szUtf8, 0, len + 1);
    WideCharToMultiByte (CP_UTF8, 0, wszUtf8, -1, szUtf8, len, NULL,NULL);
 
 
 if (strlen( szUtf8) >= (unsigned)maxlen)
 {
  strncpy( strGBK , szUtf8 , maxlen -1 );
  strGBK[ maxlen -2 ] = 0 ;
  strGBK[ maxlen -1 ] = 0 ;
  
 }
 strcpy( strGBK , szUtf8 );
 
 //  if (wcslen( szUtf8 ) > maxlen )
 //  {
 //   
 //  }
 //     wcscpy(strGBK, szUtf8);
 
    delete[] szUtf8;
    delete[] wszUtf8;
}

void ConvertUtf8ToGBK(char *strUtf8  , int maxlen  )
{
    int len=MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, NULL,0);
    unsigned short * wszGBK = new unsigned short[len+1];
    memset(wszGBK, 0, len * 2 + 2);
    MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, wszGBK, len);
 
    len = WideCharToMultiByte(CP_ACP, 0, wszGBK, -1, NULL, 0, NULL, NULL);
    char *szGBK=new char[len + 1];
    memset(szGBK, 0, len + 1);
    WideCharToMultiByte (CP_ACP, 0, wszGBK, -1, szGBK, len, NULL,NULL);
 
 if ( strlen( szGBK ) >= (unsigned)maxlen )
 {
  strncpy( strUtf8 , szGBK , maxlen - 1   ) ;
  strUtf8[maxlen - 1 ] = 0 ;
 }
 else
 {
  strcpy(strUtf8, szGBK);
 }
    delete[] szGBK;
    delete[] wszGBK;
}

wchar_t* GB2312ToUnicode(const char* szGBString)
{
 UINT nCodePage = 936; //GB2312
 int nLength=MultiByteToWideChar(nCodePage,0,szGBString,-1,NULL,0);
 wchar_t* pBuffer = new wchar_t[nLength+1];
 MultiByteToWideChar(nCodePage,0,szGBString,-1,pBuffer,nLength);
 pBuffer[nLength]=0;
 return pBuffer;
}

wchar_t* BIG5ToUnicode(const char* szBIG5String)
{
 UINT nCodePage = 950; //BIG5
 int nLength=MultiByteToWideChar(nCodePage,0,szBIG5String,-1,NULL,0);
 wchar_t* pBuffer = new wchar_t[nLength+1];
 MultiByteToWideChar(nCodePage,0,szBIG5String,-1,pBuffer,nLength);
 pBuffer[nLength]=0;
 return pBuffer;
}
char* UnicodeToGB2312(const wchar_t* szUnicodeString)
{
 UINT nCodePage = 936; //GB2312
 int nLength=WideCharToMultiByte(nCodePage,0,szUnicodeString,-1,NULL,0,NULL,NULL);
 char* pBuffer=new char[nLength+1];
 WideCharToMultiByte(nCodePage,0,szUnicodeString,-1,pBuffer,nLength,NULL,NULL);
 pBuffer[nLength]=0;
 return pBuffer;
}
char* UnicodeToBIG5(const wchar_t* szUnicodeString)
{
 UINT nCodePage = 950; //BIG5
 int nLength=WideCharToMultiByte(nCodePage,0,szUnicodeString,-1,NULL,0,NULL,NULL);
 char* pBuffer=new char[nLength+1];
 WideCharToMultiByte(nCodePage,0,szUnicodeString,-1,pBuffer,nLength,NULL,NULL);
 pBuffer[nLength]=0;
 return pBuffer;
}
char* BIG5ToGB2312(const char* szBIG5String)
{
 LCID lcid = MAKELCID(MAKELANGID(LANG_CHINESE,SUBLANG_CHINESE_SIMPLIFIED),SORT_CHINESE_PRC);
 
 wchar_t* szUnicodeBuff = BIG5ToUnicode(szBIG5String);
 char* szGB2312Buff = UnicodeToGB2312(szUnicodeBuff);
 
 int nLength = LCMapString(lcid,LCMAP_SIMPLIFIED_CHINESE, szGB2312Buff,-1,NULL,0);
 char* pBuffer = new char[nLength + 1];
 LCMapString(0x0804,LCMAP_SIMPLIFIED_CHINESE,szGB2312Buff,-1,pBuffer,nLength);
 pBuffer[nLength] = 0;
 
 delete[] szUnicodeBuff;
 delete[] szGB2312Buff;
 return pBuffer;
}
char* GB2312ToBIG5(const char* szGBString)
{
 LCID lcid = MAKELCID(MAKELANGID(LANG_CHINESE,SUBLANG_CHINESE_SIMPLIFIED),SORT_CHINESE_PRC);
 
 int nLength = LCMapString(lcid,LCMAP_TRADITIONAL_CHINESE,szGBString,-1,NULL,0);
 char* pBuffer=new char[nLength+1];
 LCMapString(lcid,LCMAP_TRADITIONAL_CHINESE,szGBString,-1,pBuffer,nLength);
 pBuffer[nLength]=0;
 
 wchar_t* pUnicodeBuff = GB2312ToUnicode(pBuffer);
 char* pBIG5Buff = UnicodeToBIG5(pUnicodeBuff);
 
 delete[] pBuffer;
 delete[] pUnicodeBuff;
 return pBIG5Buff;
}

GB2312和BIG5,Unicode/UTF8等编码之间的互相转化相关推荐

  1. gbk, gb2312,big5,unicode,utf-8,utf-16的区别

    本文转自http://blog.chinaunix.net/uid-446337-id-94462.html详细说明了各种编码的区别于联系,对于支持国际化很重要,否则各种乱码能搞死人! Unicode ...

  2. 各种编码格式(GB2312,GBK,GB18030,unicode,utf-8)之间的关系

    汉字常用编码格式 为了在屏幕上显示字符.需要下面几个步骤: 制作所有字符对应的字模.比如大写字母A长什么样.这个模样就是最终显示在屏幕上图形,即我们看到的字符A. 为对所有的字符进行编码.比如大写字母 ...

  3. Unicode utf8等编码类型的原理

    1.ASCII码  我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte). ...

  4. 正确理解UNICODE UTF-8等编码方式

    [color=darkred]转载出处:[/color][url]http://blog.csdn.net/polarman/archive/2007/04/30/1593159.aspx[/url] ...

  5. ASCII+Unicode+UTF8(字符编码方式-字节) Base64(字节编码方式-64字符)

    Base64 编码是一种可以把二进制文件编码成文本的编码规则.在很多地方地方都有用到,比如我们可以把图像转成 Base64 编码,然后内联到 HTML 或者 CSS 中. Base64 编码用一些很常 ...

  6. Unicode, UTF8, UTF16, UTF32

    Unicode, UTF8, UTF16, UTF32之间的关系 Unicode是编码字符集,而UTF-8, UTF-16, UTF-32是字符集编码. Unicode用一些基本的保留字符制定了三套编 ...

  7. ASCII,unicode, utf8 ,big5 ,gb2312,gbk,gb18030等几种常用编码区别

    ASCII,unicode, utf8 ,big5 ,gb2312,gbk,gb18030等几种常用编码区别 最近老为编码问题而烦燥,下定决心一定要将其弄明白!本文主要总 结网上一些朋友提供的 asc ...

  8. 字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?

    字符编码知识:Unicode.UTF-8.ASCII.GB2312等编码之间是如何转换的? 字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得字符编码的知识.不注意的人可能对这个不在意,但这些 ...

  9. ASCII 、GB2312、GBK、GB18030、unicode、UTF-8字符集编码详解

    ASCII码表在线查询: http://www.weste.net/tools/ASCII.asp ASCII字符集编码 ASCII码是7位编码,字符在计算机中以其ASCII码方式表示,其长度为1个字 ...

最新文章

  1. iOS开发UI篇 -- UISearchBar 属性、方法详解及应用(自定义搜索框样式)
  2. 构建根文件系统之启动第1个程序init
  3. arm--ldm、stm指令解析
  4. Java ObjectStreamField getName()方法与示例
  5. dreamweaver 正则表达式为属性值加上双引号_PHP正则表达式核心技术完全详解 第2节...
  6. 51单片机c语言测距,超声波HM55B测距(STC10F08单片机C程序)
  7. python读取图像并相加_python给图像加上mask,并提取mask区域实例
  8. 圣诞节必备装饰场景PSD设计素材,不仅高清高质量
  9. hdu 3065 病毒侵袭持续中
  10. CSDN markdown 数学公式指导手册
  11. 自己为 GridView 写分页 如: [首页][上一页][下一页][末页]
  12. 你的Android HTTPS真的安全吗?(转载)
  13. 如何寻找已知轮廓的最大内接圆
  14. 纯css绘制斜线表头
  15. C# 实现Excel导出图片
  16. SQLServer实现快速进行简繁体的翻译功能
  17. InfoPath 2007表单应用
  18. Digital Asset与国际衍生品协会携手,布局智能合约在衍生品交易中的使用
  19. 循环结构习题:公式求π值
  20. 特征偏度和异常值处理

热门文章

  1. apollo 高精地图解析
  2. EditText的hint居中,设置EditText的hint位置
  3. mysql字符集mysqldump_Mysqldump 字符集问题
  4. Gamma Correction(伽马校正)
  5. 用计算机专业术语祝福,学习计算机知识必须懂得50个专业术语
  6. MySQL数据库的官网下载、安装及卸载(2018年最新)
  7. pythonQQ机器人系列:使用requests实现QQ机器人聊天(1-0)
  8. 统一网关Gateway-搭建网关服务
  9. 【C++】7-41 互评成绩(PTA)
  10. electron-vue通过配置文件设置baseUrl