---------------------------------------------------------------------------
VC 驿站
WwW.CcTry.CoM
多抽出一分钟时间来学习,让你的生命更加精彩!
C、C++、VC++ 各种学习资源,免费教程,期待您的加入!
动画教程只是起到技术交流的作用,请大家不用利用此方法做非法用途.
由此动画造成的任何后果和动画作者及本站无关.
----------------------------------------------------------------------------------------
大家好,我是Syc
今天给大家做的教程是:
vc++基础班[2]---Ansi与Unicode
----------------------------------------------------------------------------------------
①、Ansi与Unicode简要说明及各自的优缺点:
他们是两种字符的编码格式,Ansi=窄字节,Unicode=宽字节,Ansi用char格式表示一个字符,占用一个字节的存储空间,最多表示255个字符,
表示英文还可以,但对于中文、日文、韩文等语言来说就不够用了,所以如果你的程序是Ansi编码的话,
那么你写的中文语言的程序拿到日文、韩文等系统上面就会出现乱码。所以有了Unicode,用二个字节去表示一个字符,格式是 unsigned short,被定义成 wchar_t 格式
这样就可以表示世界上绝大多数的语言了!但有利就有弊,缺点呢?就是空间占用翻倍了,网络传输的数据量也增大了……

◆ vc++ 6.0 默认为Ansi编码,vs2005、vs2008、vs2010 等默认都是Unicode编码,当然可以进行工程的设置从而进行编码的转换,见演示!

◆ 就我个人观点:还是建议大家使用Unicode宽字节的编码格式,具体见下面:

◆ 系统提供了两种类型的 API 函数,见:user32.dll 中的 MessageBox 函数,其实 MessageBox 他只是一个宏,他对应的两个版本的函数分别为:MessageBoxA 和 MessageBoxW,你在使用的时候系统会根据是否定义了_UNICODE 宏来进行判断该使用哪个版本的函数!如果你的工程没有定义_UNICODE 宏,那么就使用窄字节的 MessageBoxA,如果定义了,那么就使用宽字节的 MessageBoxW,具体在vs2008中,右键找定义,见演示!

◆ 网摘:Windows 2000 及其以后的 Xp、2003、Vista、Win7 等系统都是使用Unicode从头进行开发的,如果调用任何一个Windows API 函数并给它传递一个 ANSI 字符串,那么系统首先要将字符串转换成Unicode,然后将Unicode字符串传递给操作系统。如果希望函数返回ANSI字符串,系统就会先将Unicode字符串转换成ANSI字符串,然后将结果返回给你的应用程序。进行这些字符串的转换需要占用系统的时间和内存。通过从头开始用Unicode来开发应用程序,就能够使你的应用程序更加高效的运行!

==================================================================

②、不同编码格式下的字符串处理及相互转化:

◆ 大家在编程时经常遇到的数据类型:
● Ansi:
char、char * 、const char *
CHAR、(PCHAR、PSTR、LPSTR)、LPCSTR

● Unicode:
wchar_t、wchar_t * 、const wchar_t *
WCHAR、(PWCHAR、PWSTR、LPWSTR)、LPCWSTR

● T 通用类型:
TCHAR、(TCHAR * 、PTCHAR、PTSTR、LPTSTR)、LPCTSTR

以上,其中:P代表指针的意思,STR代表字符串的意思,L是长指针的意思,在WIN32平台下可以忽略,C代表const常量的意思,W代表wide宽字节的意思,T大家可以理解为通用类型的意思,
就是可以根据工程中是否定义_UNICODE 宏,分别定义成不同的类型,比如:TCHAR 类型,如果工程中定义了_UNICODE 宏,那么他最终被定义成 wchar_t 类型,
如果工程中没有定义_UNICODE 宏,那么 TCHAR 被最终定义成 char 类型。

〓※※※〓 其方便性就是修改了工程的编码格式之后不用修改代码,所以还是建议大家在编写程序的时候使用通用类型!

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

◆ 字符串类型的对象的定义:
● Ansi:char *pAnsiStr = "hello";
● Unicode:wchar_t *pUnicodeStr = L"hello";
● 通用类型:TCHAR *pTStr = _T("hello"); 或者 TCHAR *pTStr = _TEXT("hello");
● 动态申请内存:TCHAR *pszBuf = new TCHAR[100];

其中,_TEXT 和 _T 是一样的,定义如下:
#define _T(x) __T(x)
#define _TEXT(x) __T(x)

来看看 __T 的最终定义:
#ifdef _UNICODE
#define __T(x) L##x
#else
#define __T(x) x
#endif

其中,##为连接起来的意思。

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

◆ 常用的字符串处理函数,具体信息见MSDN:
字符串长度:
● Ansi:strlen(char *str);
● Unicode:wcslen(wchar_t *str);
● 通用函数:_tcslen(TCHAR *str);

● Ansi:int atoi(const char *str);
● Unicode:int _wtoi(const wchar_t *str);
● 通用函数:_tstoi(const TCHAR *str);

字符串拷贝:
● Ansi:strcpy(char *strDestination, const char *strSource);
● Unicode:wcscpy(wchar_t *strDestination, const wchar_t *strSource);
● 通用函数:_tcscpy(TCHAR *strDestination, const TCHAR *strSource);

以上函数不安全,在vs2003等以上版本的编译器中会有warnning警告提示,以下为安全函数(vc++6.0不支持):
● Ansi:strcpy_s(char *strDestination, size_t numberOfElements, const char *strSource);
● Unicode:wcscpy_s(wchar_t *strDestination, size_t numberOfElements, const wchar_t *strSource);
● 通用函数:_tcscpy_s(TCHAR *strDestination, size_t numberOfElements, const TCHAR *strSource);

numberOfElements
Size of the destination string buffer. 目的缓冲区的大小,以字节为单位,不是字符!

size_t unsigned integer,在MSDN中的解释:Result of sizeof operator,也就是说 size_t 是 unsigned integer 即无符号整数。那为什么会有size_t这个类型呢?
因为不同平台的操作系统(32/64)中 int/long 等类型所占的字节并不一样,而 size_t 在不同的平台下有不同的定义。有点类似于TCHAR类型:
#ifndef _SIZE_T_DEFINED
#ifdef _WIN64
typedef unsigned __int64 size_t; //8个字节,64位
#else
typedef _W64 unsigned int size_t; //4个字节,32位
#endif
#define _SIZE_T_DEFINED
#endif

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

◆ Ansi 与 Unicode 字符串类型的互相转换:
上面给大家介绍的都是窄字节就是窄字节,宽字节就是宽字节,那么下面就给大家介绍下他们两个之间的转换。
在程序中还是不建议大家来回来去的进行字符串编码之间的转换,要么就都使用Ansi,要么就都使用Unicode,
但是往往有些函数只提供了窄字节版本(比如:GetProcAddress)或者只提供宽字节版本(比如:CommandLineToArgvW),
这个时候就要进行字符串编码格式的转换了。

但是,不是所有的都需要转换,有一些是不需要转换的,比如 socket 中的 send 或者 recv 函数!

● 转换用到的最根本的 API 函数:
WideCharToMultiByte 实现宽字节转换到窄字节
MultiByteToWideChar 实现窄字节转换到宽字节

WideCharToMultiByte 的代码页用来标记与新转换的字符串相关的代码页;
MultiByteToWideChar 的代码页用来标记与一个多字节字符串相关的代码页,

[1]、常用的代码页有 CP_ACP 和 CP_UTF8 两个:
使用 CP_ACP 代码页就实现了 ANSI 与 Unicode 之间的转换;--- 我们所用的!
使用 CP_UTF8 代码页就实现了 UTF-8 与 Unicode 之间的转换。

[2]、dwFlags 参数允许我们进行额外的控制,但是,一般情况下都不使用这个标志,直接传递 0 就行了。

[3]、lpDefaultChar和pfUsedDefaultChar:只有当WideCharToMultiByte函数遇到一个宽字节字符,而该字符在uCodePage参数标识的代码页中并没有它的表示法时,WideCharToMultiByte函数才使用这两个参数。如果宽字节字符不能被转换,该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL(这是大多数情况下的参数值),那么该函数使用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的,因为问号是个通配符。pfUsedDefaultChar参数指向一个布尔变量,如果Unicode字符串中至少有一个字符不能转换成等价多字节字符,那么函数就将该变量置为TRUE。如果所有字符均被成功地转换,那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被成功地转换后,可以测试该变量。

● 两个转换函数的使用:
● A2W、W2A、T2A、T2W 宏的使用:

③、CString常用操作讲解

------------------------------------- End -------------------------------------------

转载于:https://www.cnblogs.com/linksgo2011/p/3321195.html

vc驿站视频教程笔记2 ansi 和 unicode相关推荐

  1. vc驿站视频教程笔记4 Cstring 讲解

    --------------------------------------------------------------------------- VC 驿站 WwW.CcTry.CoM 多抽出一 ...

  2. vc驿站视频教程笔记1

    --------------------------------------------------------------------------- VC 驿站 WwW.CcTry.CoM 多抽出一 ...

  3. 《windows核心编程系列》二谈谈ANSI和Unicode字符集

    第二章:字符和字符串处理 使用vc编程时项目-->属性-->常规栏下我们可以设置项目字符集合,它可以是ANSI(多字节)字符集,也可以是unicode字符集.一般情况下说Unicode都是 ...

  4. 字符编码笔记:ASCII,Unicode和UTF-8(转) + BASE64

    原文出处:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 今天中午,我突然想搞清楚Unicode和UTF-8之间 ...

  5. Ansi与Unicode及慎用W2A等

    2019独角兽企业重金招聘Python工程师标准>>> Ansi与Unicode简要说明及各自的优缺点 他们是两种字符的编码格式,Ansi=窄字节,Unicode=宽字节,Ansi用 ...

  6. 字符编码笔记:ASCII,Unicode和UTF-8(转载)

    字符编码笔记:ASCII,Unicode和UTF-8 作者: 阮一峰 日期: 2007年10月28日 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料. 结果,这个 ...

  7. 【ZZ】字符编码笔记:ASCII,Unicode和UTF-8

    2019独角兽企业重金招聘Python工程师标准>>> 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料. 结果,这个问题比我想象的复杂,从午饭后 ...

  8. 转:字符编码笔记:ASCII,Unicode 和 UTF-8

    转: http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 作者: 阮一峰 日期: 2007年10月28日 今天中午, ...

  9. Ansi与Unicode编码

    视频教程: Ansi与Unicode编码 大家在编程时经常遇到的数据类型: ● Ansi: char   代表一个字符  (CHAR) char *  代表一个字符串指针   (PCHAR    PS ...

最新文章

  1. php 去掉img,php怎样去掉img标签
  2. 今天看到一个很个性的blog
  3. matlab中读取txt数据文件(txt文本文档)
  4. 索引 - 数据结构 - BTREE
  5. 三网合一是指计算机网,什么是三站合一网站?什么是三网合一网站?
  6. IE 6 特有的条件注释详情
  7. 腾讯内容平台部-视频内容理解算法实习生
  8. cdoj1342郭大侠与甲铁城
  9. html绘制word柱状图,word如何制作柱状图
  10. [USACO19FEB]Cow Dating——找规律
  11. 使用timerfd实现定时器功能
  12. python运维脚本面试_参加Linux运维面试时经常会被问到的shell脚本问题有哪些?
  13. DNS域名解析中添加的各项记录详解
  14. div 中img 居中
  15. 各种三角函数的导数(正六边形记忆法)
  16. Python3对股票数据进行分析
  17. 使用 Visual Studio 2005中的ASP.NET 移动控件创建电子书浏览器应用程序
  18. 白话解读“中台”技术
  19. 程序员如何写一份合格的简历?(附简历模版)
  20. CTFSHOW-文件包含

热门文章

  1. c语言程序流程控制(下)
  2. 服务器任务栏运行程序不见了,Win7系统任务栏上正在运行的程序图标不见了怎么办...
  3. 浏览器对象存储数据详解
  4. Verilog HDL 快速入门
  5. 微信开发 事件 trim subscribe
  6. 互点流量,互刷排名,刷下拉刷联想-胖虎图图-互动点击系统
  7. Python基础入门知识(11)
  8. 企业网络安全防护概述
  9. The E-pang Palace(暴力几何)
  10. python对财务的作用知乎_Python与财务「上」——数据采集篇