在Linux下写C程序,尤其是网络通信程序时经常遇到编码转换的问题,这里要用到iconv函数库。

iconv函数库有以下三个函数

1
2
3
4
5
6 
#include <iconv.h>
iconv_t iconv_open(const char *tocode, const char *fromcode); //return (iconv_t)-1 if failed size_t iconv(iconv_t cd,  char **inbuf, size_t *inbytesleft,  char **outbuf, size_t *outbytesleft); //return (size_t)-1 if failed int iconv_close(iconv_t cd); //return -1 if failed 

这三个函数的功能显而易见,分别是打开一个iconv_t句柄,转换字符串以及关闭一个iconv_t句柄。其中有必要一说的是iconv函数,这个函数十分容易用错。

iconv函数的五个参数中,第一个参数是iconv句柄,第二、三个参数是需要转换的字符串的地址和长度的地址,第四、五个参数是存储结果的字符串的地址和长度的地址,注意这里传的都是地址,因为这四个参数的值都有会被iconv函数改变。iconv会逐步的将*inbuf中的字符转换到*outbuf中,并增加*inbuf指针减少*inbytesleft的值,以及增加*outbuf指针减少*outbytesleft的值。

iconv函数会因为以下四种原因停止并返回:

  1. *input中遇到了一个非法的多字节序列,返回(size_t)-1并置errno=EILSEQ,返回时*inbuf指向非法字符的开头。
  2. *input全部转换完,返回不可转换的字符数。
  3. *input中遇到了一个不完整的多字节序列,返回(size_t)-1并置errno=EINVAL,返回时*inbuf指向不完整字符的开头。
  4. *output空间不够,返回(size_t)-1并置errno=E2BIG。

以下给出一个示例函数,将一个字符串从utf-8转换成gbk后再重新转换成utf-8。

1
2
3
4
5
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 
#include <iconv.h>
#include <string.h> #include <stdio.h> #include <errno.h> #include <stdlib.h>  int charset_convert(const char *from_charset, const char *to_charset,  char *in_buf, size_t in_left, char *out_buf, size_t out_left) {  iconv_t icd;  char *pin = in_buf;  char *pout = out_buf;  size_t out_len = out_left;  if ((iconv_t)-1 == (icd = iconv_open(to_charset,from_charset))) {  return -1;  }  if ((size_t)-1 == iconv(icd, &pin, &in_left, &pout, &out_left)) {  iconv_close(icd);  return -1;  }  out_buf[out_len - out_left] = 0;  iconv_close(icd);  return (int)out_len - out_left; }  int main(int argc, char *argv[]) {  char *from_str = "你好,中南。- Hello, CSU.";  char *to_str_gbk, *to_str_utf8;  int len;  //utf-8 => gbk  to_str_gbk = (char*)calloc(1, strlen(from_str) * 3);  if (-1 == (len = charset_convert("UTF-8", "GB2312", from_str,  strlen(from_str), to_str_gbk, strlen(from_str) * 3))) {  perror("UTF8=>GBK error");  }  //gbk => utf8  to_str_utf8 = (char*)calloc(1, len * 3);  if (-1 == (len = charset_convert("GB2312", "UTF-8", to_str_gbk,  len, to_str_utf8, len * 3))) {  perror("GBK=>UTF8 error");  }  //output  printf("original : %s\n", from_str);  printf("to gbk : %s\n", to_str_gbk);  printf("gbk to utf8: %s\n", to_str_utf8); } 

我用的xshell连接到虚拟机,先将terminal的编码设置为utf-8运行,结果如下

1
2
3
original   : 你好,中南。- Hello, CSU.
to gbk     : ţºã¬אŏ¡£- Hello, CSU.
gbk to utf8: 你好,中南。- Hello, CSU.

再将terminal的编码设置为gbk运行,结果如下

1
2
3
original   : 浣犲ソ锛屼腑鍗椼€? Hello, CSU.
to gbk     : 你好,中南。- Hello, CSU.
gbk to utf8: 浣犲ソ锛屼腑鍗椼€? Hello, CSU.

可见,在相应的编码下,对应的字符串能正常显示。

http://vimersu.win/blog/2014/03/04/linux-iconv/

在Linux下使用iconv转换字符串编码相关推荐

  1. linux下使用iconv转换编码,linux iconv 转换文件编码

    查看文件编码 file -i filename 递归转换(包括子文件夹) find default -type d -exec mkdir -p utf/{} \; find default -typ ...

  2. Linux 命令之 iconv -- 转换文件的字符编码

    文章目录 一.命令介绍 二.命令语法 三.常用选项 四.命令示例 (一)对指定文件进行转码,且输出到指定的文件中 一.命令介绍 iconv 命令是 Linux 系统自带的用于转换文件编码的命令行工具, ...

  3. iconv 转换文件编码

    文章目录 iconv 转换文件编码 iconv 转换文件编码 iconv命令是 Linux 系统自带的用于转换文件编码的命令行工具. 语法格式: iconv [参数] 常用参数: 参数 说明 -f 输 ...

  4. linux下改变文件的字符编码

    首先确定文件的原始字符编码: $ file -bi test.txt 然后用 iconv 转换字符编码 $ iconv -f from-encoding -t to-encoding file > ...

  5. linux中查找某一个字符串,linux下查找包含某个字符串的文件

    linux下查找包含某个字符串的文件 | Rootop 服务器运维与web架构 比如在当前路径下有个test文件夹,其中包含 a.b. c.d.c 四个文件,内容如下: [root@rhel6www ...

  6. linux上p图工具,Linux下的图片转换工具ImageMagick

    最近需要用到一些Linux下图片格式转换的内容,网上找到了这款ImageMagick的软件,提供的功能很多,支持png,jpg,gif,pdf等许多种图片格式的互相转换,而且开源,使用起来非常方便. ...

  7. linux 超级权限图标,Linux下使用iconv库出错,急!!!

    我做的工程需要应用iconv进行编码转换,使用了iconv.h,工程在windows下可以运行,但移植到Linux下后在生成Makefile时进行到make命令后报错为: ../include/ico ...

  8. linux服务器视频转换,linux下视频格式转换工具

    原文 地址: http://www.cpplive.com/html/1415.html mencoder是Linux下的开源软件MPlayer以及它附带的视频工具,也可以独立安装.Windows下的 ...

  9. linux下视频格式转换与视频合并

    熟悉Windows的朋友应该知道,Windows下的视频格式转换软件与合并视频软件不计其数,刚接触Linux的朋友也许会抱怨Linux下没有强大的视频软件,完成视频播放.转化视频格式.合并视频等功能. ...

最新文章

  1. 认识RESTful设计风格
  2. 你可以把编程当做一项托付终身的职业
  3. 分析Unicode和UTF-8
  4. MySQL里 unique 用法_mysql中unique key中在查询中的使用
  5. mybatis 笔记记录
  6. JZOJ 5424. 【NOIP2017提高A组集训10.25】凤凰院凶真
  7. 自写图片遮罩层放大功能jquery插件源代码,photobox.js 1.0版,不兼容IE6
  8. 各互联网公司延期上班一览
  9. 软件测试技术——系统测试
  10. E - The Imp(博弈/动态规划)
  11. Moon.Orm性能报告
  12. 正则-Strip函数
  13. 贝叶斯优化优化参数,以Kmeans为例
  14. 数据结构与算法分析(七)——C++实现平衡二叉树
  15. glassfish linux,Linux下实现GlassFish自动启动
  16. UltraEdit UE如何设置自动换行
  17. primitive types
  18. WINHTTP的API接口说明
  19. android图片添加文字,android图片上添加文字
  20. 使用Java播放wav音乐

热门文章

  1. mysql 聚合函数求积_Oracle聚合求和和聚合求积(顺便解决BOM展开的问题)
  2. h5 表单居中_3分钟学会易企秀H5操作(基础篇)
  3. 【ES9(2018)】Promise.prototype.finally()
  4. 解决jQuery聚焦时光标在input最前面的问题
  5. python path模块_python pathlib模块详解
  6. JavaScript笔记-使用反引号格式化字符串
  7. canvas笔记-lineTo()与moveTo()的区别
  8. Java笔记-WEB算术验证码
  9. IDEA工作笔记-对.idea及.iml文件的理解
  10. Qt工作笔记-发送端发送Json格式的数据包,接收端解析数据包