Centos下文本文件格式转码解决

最近遇到服务器网站的目录下的所有文件的编码全是gb2312,直接用cat或者vim打开显示都是乱码,网页显示出来当然也全是乱码,所以要解决怎么把目录下的所有文件(包括子文件夹里的文件)由gb2312转码成utf-8的问题。网上一顿搜,总共用了三种方法,最后终于把问题解决了。

第一种方法是利用vi编辑器,打开需要转码的文件。

:set fileencoding

这样可以查看文件当前的编码格式。

:set fileencoding=utf-8

说这样能把当前的文件转码成utf-8。但是失败了,直接打开还是显示乱码,更别说浏览器浏览的页面了。而且即使能转码成功,站点目录下的文本文件那么多,不可能一个个挨个打开然后这样设置吧,工作量巨大。

第二种方法是利用iconv。iconv系统默认就已经安装了的。通过命令:

Shell代码

iconv -f gb2312 -t utf-8 abc.html

这样确实把abc.html的编码转换成了utf-8。这样是将转换后的文本显示在了终端上,也可以:

Shell代码

iconv -f gb2312 -t utf-8 abc.html -o abc.html

用转码后的文件覆盖原文件,毕竟这才是最后想达到的目的。

好了,现在就可以对整个目录下(包括子目录下)的所有文本文件进行转码了:

Shell代码

find -type f -name "*.html" -exec iconv -f gb2312 -t utf-8 {} -o {} \;

通过-exec将find命令的每个结果带入后面iconv的{}内,转换css和javascript文件类似。但是悲剧的是输出很多错误提示。大概就是非法输入,也就是很多html文件里面的字符不对,用iconv转码出现错误。寻思大概不是所有的html文件的编码都是gb2312,所以把-f gb2312这个参数去掉,变成这样:

Shell代码

find -type f -name "*.html" -exec iconv -t utf-8 {} -o {} \;

但是遗憾的是错误依旧。所有用iconv这种办法还是行不通。

第三种方法是用enca。Centos默然没有安装enca,先下载然后安装:

Shell代码

wget http://pkgs.repoforge.org/enca/enca-1.10-1.el6.rf.x86_64.rpm

安装:

Shell代码

rpm -ivh enca-1.10-1.el6.rf.x86_64.rpm

enca的用法:

enca -L zh_CN file    #查看file的编码格式

enca -L zh_CN -x UTF-8 file   #将file转换成utf8的编码格式

enca -L zh_CN -x UTF-8 file1 file2   #转换之后存成file2文件,不覆盖file1

好了,接下来就是将目录下的所有文本文件转成成utf8格式:

Shell代码

find -type f -name "*.html" -exec enca -L zh_CN -x UTF-8 {} \;

这样转换以后发现只有一两个文件显示原文件由于未知格式转码失败,其它的的html文件都转码成功了,哈哈。接下来就是将htm,css,js后缀的文件也用同样的办法进行转码就行了。哎,问题可算解决了。

  • 本文来自:Linux学习教程网

Centos下文本文件格式转码解决相关推荐

  1. 在CentOS下编译VLC源码

    在CentOS下编译VLC源码 一.下载VLC源码 二.VLC编译与安装 1.编译与安装 2.库文件 3.头文件 三.报错解决 1.configure: error: Could not find l ...

  2. linux下telnet失败怎么处理,CentOS下telnet退出失败的解决办法

    最近有CentOS用户反映在调试网络程序时出现了问题,服务虽然启动了,但客户端却无法连接上,用telnet连接后发现是Windows防火墙的问题,可是用telnet命令连接成功后发现退不出去了,这该怎 ...

  3. centos php 开启socket,centos下phpsocket连接,该如何解决

    centos下php socket连接 最近要做一个基于tcp/ip下的短连接 我们自己的代码使用的是php的socket连接,对方服务器,已经测试能够连接,并接收到对方传回来的数据: 现在要求我们自 ...

  4. linux/usr/src/kernels 目录下没有内核源码 解决方法

    有时我们在安装系统后,发现没有安装当前系统的内核源码在/usr/src/kernels目录下,其实我们是少安装了一个rpm包: 当你配置好yum源后,然后安装下面的包就可以了: 针对CentOS系统: ...

  5. centos下LAMP之源码编译安装httpd

    1 最好先安装组件 [root@localhost ~]# yum groupinstall additional development [root@localhost ~]# yum groupi ...

  6. Centos下通过SMTP发送邮件失败解决

    既然默认开启了肯定有他的好处,不能关selinux,就搜索:selinux+smtp 找到了答案,selinux果然是不允许http来连接网络的,执行如下命令: setsebool -P httpd_ ...

  7. bitdock系统错误_Docker在centos下安装以及常见错误解决

    Docker安装(使用阿里云镜像) Docker从1.13版本之后采用时间线的方式作为版本号,分为社区版CE和企业版EE. 社区版是免费提供给个人开发者和小型团体使用的,企业版会提供额外的收费服务,比 ...

  8. CentOS下unzip出现错误的解决办法

    错误现象 # unzip xxxxxx.zip -d xxxxxx Archive: xxxxxx.zipEnd-of-central-directory signature not found. E ...

  9. CentOS下二进制包/源码安装方式的MySQL卸载步骤

    1. find find是最常见和最强大的查找命令,你可以用它找到任何你想找的文件. find的使用格式如下: $ find <指定目录> <指定条件> <指定动作> ...

最新文章

  1. apue学习之文件IO第二部分
  2. 浏览器tab关闭事件_Python--使用Pyqt5实现简易浏览器(最新版本测试过)
  3. 大写的服!中科大博士写20万字论文:如何给女朋友送礼物
  4. 服务器安装织梦网站数据库,DedeCMS数据库及服务器空间更换教程
  5. linux rc4,Linux kernel 4.8-rc4发布下载,正式版越来越近
  6. python爬虫 django搜索修改更新数据_python应用:Django中更新多个对象数据与删除对象的方法...
  7. php 10进制位数保持,php 任意进制的数转换成10进制功能实例
  8. key rocketmq 有什么用_rocketmq 介绍(一)
  9. MFC的多国语言界面的实现
  10. 海龟编辑器 html版,海龟编辑器官方版
  11. cs231n学习笔记 CNN 目标检测 定位 分割
  12. catalina java opts_CATALINA_OPTS与JAVA_OPTS – 有什么区别?
  13. 【附案例】UI交互设计不会做?设计大神带你开启动效灵感之路
  14. 什么是位图和矢量图,他们的使用和却别在哪儿
  15. 学习笔记-Hadamard矩阵的Kronecker积
  16. 定时器轮播图---(功能:自动轮播,左右箭头点击切换,点击圆点跳转图片)
  17. 低速接口之SPI接口,分类,四种模式,特点
  18. php预加载图片,图片预加载的一个简明例子
  19. 使用批处理恢复被病毒隐藏的文件和目录
  20. java 工作两年的简历_工作经验只有两年的Java开发,简历中需要写学校经历吗?...

热门文章

  1. 2023年有哪些值得推荐的蓝牙耳机?高性价比蓝牙耳机推荐
  2. iPhone手机完美越狱,承载安卓无限可能
  3. pytorch使用lstm_在PyTorch中使用Bi-LSTM生成文本
  4. 爱奇艺DRM修炼之路
  5. [转载]Flash为客户端的多人网络游戏的实现
  6. 全球物联网 (IoT) 市场(2020 年至 2026 年)——以 8power、ABB 和自适应无线解决方案等为特色 - ResearchAndMarkets.com
  7. DIV或Divide命令 等分对象
  8. 面对前端六年历史代码,如何接入并应用ES6解放开发效率
  9. 关于fiddler抓取手机流量
  10. 图形化编程 超级马里奥_超级马里奥可以向我们传授哪些图形技术?