背景介绍

最近在处理txt文件,并且文件里包含了中文,发现很麻烦。

  1. 编码方式,一般来说,只含英文的用ASCII打开就好了,这样也会和手册上对应起来,比如哪一位是哪一位,哪几位代表什么含义,但是这样不能知道中文字符到底是什么,如果用UTF-8打开,那么可以显示中文字符,不过每一位代表的含义变了,因为一个中文顶替了两个英文字符的位置
  2. UTF-8并不经常好用,gb18030包含更全面

读取中文txt,并且判断中文的位置

% 1.1. 打开文件
fid = fopen(file, 'r+','n','gb18030');%打开为gb18030(ASCII)
% 1.2. 将所有内容读入到字符串集合bpa_info 中
bpa_info = cell(5000, 1);
ii = 1;
while (~feof(fid))newline = fgetl(fid);bpa_info(ii) = {newline};ii = ii + 1;    % 中文的部分pattern = '[^\x00-\xff]'; % 匹配中文字符的正则表达式str = native2unicode(newline, 'UTF-8');matchIndices = regexp(str, pattern); % 查找所有匹配项的位置numChinese = length(matchIndices); % 统计中文字符数量    if numChinese > 0disp(['该字符串包含 ', num2str(numChinese), ' 个中文字符']);disp([str(matchIndices)]);        elsedisp('该字符串不包含中文字符。');end
end

MATLAB读取中文txt相关推荐

  1. python读取中文txt文本-python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  2. python读取txt中的一列称为_python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  3. python怎么读中文-python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  4. python txt默认读取字符还是行,python读取中文txt文本的方法

    字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unicode编码成另一种编码. ...

  5. python如何读取中文文件-python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  6. python读取中文txt文本-Python3 解决读取中文文件txt编码的问题

    问题描述 尝试用Python写一个Wordcloud的时候,出现了编码问题. 照着网上某些博客的说法添添改改后,结果是变成了"UnicodeDecodeError: "utf-8' ...

  7. matlab读取心电txt数据画图,图解MIT-BIH数据库心电数据下载和Matlab读取程序

    开源数据网站PhysioNet(https://physionet.org/)提供了诸如MIMIC.MIT-BIH等丰富的生理信号数据库,这些数据库对于人体生理信号的分析.数据挖掘有着非常大的作用.M ...

  8. python读取中文txt文本-python中使用txt文本保存和读取变量

    ### 问题: 在python中需要经常有需要提前生成复杂的计算结果变量的需求减少程序计算运行时间的需求,因此这里把变量存在txt文本文件中. 解决方法: 使用两个函数解决问题,一个函数把变量保存到文 ...

  9. python读取中文txt乱码问题

    在用windows新建个文本文档然后用python进行读取的时候可能会出现乱码问题 解决办法: 导入 chardet 包 示例代码: import chardet with open(savepath ...

最新文章

  1. 制作安全网站的checklist
  2. 使用Opencv构建一个简单的图像相似检测器(MSE、SSIM)
  3. .NET Core开源API网关 – Ocelot中文文档
  4. scala中循环守卫_Scala中的循环
  5. 解决sourceTree的git clone 报SSH密钥认证失败的问题
  6. 错误: 无法生成项目输出组“内容文件来自WebApplication1(活动)”
  7. [解题报告]HDU 2019 数列有序!
  8. paip.验证码识别---序列号的反转
  9. win7 共享计算机 网络密码怎么设置,win7局域网共享设置密码 win7局域网如何设置密码【详细步骤】...
  10. linux rarp命令,通过源码理解Rarp协议(基于linux1.2.13)
  11. Adyen海外支付 - Adyen回调
  12. 叶俊:从一匹马的电影读懂人才管理与商业经营
  13. Mask RCNN 实战(二)--像黑镜一样屏蔽图片和视频中的人和物体
  14. 国外lead教程—EMU之dating类offer分析
  15. Total Commander的常用用法和设置
  16. 如何查看centos系统cpu/内存使用情况
  17. 楼天成瑞典之旅感言,
  18. Linux内核变量中per-CPU的使用
  19. firewall 端口转发
  20. 用易我分区表医生恢复破坏的分区表

热门文章

  1. 推鉴一本书--人体素描
  2. springboot视频分享平台小程序毕业设计毕设作品开题报告开题答辩PPT
  3. 2020.6.3 东莞信息技术特长生 总结
  4. gogole-----------拓展工具 . crx 安装失败 解法
  5. wps linux 教程,采用snap方式安装WPS Linux社区版将非常的简单
  6. java后台设置cookie到浏览器,总是差八小时的问题解决
  7. android开发技术路线图
  8. Windows流氓软件残留文件强制清除基于命令行
  9. 关于电影主题HTM5网页设计作业成品——千与千寻在线电影(9个页面) HTML+CSS+JavaScript
  10. 2022年湖北特种作业操作证应急管理厅怎么报考?甘建二