matlab 使用textscan读取带文本的csv文件
纯数值csv文件使用 csvread 直接读取
csv文件就是comma-separated value (CSV) file。数据使以逗号相隔的形式保存在.csv文件中。
2019最新版的官方文档不在推荐使用csvread读取csv文档,而是推荐使用readmatrix但是目前还是兼容。
三种方式读取:
(1) M = csvread(filename), 文件的内容只能是数值。
(2) M = csvread(filename,R1,C1),指定从R1+1行与C1+1列开始读其后的所有内容。
(3) M = csvread(filename,R1,C1,[R1 C1 R2 C2]),通过指定左上角开始的行列和右下角的行列读取的范围。
使用带文本的csv文件使用textscan读取
最简单的方法是右键选择matlab打开csv文件,然后拖动选择需要的行列,点击导入所选内容。
想要代码的话,选中内容后,在下图划红线处点击下三角即可生成脚本。
导出的代码栗子:
csv文本如下:
(1)读取所有内容
%% 初始化变量。
filename = 'C:\Users\siucaan\Documents\MATLAB\test.csv';
delimiter = ',';
# 不包括列的变量名
startRow = 2;# 包括列名设为1,或者在下面textscan()中不加HeaderLines这个参数
# startRow = 1;%% 将数据列作为文本读取:
formatSpec = '%s%s%s%s%s%s%[^\n\r]';%% 打开文本文件。
fileID = fopen(filename,'r');%% 根据格式读取数据列。
dataArray = textscan(fileID, formatSpec, 'Delimiter', delimiter, 'TextType', 'string', 'HeaderLines' ,startRow-1, 'ReturnOnError', false, 'EndOfLine', '\r\n');%% 关闭文本文件。
fclose(fileID);%% 将包含数值文本的列内容转换为数值。
% 将非数值文本替换为 NaN。
raw = repmat({''},length(dataArray{1}),length(dataArray)-1);
for col=1:length(dataArray)-1raw(1:length(dataArray{col}),col) = mat2cell(dataArray{col}, ones(length(dataArray{col}), 1));
end
numericData = NaN(size(dataArray{1},1),size(dataArray,2));for col=[1,5]% 将输入元胞数组中的文本转换为数值。已将非数值文本替换为 NaN。rawData = dataArray{col};for row=1:size(rawData, 1)% 创建正则表达式以检测并删除非数值前缀和后缀。regexstr = '(?<prefix>.*?)(?<numbers>([-]*(\d+[\,]*)+[\.]{0,1}\d*[eEdD]{0,1}[-+]*\d*[i]{0,1})|([-]*(\d+[\,]*)*[\.]{1,1}\d+[eEdD]{0,1}[-+]*\d*[i]{0,1}))(?<suffix>.*)';tryresult = regexp(rawData(row), regexstr, 'names');numbers = result.numbers;% 在非千位位置中检测到逗号。invalidThousandsSeparator = false;if numbers.contains(',')thousandsRegExp = '^[-/+]*\d+?(\,\d{3})*\.{0,1}\d*$';if isempty(regexp(numbers, thousandsRegExp, 'once'))numbers = NaN;invalidThousandsSeparator = true;endend% 将数值文本转换为数值。if ~invalidThousandsSeparatornumbers = textscan(char(strrep(numbers, ',', '')), '%f');numericData(row, col) = numbers{1};raw{row, col} = numbers{1};endcatchraw{row, col} = rawData{row};endend
end%% 将数据拆分为数值和字符串列。
rawNumericColumns = raw(:, [1,5]);
rawStringColumns = string(raw(:, [2,3,4,6]));%% 确保包含 <undefined> 的任何文本都已正确转换为 <undefined> 分类值
for catIdx = [1,3]idx = (rawStringColumns(:, catIdx) == "<undefined>");rawStringColumns(idx, catIdx) = "";
end%% 创建输出变量
test1 = table;
test1.Challengerecordname = cell2mat(rawNumericColumns(:, 1));
test1.Database = categorical(rawStringColumns(:, 1));
test1.Originalrecordname = rawStringColumns(:, 2);
test1.Diagnosis = categorical(rawStringColumns(:, 3));
test1.Class = cell2mat(rawNumericColumns(:, 2));
test1.VarName6 = rawStringColumns(:, 4);%% 清除临时变量
clearvars filename delimiter startRow formatSpec fileID dataArray ans raw col numericData rawData row regexstr result numbers invalidThousandsSeparator thousandsRegExp rawNumericColumns rawStringColumns catIdx idx;
(2)指定读取指定列
我这里指定第一列和五列
只要修改 formatSpec = ‘%s%*s%*s%*s%s%[^\n\r]’;
完整代码如下:
%% 初始化变量。
filename = 'F:\matlab_workspace\test.csv';
delimiter = ',';%% 将数据列作为文本读取:
% 有关详细信息,请参阅 TEXTSCAN 文档。
formatSpec = '%s%*s%*s%*s%s%[^\n\r]';%% 打开文本文件。
fileID = fopen(filename,'r');%% 根据格式读取数据列。
% 该调用基于生成此代码所用的文件的结构。如果其他文件出现错误,请尝试通过导入工具重新生成代码。
dataArray = textscan(fileID, formatSpec, 'Delimiter', delimiter, 'TextType', 'string', 'ReturnOnError', false);%% 关闭文本文件。
fclose(fileID);%% 将包含数值文本的列内容转换为数值。
% 将非数值文本替换为 NaN。
raw = repmat({''},length(dataArray{1}),length(dataArray)-1);
for col=1:length(dataArray)-1raw(1:length(dataArray{col}),col) = mat2cell(dataArray{col}, ones(length(dataArray{col}), 1));
end
numericData = NaN(size(dataArray{1},1),size(dataArray,2));% 将输入元胞数组中的文本转换为数值。已将非数值文本替换为 NaN。
rawData = dataArray{2};
for row=1:size(rawData, 1)% 创建正则表达式以检测并删除非数值前缀和后缀。regexstr = '(?<prefix>.*?)(?<numbers>([-]*(\d+[\,]*)+[\.]{0,1}\d*[eEdD]{0,1}[-+]*\d*[i]{0,1})|([-]*(\d+[\,]*)*[\.]{1,1}\d+[eEdD]{0,1}[-+]*\d*[i]{0,1}))(?<suffix>.*)';tryresult = regexp(rawData(row), regexstr, 'names');numbers = result.numbers;% 在非千位位置中检测到逗号。invalidThousandsSeparator = false;if numbers.contains(',')thousandsRegExp = '^[-/+]*\d+?(\,\d{3})*\.{0,1}\d*$';if isempty(regexp(numbers, thousandsRegExp, 'once'))numbers = NaN;invalidThousandsSeparator = true;endend% 将数值文本转换为数值。if ~invalidThousandsSeparatornumbers = textscan(char(strrep(numbers, ',', '')), '%f');numericData(row, 2) = numbers{1};raw{row, 2} = numbers{1};endcatchraw{row, 2} = rawData{row};end
end%% 将数据拆分为数值和字符串列。
rawNumericColumns = raw(:, 2);
rawStringColumns = string(raw(:, 1));%% 将非数值元胞替换为 NaN
R = cellfun(@(x) ~isnumeric(x) && ~islogical(x),rawNumericColumns); % 查找非数值元胞
rawNumericColumns(R) = {NaN}; % 替换非数值元胞%% 创建输出变量
test1 = table;
test1.Challengerecordname = rawStringColumns(:, 1);
test1.Class = cell2mat(rawNumericColumns(:, 1));
(3)读取指定行
读取6-12行,只要修改
startRow = 6;
endRow = 11;
dataArray = textscan(fileID, formatSpec, endRow-startRow+1, 'Delimiter', delimiter, 'TextType', 'string', 'HeaderLines', startRow-1, 'ReturnOnError', false, 'EndOfLine', '\r\n');
(4)读取局部行列
指定6-12行,第2-5列,只要修改
startRow = 6;
endRow = 12;
%% 每个文本行的格式:
% 列2: 分类 (%C)
% 列3: 文本 (%s)
% 列4: 分类 (%C)
% 有关详细信息,请参阅 TEXTSCAN 文档。
formatSpec = ‘%*s%C%s%C%*s%[^\n\r]’;
完整代码:
%% 导入文本文件中的数据。
%% 初始化变量。
filename = 'F:\matlab_workspace\test.csv';
delimiter = ',';
startRow = 6;
endRow = 12;%% 每个文本行的格式:
% 列2: 分类 (%C)
% 列3: 文本 (%s)
% 列4: 分类 (%C)
formatSpec = '%*s%C%s%C%*s%[^\n\r]';%% 打开文本文件。
fileID = fopen(filename,'r');%% 根据格式读取数据列。
dataArray = textscan(fileID, formatSpec, endRow-startRow+1, 'Delimiter', delimiter, 'TextType', 'string', 'HeaderLines', startRow-1, 'ReturnOnError', false, 'EndOfLine', '\r\n');%% 关闭文本文件。
fclose(fileID);%% 创建输出变量
test = table(dataArray{1:end-1}, 'VariableNames', {'Database','Originalrecordname','Diagnosis'});
matlab 使用textscan读取带文本的csv文件相关推荐
- python读取c盘中的csv文件-python读取当前目录下的CSV文件数据
在处理数据的时候,经常会碰到CSV类型的文件,下面将介绍如何读取当前目录下的CSV文件,步骤如下 1.获取当前目录所有的CSV文件名称: #创建一个空列表,存储当前目录下的CSV文件全称 file_n ...
- 读取csv文件 java_Java:逐步读取/流式传输CSV文件
读取csv文件 java 我一直在做一些涉及读取CSV文件的工作,而我一直在使用OpenCSV ,而我的最初方法是逐行读取文件,解析内容并将其保存到地图列表中. 当文件的内容适合内存时,此方法有效,但 ...
- Java:逐步读取/流式传输CSV文件
我一直在做一些涉及读取CSV文件的工作,而我一直在使用OpenCSV ,而我的最初方法是逐行读取文件,解析内容并将其保存到地图列表中. 当文件的内容适合内存时,此方法有效,但对于较大的文件来说是个问题 ...
- java读取csv文件_使用扫描仪读取Java中的CSV文件
java读取csv文件 We can use Java Scanner Class to read CSV File in java. 我们可以使用Java扫描程序类在Java中读取CSV文件. 读取 ...
- MATLAB中无法读取图像或无法打开文件等类似问题
MATLAB中无法读取图像或无法打开文件等类似问题 在MATLAB中进行图像处理算法的仿真是十分方便的,读取图像自然是常规的第一步,那么很多时候会遇到无法读取图像的错误,如果MATLAB报错为 ...
- Python+pywin32批量读取带密码的Excel文件数据导出为CSV文件
好消息:"Python小屋"编程比赛正式开始 推荐图书: <Python程序设计(第3版)>,(ISBN:978-7-302-55083-9),董付国,清华大学出版社, ...
- python导入csv文件是如何预览后10行-使用python中的csv reader只读取前N行csv文件
我将一些csv文件的第二列中包含的文本添加到一个列表中,以便稍后对列表中的每个项目执行情绪分析.我的代码目前完全适用于大型csv文件,但是我对列表中的项目执行的情感分析花费了太长时间,这就是为什么我只 ...
- python获取mysql中的数据供js调用_python 读取mysql数据至csv文件中,并发送邮件
test 代码: #coding:utf-8 ''' Created on 2019年2月18日 @author: Administrator ''' import ConfigParser impo ...
- python读取csv前100条_使用python中的csv reader只读取前N行csv文件
我将一些csv文件的第二列中包含的文本添加到一个列表中,以便稍后对列表中的每个项目执行情绪分析.我的代码目前完全适用于大型csv文件,但是我对列表中的项目执行的情感分析花费了太长时间,这就是为什么我只 ...
- matlab显示YCrCb的图像,【Matlab系列】读取并显示YUV视频文件
Date: 2019-5-12 1.读取并显示YUV视频文件Matlab代码 %% 1.读取视频内容并显示 fid = fopen('akiyo_cif.yuv','r'); %读入YUV文件 row ...
最新文章
- SQL Server Lock Escalation - 锁升级
- 是知当代之士、驰骛之曹,书读纵横,则思诸侯之变
- 倪海厦天纪笔记16_倪海厦老师讲解天纪易经——第3集(13)
- Unisys:信息安全新关键——微分割
- Python利用itchat库向好友或者公众号发消息
- linux systemd 使用
- 5/5 MySQL入门总结:其它操作
- 计算机网络学习笔记-1.1.3-速率相关的性能指标
- 匿名函数-lambda
- python计算今年第几天_Python三种方法计算指定日期是今年的第几天
- 60-270-040-源码-指标监测-Flink自定义metric监控流入量
- 和DOM一起的日子:检测与预防DOM跨站脚本攻击
- GigaSpaces Grid for dataBase Cashing
- UVALive 6922 Reverse Polish Notation
- python 操作鼠标和键盘
- python 采集唯美girl
- Linux文件目录管理、文件内容查看以及文件内容查询命令(详细命令)
- 中国量子计算机应用普及,郭光灿院士专访:量子产业全梳理,15年后量子计算机或可普及...
- Lotus Notes 常见错误
- ABAC - 基于属性的访问控制 - 复杂场景下访问控制解决之道