在竞赛中,遇到大数据时,往往读文件成了程序运行速度的瓶颈,需要更快的读取方式。相信几乎所有的C++学习者都在cin机器缓慢的速度上栽过跟头,于是从此以后发誓不用cin读数据。还有人说Pascal的read语句的速度是C/C++中scanf比不上的,C++选手只能干着急。难道C++真的低Pascal一等吗?答案是不言而喻的。一个进阶的方法是把数据一下子读进来,然后再转化字符串,这种方法传说中很不错,但具体如何从没试过,因此今天就索性把能想到的所有的读数据的方式都测试了一边,结果是惊人的。竞赛中读数据的情况最多的莫过于读一大堆整数了,于是我写了一个程序,生成一千万个随机数到data.txt中,一共55MB。然后我写了个程序主干计算运行时间,代码如下:#include <ctime>
int main()
{int start = clock();//DO SOMETHINGprintf("%.3lf\n",double(clock()-start)/CLOCKS_PER_SEC);
}最简单的方法就算写一个循环scanf了,代码如下:const int MAXN = 10000000;int numbers[MAXN];void scanf_read()
{freopen("data.txt","r",stdin);for (int i=0;i<MAXN;i++)scanf("%d",&numbers[i]);
}可是效率如何呢?在我的电脑Linux平台上测试结果为2.01秒。接下来是cin,代码如下const int MAXN = 10000000;int numbers[MAXN];void cin_read()
{freopen("data.txt","r",stdin);for (int i=0;i<MAXN;i++)std::cin >> numbers[i];
}出乎我的意料,cin仅仅用了6.38秒,比我想象的要快。cin慢是有原因的,其实默认的时候,cin与stdin总是保持同步的,也就是说这两种方法可以混用,而不必担心文件指针混乱,同时cout和stdout也一样,两者混用不会输出顺序错乱。正因为这个兼容性的特性,导致cin有许多额外的开销,如何禁用这个特性呢?只需一个语句std::ios::sync_with_stdio(false);,这样就可以取消cin于stdin的同步了。程序如下:const int MAXN = 10000000;int numbers[MAXN];void cin_read_nosync()
{freopen("data.txt","r",stdin);std::ios::sync_with_stdio(false);for (int i=0;i<MAXN;i++)std::cin >> numbers[i];
}取消同步后效率究竟如何?经测试运行时间锐减到了2.05秒,与scanf效率相差无几了!有了这个以后可以放心使用cin和cout了。接下来让我们测试一下读入整个文件再处理的方法,首先要写一个字符串转化为数组的函数,代码如下const int MAXS = 60*1024*1024;
char buf[MAXS];void analyse(char *buf,int len = MAXS)
{int i;numbers[i=0]=0;for (char *p=buf;*p && p-buf<len;p++)if (*p == ' ')numbers[++i]=0;elsenumbers[i] = numbers[i] * 10 + *p - '0';
}把整个文件读入一个字符串最常用的方法是用fread,代码如下:const int MAXN = 10000000;
const int MAXS = 60*1024*1024;int numbers[MAXN];
char buf[MAXS];void fread_analyse()
{freopen("data.txt","rb",stdin);int len = fread(buf,1,MAXS,stdin);buf[len] = '\0';analyse(buf,len);
}上述代码有着惊人的效率,经测试读取这10000000个数只用了0.29秒,效率提高了几乎10倍!掌握着种方法简直无敌了,不过,我记得fread是封装过的read,如果直接使用read,是不是更快呢?代码如下:const int MAXN = 10000000;
const int MAXS = 60*1024*1024;int numbers[MAXN];
char buf[MAXS];void read_analyse()
{int fd = open("data.txt",O_RDONLY);int len = read(fd,buf,MAXS);buf[len] = '\0';analyse(buf,len);
}测试发现运行时间仍然是0.29秒,可见read不具备特殊的优势。到此已经结束了吗?不,我可以调用Linux的底层函数mmap,这个函数的功能是将文件映射到内存,是所有读文件方法都要封装的基础方法,直接使用mmap会怎样呢?代码如下:const int MAXN = 10000000;
const int MAXS = 60*1024*1024;int numbers[MAXN];
char buf[MAXS];
void mmap_analyse()
{int fd = open("data.txt",O_RDONLY);int len = lseek(fd,0,SEEK_END);char *mbuf = (char *) mmap(NULL,len,PROT_READ,MAP_PRIVATE,fd,0);    analyse(mbuf,len);
}经测试,运行时间缩短到了0.25秒,效率继续提高了14%。到此为止我已经没有更好的方法继续提高读文件的速度了。回头测一下Pascal的速度如何?结果令人大跌眼镜,居然运行了2.16秒之多。程序如下:const MAXN = 10000000;
varnumbers :array[0..MAXN] of longint;i :longint;
beginassign(input,'data.txt');reset(input);for i:=0 to MAXN doread(numbers[i]);
end.为确保准确性,我又换到Windows平台上测试了一下。结果如下表:
方法/平台/时间(秒)     Linux gcc   Windows mingw   Windows VC2008
scanf                   2.010        3.704           3.425
cin                     6.380        64.003          19.208
cin取消同步              2.050        6.004           19.616
fread                   0.290        0.241           0.304
read                    0.290        0.398           不支持
mmap                    0.250        不支持           不支持
Pascal read             2.160        4.668  从上面可以看出几个问题Linux平台上运行程序普遍比Windows上快。Windows下VC编译的程序一般运行比MINGW(MINimal Gcc for Windows)快。VC对cin取消同步与否不敏感,前后效率相同。反过来MINGW则非常敏感,前后效率相差8倍。read本是linux系统函数,MINGW可能采用了某种模拟方式,read比fread更慢。Pascal程序运行速度实在令人不敢恭维。转载出处:https://www.byvoid.com/zhs/blog/fast-readfile

探寻C++读取文件最快的方式相关推荐

  1. C++ 读取文件的四种方式

    本文介绍C++ 读取文件的四种方式. 第一种方式: #include<iostream> #include<fstream> using namespace std;int m ...

  2. nodejs 逐行读取文件的两种方式

    nodejs 逐行读取文件的两种方式 通过readline的方式 const fs = require('fs'); const readline = require('readline');let ...

  3. Servlet读取文件的最好的方式

    在java web 开发的时候不可避免的会读取文本信息,但是方式不同,所付出的代价也是不一样的,今天学到了一个比较好的实用性的技巧,拿来与大家分享一下. 读取属性配置文件 之所以说成是读取属性(pro ...

  4. php文件读取文件内容,PHP文件系统函数-读取文件内容几种方式

    介绍几种php获取文件内容的方式 介绍读取文件的方式之前,我们先看一下打开文件资源和关闭资源 名字资源绑定到一个流 - fopen 关闭一个已打开的文件指针 - fclose $handle1 = f ...

  5. FileReader读取文件的三种方式

    #日常练习 FileReader可以通过一次读取文件中一个字符,一次读取一个字符数组或使用缓冲区这三种方式来读取文件 备注:使用缓冲区的方式的内部实现是借助数组完成 package IO;import ...

  6. python读取文件的三种方式_python中读取文件的f.seek()方法

    用于二进制文件中 F.seek方法 作用: 设置读写位置 F.seek(偏移量, whence=相对位置) 偏移量 大于0的数代表向文件末尾方向移动的字节数 小于0的数代表向文件头方向中移动的字节数 ...

  7. linux shell 读取文件的三种方式

    假设存在文件user.csv 重定向标准输入,方式一: [root@wpuj3zui5est1ifj-0002 ~]# cat -n back.sh 1 #!/bin/bash2 #测试备份文件时候的 ...

  8. shell脚本按行读取文件的几种方式

    1. #!/bin/bash while read line do echo $line done < filename(待读取的文件) 2. #!/bin/bash cat filename( ...

  9. 一行一行读取文件的两种方式

    1)方式1 static void Main(string[] args){ using (StreamReader reader = new StreamReader("1.txt&quo ...

最新文章

  1. 约翰霍普金斯大学Alan Yuille教授招收计算机视觉暑期科研实习生
  2. 面试官问我:什么是高并发下的请求合并?
  3. 读书笔记:《Aspx开发200问》——如何实现Repeater控件的分页
  4. 微会动微信现场互动:2019年会展和活动产业的发展趋势
  5. 05-ServletconfigServletCOntext
  6. linux 高性能服务排查方式
  7. 程序员能力提升:你应该知道的那些编程原则!!
  8. 云场景实践研究第37期:悦跑圈
  9. 微信小程序流量主+直播开通和编码指南
  10. Microsoft visual studio关闭安全检查
  11. ADS软件仿真的问题
  12. Linux之sed流编辑器
  13. 三步建立自己的电影网站 1 (安装MacCMS10)
  14. cvc降噪和主动降噪_蓝牙耳机降噪功能CVC好还是DSP?
  15. 多元线性回归--案例分析及python实践
  16. salesforce之chatter
  17. 【IMP】IMP导入表的时候,如果表存在怎么办
  18. jQuery实现悬浮窗口
  19. VBS带你领略脚本语言的快乐!(实战篇—死循环)
  20. 学会做笔记-子弹笔记学习概要三

热门文章

  1. C++继承的构造函数、多重继承、虚继承
  2. 计算机作业心得体会100字,计算机心得体会100字.doc
  3. 解析 youtube 字幕
  4. 【大话传送网-学习笔记】从PDH到SDH
  5. python微信登录失效_[基本解决]尝试去搞清楚微信网页授权后如何保持用户登录状态...
  6. C语言中快速排序法(从小到大)实现过程详细分析
  7. PHP 零基础入门笔记(5):PHP 运算符 operator
  8. 881计算机应用和基础,首都师范大学
  9. 本地便民生活信息平台网站结构分析及源码示例
  10. centos7 升级内核