更新:2018-04-2713:25:25

其实直接用shuf就行:

trainname='_train'
testname='_test'
shufname='_shuf'
path="/data/mt/haiouzhang/lang_all/clean/all_lang/all_clean_2/"
for lang in ar bn km my ne tl ur hi kk he fa et bg da pl fi nl cs ro sv sl sk el hu sr hr no ka be mn mr ta uk az hy uz ht  #bg cs da de el en es et fa fi fr he hu id it ja ko ms nl no pl pt sk sr sv th tr vi zh
do
{file=$path$langshuf $file >$lang$shufname   #这句就是打乱。。cat $file$shufname | tail -n +10000 >$lang$trainnamecat $file$shufname | head -n +10000 >$lang$testname
}&
done

awk 'BEGIN{srand()}{b[rand()NR]=$0}END{for(x in b)print b[x]}' inputFile >shuf_kmm

while read i;do echo "$i $RANDOM";done<inputFile|sort -k2n|cut -d" " -f1

linux 删除文件的前几行

sed -i '1,10d' file

grep --color :高亮查询关键字

grep -A 10 xxx : 显示关键字后10行,查异常栈时很有用

grep -B 10 xxx : 显示关键字前10行

grep -C 10 xxx : 显示关键字前后10行

grep -i :不区分大小写

egrep ‘aaa|bbb’:可以统计aaa或bbb的结果,egrep基本等价 grep -E

【一】从第3000行开始,显示1000行。即显示3000~3999行

cat filename | tail -n +3000 | head -n 1000

【二】显示1000行到3000行

cat filename| head -n 3000 | tail -n +1000

*注意两种方法的顺序

分解:
tail -n 1000:显示最后1000行
tail -n +1000:从1000行开始显示,显示1000行以后的
head -n 1000:显示前面1000行

【三】用sed命令

sed -n '5,10p' filename 

这样你就可以只查看文件的第5行到第10行。

转载于:https://www.cnblogs.com/hozhangel/p/8926493.html

Linux下 对文件行数打乱(乱序排列)相关推荐

  1. Linux查询压缩文件行数,linux命令行快速统计文件(压缩文件)的行数

    统计(文件|压缩文件)的行数 zcat file.gz | sed -n '$='                                         #迅速.直接打印出多少行.-n 取消 ...

  2. linux c 获取文件行数

    示例如下: /*获取文件行数*/ int file_wc(const char *filename) {int fd;register int linect = 0;char buf[MAXBSTZE ...

  3. 【Linux】查看文件行数、字数

    wc [选项] 文件 -c 统计字节数 -l 统计行数 -w 统计字数 -m 统计字符数

  4. LINUX下统计代码行数

    http://blog.csdn.net/simanstar/article/details/9106997 转载于:https://www.cnblogs.com/spectrelb/p/75427 ...

  5. linux截取日志文件行数,linux日志文件過大,想要截取執行時間的日志信息 如何截取...

    1.首先第一步查看你日志的時間格式: 09:28:06,651 ERROR [stderr] (http-/0.0.0.0:8080-1) org.springframework.jdbc.BadSq ...

  6. linux命令统计文件行数据库,wc命令--Linux统计文件行数

    语法:wc [选项] 文件- 说明:该命令统计给定文件中的字节数.字数.行数.如果没有给出文件名,则从标准输入读取.wc同时也给出所有指定文件的总统计数.字是由空格字符区分开的最大字符串. 该命令各选 ...

  7. linux 取得文件行数

    话题相关 #linux 如何取得文件行数 #linux 如何知道一个文件有多少行 #shell 如何取得文件行数 方法1 wc命令 wc -l file wc命令是word count的缩写,为统计指 ...

  8. Linux统计项目代码行数

    首先进入项目工程下 统计项目下所有文件行数 find . -type f |xargs cat|wc -l 统计项目下 .c 文件行数 find . -name "*.c" |xa ...

  9. linux目录下多个文件行数比对函数 关键字遍历文件 linux命令写入C函数

    人,一定要有勇气和踏实的态度面对改变和选择!开发,零经验起步! 文件行数比对函数: 输入参数:接口文件绝对路径,日期(格式YYYYMMDD:20150716) 根据路径和日期,分别获取这add.del ...

最新文章

  1. Webpack 代码分离
  2. DNA RNA 蛋白质
  3. Jetty 9.0.0 首个里程碑出现
  4. 方案 mysql 优点_mysql高可用方案分析
  5. Java主函数要放在哪个类里_JAVA:主函数一定要放在静态内部类里吗
  6. 对dedecms、php168,phpcms、VeryCMS、DiyPage五款开源整站系统的简单评点(
  7. winrar x64 3.93如何破解
  8. Hibernate事务
  9. linux源码安装 rpm命令
  10. C++中-运算符与.运算符的具体使用
  11. app上显示服务器数据加载失败,APP中的6种常见数据加载
  12. 三十而立程序员天马行空的心理路程(迷茫/焦虑)
  13. jeefast 添加非空判断
  14. 2、测试面试题总结整理
  15. [转帖]关于 /dev/urandom 的流言终结 | Linux 中国
  16. 冠军斩获10万奖金!首届“域见杯”医检AI开发者大赛精彩落幕
  17. 数据结构实验课:实验六、图的遍历操作及应用
  18. 笔记本Ctrl键突然失灵是什么原因?
  19. python----four
  20. (转)JUNOS入门学习笔记

热门文章

  1. 聚类热图分类注释_Python可视化matplotlibamp;seborn15-聚类热图clustermap(建议收藏)...
  2. python `__repr__`
  3. Python datatime date
  4. D3 datumdata
  5. php递归面包屑,php实现面包屑导航例子分享,_PHP教程
  6. oracle dba开头的表,oracle中以dba_、user_、v$_、all_、session_、index_开头的常用表和视图...
  7. 微型计算机原理及应用 课程设计,《微型计算机原理及其应用》课程设计.docx
  8. 23、90秒快速“读懂”STP(生成树)工作原理
  9. 疫情加速中国服务器采购 数字化转型成为增长“新引擎”
  10. VMware vSphere 6.7之vSAN配置全程图解