现在是大数据时代。尤其是互联网企业,任何一个人都有可能拿到一份庞大的数据。不管你是否具有数据处理的能力,你都要面对它。

面对突如其来的一份庞大的数据,该怎样来对付它呢?这时候用SqlCel正是一个非常好的选择。

为了直观地介绍SqlCel的数据处理功能。我们设定一个具体的场景。比如你发现本公司的视频类APP当天播放卡顿率明显升高,于是你请求数据部门提取相关明细数据。你怀疑是新上的版本异常,于是你要从明细数据中提取最新的APP版本号作进一步的分析。

你获取的是一个1000万行的csv文本,怎样从这个文本中提取最新版本号的所有记录?这就是今天的考题。

对于一个专业的数据处理人员可能会对这个问题不屑一顾。因为只需要把数据导入数据库并写一个sql语句就可以查询出来。然而,对于多数运营人员,他是没有数据库的,更不会使用数据库。

而用SqlCel问题就会变得非常简单。本文提供三种用SqlCel实现这个功能的方法。

用SqlCel处理文本(csv/txt格式的文件)首先需要连接到文本所在的文件夹。如下:

方法一、用“选取记录”功能。如下:

点击“生成”按钮即可将 VersionCode = ‘V3.8.2’ 的记录筛选到一个名为"V382.csv"的新表中。如下:

方法二:用“拆分文件”
拆分文件可逐行过滤文本筛选出符合条件的记录,并可同时输出对立文件(不符合过滤条件的文件)

方法三、使用SQL语句

SqlCel可向文本提交SQL语句。SqlCel不仅可以提交SELECT语句,还可以提交CREATE语句。SQL语句如下:

CREATE TABLE V382.csv AS SELECT * FROM bofang200720.csv WHERE VersionCode='V3.8.2'

通过这个SQL语句可以选取符合条件的记录并存储在一个新的表“V382.csv”中

csv/txt文本的CREATE语句是SqlCel比较创新的一个写法,可通过SELECT选取记录并输出到一个新的文本中。

如何从一个大规模的文本中筛选出符合条件的记录相关推荐

  1. java 根据条件从list中筛选出符合条件的集合_Java8 Stream:2万字20个实例,玩转集合的筛选、归约、分组、聚合

    点波关注不迷路,一键三连好运连连! 先贴上几个案例,水平高超的同学可以挑战一下: 从员工集合中筛选出salary大于8000的员工,并放置到新的集合里. 统计员工的最高薪资.平均薪资.薪资之和. 将员 ...

  2. 利用Lambda表达式从实体集合中筛选出符合条件的实体集合

    前言 已知存在两张表:表A和表B,表A中有一个字段存储的是表B的部分Id集合,以字符串的形式存储,如图1-1所示: 图1-1 表A中的字段 现在我获取到了表A中这个字段的值和表B中所有数据的实体集合, ...

  3. Dataframe中筛选出满足条件的行

    [小白从小学Python.C.Java] [Python-计算机等级考试二级] [Python-数据分析] Dataframe中筛选出满足条件的行 选择题 关于以下代码说法错误的是?   import ...

  4. 用stream流来遍历处理list,筛选出符合条件的list,并对其中某些值求和

    用过就记录一下,筛选符合条件的,并计算某个元素的和.用stream流来遍历处理list,筛选出符合条件的list,并对其中某些值求和 代码如下 List<OctvBoardCheckEquip& ...

  5. R语言 | 利用tushare下载中小板所有股票数据并筛选出符合条件的股票

    作者的tushare ID:456548 作者在股市进行比较短线的投资,开发了一些高效的指标作为买卖的参考,于是需要k线.市值.换手率等数据进行研究,同花顺等软件上面大多数据不能导出,所以找到了tus ...

  6. Java中List集合过滤出符合条件的List元素集合

    在项目开发的过程中,我们经常会对List集合进行按条件的过滤,筛选出我们想要的结果或者是符合项目需求的数据.比如:我们有一批学生对象,每个学生都有自己的年龄属性,但是我们想要筛选出这一批学生中年龄为2 ...

  7. js从一个数组中筛选出另一个数组中存在的值

    js从一个数组中筛选出另一个数组中存在的值 这里从arr中筛选arr1中存在的值,arr2为筛选结果数组 let arr=["1","2","3&qu ...

  8. python统计英文文章中单词出现的次数并排序_python,_关于统计某一个 单词 在 文本中 出现的次数,python - phpStudy...

    关于统计某一个 单词 在 文本中 出现的次数 人生苦短,我用Python.用了不会,来到segment. 我是一个python 初学者,想要实现一个"模块",可以让用户输入某个单词 ...

  9. 【网络安全】如何使用PacketSifter从pcap中筛选出有用的信息

    关于PacketSifter PacketSifter这款工具旨在帮助广大研究/分析人员从捕捉到的数据包文件(pcap)中筛选出其中有价值或值得分析的流量数据.PacketSifter可以接受一个pc ...

最新文章

  1. 一些可以让心灵安静的动图
  2. linux shell 语句出错自动退出 调试 检查 脚本
  3. python中读取文件内容-Python读取文件内容与存储
  4. 《C++ Primer Plus 6th》读书笔记 - 第8章 函数探幽
  5. HTML的footer置于页面最底部
  6. 赠书 | 如何部署一个Knative Service
  7. antd 左右滑动_如何使用reactjs创建可滑动的侧边栏
  8. 走近伏羲,谈5000节点集群调度与性能优化
  9. qt 将相应字符写入txt文件
  10. Atitit.跨语言系统服务管理器api兼容设计
  11. UI漂亮音乐分享网站源码
  12. java 排队_JAVA实现排队论
  13. CRON 定时任务 在线解析
  14. 安装uTool之后鼠标中键异常被uTool接管
  15. linux网络不通检查方法
  16. mysql消息已读未读_Redis实现信息已读未读状态提示
  17. 基于SSM框架的文章管理系统(增加留言回复功能)
  18. 【免费咨询】 Cloudera Hadoop大数据培训:管理员、开发者、数据分析
  19. chatGPT研究-(一)使用入门及Access Denied打不开问题解决
  20. 常用Xilinx Alveo 技术文档资源列表(全中文)

热门文章

  1. 呼叫中心管理之:让座席看见自己
  2. jQuery对Class属性的操作
  3. java腰间盘终结者_大枣加大葱竟是腰椎间盘突出的终结者,一用一个好,腰不好不要错过...
  4. WindowsServer2019下使用Docker搭建内网GitLab
  5. 十六进制转ASCII码表
  6. 深度学习(12):SemanticKITTI论文翻译与学习
  7. 思科模拟器实验6:rip基础配置
  8. labelme标记数据后,批量处理json文件,生成标签
  9. 海康威视2022 校招/社招/实习 内推WHM8BQ
  10. spring boot内嵌tomcat优雅的开启apr模式