【问题】

I have a csv file. columns in csv file - "SNo. StateName CityName AreaName PinCode NonServ.Area MessangerService Remark". The column CityName has repeated values.

Ex: In many records, it has unique value (Delhi). Is there any approach in java to read that csv file and get the distinct values from that column of the csv file.

【回答】

去除重复行是简单的结构化计算,但JAVA缺乏相关的类库,实现过程复杂,代码可读性差。这种情况下可以用SPL辅助实现,代码更直观易懂:

A
1 =file("E:\\yourfile.csv").import@tc()
2 =A1.group@1(CityName)

A1: @c表示以逗号为分隔符读入文件。@t表示将第一行读为列名。

A2:按CityName分组,取各组第1条记录。该问题的规则没写清楚,这里假设是:如果多条记录里的CityName重复,则保留第1条记录。

关于JAVA集成,参考Java 如何调用 SPL 脚本。

去除 csv 文件中的重复行相关推荐

  1. 如何去除 EXCEL 文件中的重复行

    在EXCEL数据文件中,如果按某几个列值比较,值都相等的几行称为重复行,那么怎么删除多余的重复行,只留下一行? 如果数据少,只有几十行数据,那么手工删除也是可以的.而如果数据量很大,手工处理就会是很麻 ...

  2. 如何读取csv文件中第n行数据python-python数据处理之如何选取csv文件中某几行的数据...

    前言 有些人看到这个问题觉得不是问题,是嘛,不就是df.col[]函数嘛,其实忽略了一个重点,那就是我们要省去把csv文件全部读取这个过程,因为如果在面临亿万级别的大规模数据,得到的结果就是boom, ...

  3. 查找并删除EXCEL文件中的重复行(整行重复)

    ''' 用Python写代码:查找并删除EXCEL文件中的重复行(整行重复) --GhatGPT方案 ''' #-------------------------------------------- ...

  4. Linux 指令:怎样从文件中找到重复行?

    Linux 指令:怎样从文件中找到重复行? 1.例如有文件test1.txt,内容如下: Hello world. 122 122 343434 222222 执行uniq -d 可以找到重复行: 1 ...

  5. Python标识EXCEL文件中的重复行

    本代码分别对指定目录(路径='G:\\Xct\\python')下的EXCEL文件:文件01.xlsx和文件02.xls进行重复行标记,这样便于在EXCEL中用"自动筛选"的功能将 ...

  6. python如何处理数据_python数据处理之如何选取csv文件中某几行的数据

    前言 有些人看到这个问题觉得不是问题,是嘛,不就是df.col[]函数嘛,其实忽略了一个重点,那就是我们要省去把csv文件全部读取这个过程,因为如果在面临亿万级别的大规模数据,得到的结果就是boom, ...

  7. 去除csv文件中空行

    import pandas as pd data = pd.read_csv("原文件.csv") res = data.dropna(how="all") r ...

  8. 去除源文件中的重复行的程序流程及其C代码实现

    (本人正在参加2015博客之星评选,诚邀你来投票,谢谢:http://vote.blog.csdn.net/blogstar2015/candidate?username=zhouzxi) 一.需求描 ...

  9. linux去除内容重复行,Linux删除文本中的重复行 - 米扑博客

    在进行文本处理的时候,我们经常遇到要删除重复行的情况.那怎么解决呢? 下面就是三种常见方法? 第一,用sort+uniq,注意,单纯uniq是不行的,uniq对于重复行不上下连续时不起作用 因此,先对 ...

最新文章

  1. python第三方开发软件_python开发者的必备工具(一)
  2. 关于虚函数的应用(10个例子)
  3. NC反弹的小demo
  4. 申请评分卡(A卡)的开发过程(1)
  5. nfa状态转换图正规式_0x02 从NFA到DFA
  6. 对应sql建表_图解SQL面试题:如何查找工资前三高的员工
  7. php7 一句话木马,PHP一句话木马研究
  8. [案例]某体育用品公司在零售领域BI的产品应用解决方案
  9. USACO 2.1 海明码(DFS)
  10. 自己动手,更换中兴F663NV3a光猫,换为华为MA5671,真香。(中国移动光纤宽带)
  11. c语言正弦函数求导,正弦函数求导公式基本推导
  12. Android的屏幕适配
  13. 图像修复 python_50.图像修复
  14. spring-boot-devtools 快速重启的秘密!
  15. OPENCV例子\samples\cpp\tutorial_code\ImgProc\changing_contrast_brigh的代码分析
  16. ospf 指定dr_OSPF DR BDR 配置方法2
  17. R与结构方程模型(2):潜变量
  18. [创业] 美国互联网广告07年总开支255亿美元, 增长27%
  19. 电脑清灰,你的电脑能有多脏 论清灰的重要性
  20. SSM+基于SSM的家教系统 毕业设计-附源码221752

热门文章

  1. 一文了解 DataLeap 中的 Notebook
  2. 常见的一些威胁情报分析平台
  3. android如何监听应用进入后台,回到前台时做相应逻辑
  4. 缓存Cache概述——缓存Cache1.1.1
  5. KRPANO技术解析并下载720YUN全景图
  6. discuz3.4安装php,Discuz!X3.4论坛源码下载 及 全新安装教程
  7. 高分1(GF1)、高分2(GF2)卫星数据大气校正
  8. 欧洲通用数据保护条例(GDPR)合规的6个步骤
  9. sqlserver 下载地址(SQL Server 2008 R2 中英文 开发版/企业版/标准版 下载)
  10. If I Have One Million