《命令行上的数据科学(Data Science at the Command Line)》一书与GitHub皆为我们带来大量高水平的预处理与后处理类工具选项,大家亦可根据需要对其进行针对性调整。在今天的文章中,我将向各位强烈推荐自己最为喜爱的那些相关工具。

CSVKit绝对值得一试。其能够利用逗号分隔值实现您所需要的一切。大家可以通过cvs cut剪切列、使用cvsgrip进行列过滤、通过sql2csv将PostgreSQL中的数据提取至CSV、使用cols从列中剪切子集并通过in2cv将微软Excel转换为CSV。

快速工具推荐清单

  • Python Data Analysis (Agate).

  • ImageMagick (edit, create, convert, flip, and alter images from the command-line).

  • JSON 2 CSV.

  • XML2JSON via NodeJS.

  • HTML to image.

  • HTML to PDF.

  • Weather Underground CLI.

  • NIFI Shell.

  • Gatling for Testing with Scala/JVM.

  • Kafka Producer with JSON.

  • Kafka Consumer with JSON.

  • Create JSON.

  • Image MetaData Extraction.

  • OSQuery for Querying Infrastructure.

  • Tesseract for Command Line OCR.

  • Hadoop/HDFS Command Line Tools.

  • CURL.

  • WGET.

  • MQTT CLI (NPM.JS).

大家亦可以编写简短的Python脚本以通过命令行实现数据处理。

  1. from nltk.sentiment.vader
  2. import SentimentIntensityAnalyzer
  3. import sys
  4. sid = SentimentIntensityAnalyzer()
  5. ss = sid.polarity_scores(sys.argv[1])
  6. print('Compound {0} Negative {1} Neutral {2} Positive {3} '.format(ss['compound'], ss['neg'], ss['neu'], ss['pos']))

只需要五行Python脚本即可实现情绪分析。

大家甚至可以通过命令行实现TensorFlow调试(不过其目前尚处于beta测试阶段,所以可能会出现一些问题)。

作者:核子可乐译

来源:51CTO

大数据、机器学习与深度学习类命令行工具汇总相关推荐

  1. “2019大数据与实体经济深度融合全国行”盛大启动

    5月26日,"2019大数据与实体经济深度融合全国行"在2019中国国际大数据产业博览会上盛大启动.本次活动由国家工业信息安全发展研究中心主办,各地方大数据产业主管部门协办,中国工 ...

  2. linux gpu 测试工具,推荐 7 大 Linux GPU 监控和诊断命令行工具

    原标题:推荐 7 大 Linux GPU 监控和诊断命令行工具 作者:Linux迷 链接:https://www.linuxmi.com/7-linux-gpu-jiankong.html 视频卡是一 ...

  3. 大数据与实体经济深度融合全国行首站将于7月10日在贵州举办

    为进一步贯彻国家大数据战略,全面落实<促进大数据发展行动纲要>和<大数据产业发展规划(2016-2020)>,促进大数据与实体经济深度融合,宣贯推广大数据优秀产品和优秀案例,搭 ...

  4. oh-my-zsh(更强大的命令行工具)

    点击上方"罗晓胜",马上关注,您的支持对我帮助很大 /   前言   / oh-my-zsh更强大的命令行工具,解放双手,比系统自带bash更加酷炫.高效,可以实现更强大的命令补全 ...

  5. TaxonKit:小巧、高效、实用的NCBI分类学数据命令行工具

    TaxonKit: 小巧.高效.实用的NCBI分类学数据命令行工具集 宏基因组按:NCBI物种分类注释信息格式复杂,存在层级不整齐.缺失.名称变动等问题,在使用中存在一定困难.最近发现了一款分类信息查 ...

  6. 阿里云大数据计算服务MaxCompute命令行工具——odpscmd的操作使用

    在MaxCompute生态中,命令行工具究竟处于什么样的位置?它又发挥着什么样的作用?能够帮助开发者如何更好使用MaxCompute?在本文中,阿里巴巴计算平台产品专家曲宁将通过一个完整简单的小例子为 ...

  7. 2015年《大数据》高被引论文Top10文章No.7——大数据机器学习系统研究进展(上)...

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.7, ...

  8. 《大数据》第1期“专题”——大数据机器学习系统研究进展(下)

    6 跨平台统一大数据机器学习系统Octopus的研究设计 6.1 Octopus的基本设计思想 上述绝大多数大数据机器学习方法和系统都是基于特定平台构建的,难以集成和兼容现有和未来出现的多种大数据处理 ...

  9. 《大数据》第1期“专题”——大数据机器学习系统研究进展(上)

    大数据机器学习系统研究进展 黄宜华1,2 1.南京大学计算机软件新技术国家重点实验室 南京 210023: 2.南京大学PASA大数据技术实验室 南京 210023 摘要:要实现高效的大数据机器学习, ...

最新文章

  1. 传指针与指针引用的区别
  2. Django运行报错Invalid HTTP_HOST header: ‘0.0.0.0:8000‘. You may need to add ‘0.0.0.0‘ to ALLOWED_HOSTS.
  3. 【BZOJ3242】【UOJ#126】【NOI2013】快餐店
  4. JAVA-重写equalse规范、技巧
  5. 《假如编程是魔法之零基础看得懂的Python入门教程 》——(三)使用初始魔法跟编程魔法世界打个招呼吧
  6. Flask最强攻略 - 跟DragonFire学Flask - 第四篇 Flask 中的模板语言 Jinja2 及 render_template 的深度用法
  7. Python 创建用户界面之 PyQt5 的使用
  8. mybatis主键生成策略和mp主键生成策略
  9. 数据库工作笔记001---mysql 修改字符集_修改排序规则
  10. python 中单线程 与多线程 与多进程的性能分析
  11. CRT、ATL、MFC 三者介绍和关系
  12. luogu P5290 [十二省联考2019]春节十二响 优先队列 + 启发式合并
  13. javaIO流-File类及其方法
  14. 不知道怎么把英文文档翻译成中文?手把手教你怎么操作
  15. 华为p4用鸿蒙系统吗_为什么华为有自主研发的鸿蒙系统,却还要用安卓系统,背后的真实原因?...
  16. svg 可视化操作_使用SVG和D3可视化浏览指标
  17. HDU 6578 Blank
  18. 平狄克微观经济学笔记和课后习题答案
  19. 如何定义一个具有返回值的函数
  20. Yolov5训练自己的数据集(windows10)

热门文章

  1. IOS NSPredicate 查询、搜索
  2. WPF 与Surface 2.0 SDK 亲密接触 - ScatterView 篇
  3. Iphone是革了传统互联网的命
  4. FTP服务器serv-u
  5. 用SCCM2007 R2分发软件,SCCM系列之五
  6. 一个域名可以对应多个ip地址吗_域名解析 | A记录 ,CNAME,MX,NS 你懂了吗
  7. Avahi DOS攻击broadcast-avahi-dos
  8. SNMP系统信息获取工具onesixtyone
  9. ARP协议全面实战手册——Wireshark的安装第一更
  10. 微信小程序上传图片到服务器不显示,微信小程序上传图片到服务器wx.uploadFile...