大数据、机器学习与深度学习类命令行工具汇总
《命令行上的数据科学(Data Science at the Command Line)》一书与GitHub皆为我们带来大量高水平的预处理与后处理类工具选项,大家亦可根据需要对其进行针对性调整。在今天的文章中,我将向各位强烈推荐自己最为喜爱的那些相关工具。
CSVKit绝对值得一试。其能够利用逗号分隔值实现您所需要的一切。大家可以通过cvs cut剪切列、使用cvsgrip进行列过滤、通过sql2csv将PostgreSQL中的数据提取至CSV、使用cols从列中剪切子集并通过in2cv将微软Excel转换为CSV。
快速工具推荐清单
Python Data Analysis (Agate).
ImageMagick (edit, create, convert, flip, and alter images from the command-line).
JSON 2 CSV.
XML2JSON via NodeJS.
HTML to image.
HTML to PDF.
Weather Underground CLI.
NIFI Shell.
Gatling for Testing with Scala/JVM.
Kafka Producer with JSON.
Kafka Consumer with JSON.
Create JSON.
Image MetaData Extraction.
OSQuery for Querying Infrastructure.
Tesseract for Command Line OCR.
Hadoop/HDFS Command Line Tools.
CURL.
WGET.
MQTT CLI (NPM.JS).
大家亦可以编写简短的Python脚本以通过命令行实现数据处理。
- from nltk.sentiment.vader
- import SentimentIntensityAnalyzer
- import sys
- sid = SentimentIntensityAnalyzer()
- ss = sid.polarity_scores(sys.argv[1])
- print('Compound {0} Negative {1} Neutral {2} Positive {3} '.format(ss['compound'], ss['neg'], ss['neu'], ss['pos']))
只需要五行Python脚本即可实现情绪分析。
大家甚至可以通过命令行实现TensorFlow调试(不过其目前尚处于beta测试阶段,所以可能会出现一些问题)。
作者:核子可乐译
来源:51CTO
大数据、机器学习与深度学习类命令行工具汇总相关推荐
- “2019大数据与实体经济深度融合全国行”盛大启动
5月26日,"2019大数据与实体经济深度融合全国行"在2019中国国际大数据产业博览会上盛大启动.本次活动由国家工业信息安全发展研究中心主办,各地方大数据产业主管部门协办,中国工 ...
- linux gpu 测试工具,推荐 7 大 Linux GPU 监控和诊断命令行工具
原标题:推荐 7 大 Linux GPU 监控和诊断命令行工具 作者:Linux迷 链接:https://www.linuxmi.com/7-linux-gpu-jiankong.html 视频卡是一 ...
- 大数据与实体经济深度融合全国行首站将于7月10日在贵州举办
为进一步贯彻国家大数据战略,全面落实<促进大数据发展行动纲要>和<大数据产业发展规划(2016-2020)>,促进大数据与实体经济深度融合,宣贯推广大数据优秀产品和优秀案例,搭 ...
- oh-my-zsh(更强大的命令行工具)
点击上方"罗晓胜",马上关注,您的支持对我帮助很大 / 前言 / oh-my-zsh更强大的命令行工具,解放双手,比系统自带bash更加酷炫.高效,可以实现更强大的命令补全 ...
- TaxonKit:小巧、高效、实用的NCBI分类学数据命令行工具
TaxonKit: 小巧.高效.实用的NCBI分类学数据命令行工具集 宏基因组按:NCBI物种分类注释信息格式复杂,存在层级不整齐.缺失.名称变动等问题,在使用中存在一定困难.最近发现了一款分类信息查 ...
- 阿里云大数据计算服务MaxCompute命令行工具——odpscmd的操作使用
在MaxCompute生态中,命令行工具究竟处于什么样的位置?它又发挥着什么样的作用?能够帮助开发者如何更好使用MaxCompute?在本文中,阿里巴巴计算平台产品专家曲宁将通过一个完整简单的小例子为 ...
- 2015年《大数据》高被引论文Top10文章No.7——大数据机器学习系统研究进展(上)...
2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.7, ...
- 《大数据》第1期“专题”——大数据机器学习系统研究进展(下)
6 跨平台统一大数据机器学习系统Octopus的研究设计 6.1 Octopus的基本设计思想 上述绝大多数大数据机器学习方法和系统都是基于特定平台构建的,难以集成和兼容现有和未来出现的多种大数据处理 ...
- 《大数据》第1期“专题”——大数据机器学习系统研究进展(上)
大数据机器学习系统研究进展 黄宜华1,2 1.南京大学计算机软件新技术国家重点实验室 南京 210023: 2.南京大学PASA大数据技术实验室 南京 210023 摘要:要实现高效的大数据机器学习, ...
最新文章
- 传指针与指针引用的区别
- Django运行报错Invalid HTTP_HOST header: ‘0.0.0.0:8000‘. You may need to add ‘0.0.0.0‘ to ALLOWED_HOSTS.
- 【BZOJ3242】【UOJ#126】【NOI2013】快餐店
- JAVA-重写equalse规范、技巧
- 《假如编程是魔法之零基础看得懂的Python入门教程 》——(三)使用初始魔法跟编程魔法世界打个招呼吧
- Flask最强攻略 - 跟DragonFire学Flask - 第四篇 Flask 中的模板语言 Jinja2 及 render_template 的深度用法
- Python 创建用户界面之 PyQt5 的使用
- mybatis主键生成策略和mp主键生成策略
- 数据库工作笔记001---mysql 修改字符集_修改排序规则
- python 中单线程 与多线程 与多进程的性能分析
- CRT、ATL、MFC 三者介绍和关系
- luogu P5290 [十二省联考2019]春节十二响 优先队列 + 启发式合并
- javaIO流-File类及其方法
- 不知道怎么把英文文档翻译成中文?手把手教你怎么操作
- 华为p4用鸿蒙系统吗_为什么华为有自主研发的鸿蒙系统,却还要用安卓系统,背后的真实原因?...
- svg 可视化操作_使用SVG和D3可视化浏览指标
- HDU 6578 Blank
- 平狄克微观经济学笔记和课后习题答案
- 如何定义一个具有返回值的函数
- Yolov5训练自己的数据集(windows10)
热门文章
- IOS NSPredicate 查询、搜索
- WPF 与Surface 2.0 SDK 亲密接触 - ScatterView 篇
- Iphone是革了传统互联网的命
- FTP服务器serv-u
- 用SCCM2007 R2分发软件,SCCM系列之五
- 一个域名可以对应多个ip地址吗_域名解析 | A记录 ,CNAME,MX,NS 你懂了吗
- Avahi DOS攻击broadcast-avahi-dos
- SNMP系统信息获取工具onesixtyone
- ARP协议全面实战手册——Wireshark的安装第一更
- 微信小程序上传图片到服务器不显示,微信小程序上传图片到服务器wx.uploadFile...