全文共2048字,预计学习时长68分钟

图源:unsplash

疫情肆虐,许多国家都发布了居家隔离令,强制要求群众待在家里。居家令何时解除尚未可知,该如何打发独自在家的时间呢?除了时常遛狗外,笔者还准备了许多流媒体服务、乐高玩具、拼图、电子游戏和很多新技术来学习。

笔者的待学技术列表榜首是一些项目中未曾用到的技术,但在工作场合中会用到,包括Docker、Airflow 和Elasticsearch。

这些技术生态系统中的每一个都拥有稳定的社区,如果你对数据科学和机器学习感兴趣,那么每一个都值得研究。本文将对每种技术进行简要概述,以便你决定从哪个开始研究。

什么是Docker?

笔者曾在文章和视频中时常见到Docker,但因为它看起来很复杂,就没花时间深入研究。但由于这项技术广泛应用于办公室场合,导致笔者最终不得不使用它,并深陷其中无法自拔。

是时候尽己所能学习更多关于Docker的知识了!

图源:unsplash

Docker是可通过容器化概念和实践来简化并加快从开发到部署全部过程的一项技术。2013年Docker作为开源软件发布,现已成为一个非常受欢迎的工具。据统计,约50%的全球组织在使用容器化应用程序。这让笔者意识到,它是一项急需技能,也是笔者头脑“工具箱”的一大补充。

Docker接受能力、功能如此强大的原因是,它可以将一个应用程序及其依赖项打包到一个容器中,容器的内容可以在 Docker Hub上共享,并可以在任一Linux服务器上运行。这极大地简化了部署!

Docker Hub与GitHub的相似之处在于,它们都是存储库。但DockerHub并不重新发布代码文件,而是重新发布Docker的文件和容器。

容器是Docker的关键组成部分之一,也是笔者在进入技术领域后学到的第一件事:容器是一个标准的软件单元,它能打包代码及其所有依赖项,使应用程序从一个计算环境快速安全地运行到另一个计算环境。

与虚拟机(VM)不同,Docker容器不消耗虚拟化硬件所需的资源,这使其更加轻巧和灵活。为使用主机操作系统内核而设计的容器,都有独立的用户空间,因此多个容器可以在一台主机上运行,如下图所示:

还有很多待做事项,Docker也在继续发展,一个优秀的团队支撑着它。尽管只使用了几天,但笔者喜欢它的易操作性。

虽然用Windows使用Docker越来越容易,但Docker是为Linux设计的,所以笔者一直在Ubuntu和CentOS上使用它。你很容易就能找到便宜的在线Linux虚拟机。

什么是Airflow?

作为一个在Airbnb上创建的开源数据工作流程管理平台,Airflow允许用户通过 有向无环图(DAGs),用Python编程方式定义和调度途径和工作流程。它帮助定义和创新了工作流程,即代码行业。

图源:xenonstack

DAG是想要运行的所有任务集合,其组织方式反映了任务间的的关系和依赖性。

请注意以下工作流程中任务的方向依赖性:

工作流程可以通过用户界面(UI)进行监控。它可以轻易调出记录并查看DAG失败的地方,这使得用户界面非常有用。

让Airflow如此吸引人并被数据科学界所接受的原因是,一个单一的Python脚本能被用于定义任务和依赖关系,且Airflow能管理DAGs的实际调度和执行。可以使用触发器来运行DAGs,或者按照定义的计划运行。因为它是Python,所以它能与其他库和其他Python功能的使用很好地结合在一起。

用户界面树视图示例

为使ApacheAirflow正常运行,文档推荐使用Pip来安装。如在一台Linux机器上使用,请确保使用python3-dev 软件包正确安装Airflow。例如,Ubuntu将是这样的:

sudo apt-get install-y python3-dev

Airflow有一个坚实的开发社区,也是数据科学和数据工程领域的工具。如果熟悉Python并执行大量数据工程或ETL的话,它绝对值得研究。

什么是Elasticsearch?

其核心是一个全文搜索引擎,它使用Java和ApacheLucene库开发。它以JSON格式存储非结构化数据(如NoSQL),是一个高度可扩展的解决方案,允许高效存储、搜索和分析大数据。

根据数据库引擎排名,Elasticsearch是最受欢迎的搜索引擎技术之一,这表明它是一个值得了解并能满足需求的有价值的技能!

如寻找一个可以消磨时间的科技堆栈,弹性生态系统不只限于搜索功能。弹性堆栈由名为Kibana的数据分析平台和名为Logstash的数据收集器和记录引擎以及名为Beats的数据运送者集合组成。 它们通常被称为弹性堆栈,有许多功能和工具,包括用于无监督学习的内置机器学习算法!

Kibana的异常检测

另一研究弹性堆栈的原因是,它可以轻松地与Python进行交互。弹性搜索提供了RESTAPI,你可以使用PythonRequests 库与Elasticsearch集群进行交互。此外,API 包装器可以使用pip进行安装:

pip installelasticsearch

Elasticsearch是开源软件,下载、安装都很便捷。它可在Windows、Mac和Linux上使用。

图源:unsplash

这三种都是受欢迎的生态系统,有稳定的社区,是满足数据科学技术堆栈中特定需求的工具。

对开发操作(Dev Ops)感兴趣的话,Docker是一个非常棒的学习工具;如果关注ETL工作流程或数据工程途径的话,Airflow是一个很好的学习工具;Elastic Stack 是一个搜索非结构化数据的强大平台,是记录和分析大数据的工具。对有一些Python和Linux经验的人来说,每种技术都很容易设定。

关键在于你需要选择一种,并坚持学习下去,要知道,掌握其中任何一项技术所需要的时间都不在少数。

留言 点赞 关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦

绝佳的充电时间:自我隔离时何不探索这些数据科学技术相关推荐

  1. android 长续航手机测试,五小时高强度测试:凭绝佳续航,iQOO Neo 855版强势踏入第一梯队...

    五小时高强度测试:凭绝佳续航,iQOO Neo 855版强势踏入第一梯队 2019-11-17 20:58:24 5点赞 0收藏 0评论 说到如今2000价位热度最高的机型,相信不少用户第一个想到的都 ...

  2. 九合创投王啸:现在是反周期超车的绝佳时间点...

    2000年,他加入百度,以"百度七剑客"的身份,经历了跌宕起伏的中国互联网10年.2011年,他创立九合创投,站在移动互联网淘金潮的浪尖. 作为国内领先的早期风投公司之一,九合目前 ...

  3. 实用的it知识学习_IT榜样 | 寇宇宸:认真听讲是学习知识的绝佳途径

    You never know your luck 优秀毕业生 寇宇宸 01 个人简介 ♬..♩~ ♫. ♪♫. ♪ ~ ♬..♩ 寇宇宸,男,汉族,辽宁省抚顺市人,共青团员,天津理工大学2020届优秀 ...

  4. 苹果电池测试软件i-t,Apple Watch出行绝佳伴侣,CHOETECH磁力充电座评测T313

    在户外没有电源插座的情况下我们都习惯于使用移动电源为自己的手机充电,随着科技的不断发展,智能穿戴的产品也出现在了我们的视野当中,以Apple Watch为代表的智能手表也加入到了我们的生活并逐渐融入到 ...

  5. 分享一个绝佳的实战机器学习的机会,边学边比拿奖金!

    免费GPU+实时训练+每周上线两个以上竞赛项目 官网:www.flyai.com 上周日,CV君跟一位粉丝20W+的Python大佬交流,他说自己在网上推出一门课程,有50个人感兴趣学完了第一课Hel ...

  6. 系统安全漏洞扫描绝佳助手之Nmap详解(转)

    扫描器是帮助你了解自己系统的绝佳助手.象Windows 2K/XP这样复杂的操作系统支持应用软件打开数百个端口与其他客户程序或服务器通信,端口扫描是检测服务器上运行了哪些服务和应用.向Internet ...

  7. 2019,无数人改变命运的绝佳之年!(深度)

    转自公众号:数字经济 2019年,将是极其重要的一年! 世间万事万物都有规律和节点,这一年不仅将是世界格局的转折点,还将是很多行业生死攸关的转折点,更将是无数普通人逆袭的绝佳之年. 三大趋势的节点在这 ...

  8. 操作系统内核的绝佳学习材料——JOS

    操作系统内核的绝佳学习材料--JOS 前言:关于JOS和一些经验之谈 这一学期的操作系统课使用的是MIT用于教学的JOS操作系统,并且StonyBrook在其基础上做了大量改动,最重要的变化就是从32 ...

  9. SecureCRT 下载,安装,绝佳配色,实用配置,上传下载配置合集

    SecureCRT 下载,安装,绝佳配色,实用配置,上传下载配置合集 chocoball 发布于 2年前,共有 3 条评论 Secure CRT 是一款支持 SSH2.SSH1.Telnet.Teln ...

  10. 线框图:启动开发项目的绝佳方式

    收集早期反馈对于所有的开发项目来说都是至关重要的.没有利益相关人的及时反馈,就不可能开发出满足需求和预期的软件.为了让软件的利益相关人能够提供这样的反馈,一条基本的原则便是"少解释,多展示& ...

最新文章

  1. 【实现手机端上滑滚动加载列表】判断页面是否滚动到底部或者指定元素位置
  2. matlab如求曲线插值点,两条曲线之间的插值(matlab)
  3. win服务器发展方向是什么?
  4. 洛谷P1091 合唱队形
  5. Mysql对事务的支持
  6. 初识OSPF(三)——路由重分发及虚链路
  7. Waymo冰火两重天:无人出租车最快今秋推出,高管团队嫌隙严重
  8. listrecord根据某个属性去重_去哪网开发实战记录(9):城市选择页(中)
  9. 聊一聊开发常用小工具
  10. python png 背景透明_python – Pygame:在png图像中将所有白色像素转换为完全透明...
  11. java 获取视频信息_Java获取视频参数信息
  12. Spark整合ElasticSearch
  13. redis 所有模糊key 查询_写完这篇Redis由浅入深剖析快自闭了!
  14. 使用MySQLWorkBench绘制ER图详解
  15. HTTP权威指南笔记
  16. java网络学习之 ssh 协议学习总结
  17. Wireshark实验 - TCP
  18. AWS Elastic BeanStalk 部署错误总结
  19. 常见的爬虫error以及解决方法
  20. vue3结合ts开发,导入vue文件,页面报红色的波浪线

热门文章

  1. 又一个程序员,被抓捕!(真实事件)
  2. 计算机中人民币数字格式,数字转人民币金额大写
  3. linux超级服务器inetd详解
  4. 如何培养孩子一年读100本书
  5. Boost基础篇——安装
  6. android 强制竖排,[Android]实现文字竖排
  7. 汽车维修企业管理【11】
  8. GSMA选举新的董事会成员,宣布Orange董事长兼首席执行官Stéphane Richard出任主席
  9. 董事长、CEO、总裁、总经理、总监的区别
  10. 诗词教育不过是老虎嘴上的胡子