数据工程 数据科学

数据科学和程序设计是一个快速发展的专业,很难跟上Google,Uber,Netflix和一位工程师的所有文章。 过去几周我们一直在阅读一些内容,并希望在2019年4月这一周分享一些顶级博客文章!

我们希望您喜欢这些文章。

在Netflix上建立和扩展数据沿袭

作者: 狄林 ( Di Lin) , 吉里斯·林加帕 ( Girish Lingappa) , 吉特 ( Jitender Aswani)

想象一下自己是一个受数据启发的决策者的角色,他盯着仪表板上的指标制定即将做出的关键业务决策,却停下来问一个问题:“我可以自己检查一下以了解该指标背后的数据是什么吗?”
现在,想像一下您扮演的是负责微服务的软件工程师的角色,该微服务发布很少有面向客户的关键服务(例如,计费)消耗的数据。 您将要对数据进行结构更改,并想知道服务的下游对象和对象将受到影响。

在这里


DeepMind与Google:控制人工智能之战

哈尔·霍德森

2010年8月的一个下午,在旧金山湾边缘的一个会议厅里,一个叫Demis Hassabis的34岁的伦敦人登上了舞台。 步履蹒跚地走到讲台上,一个男人试图控制自己的神经,他s起嘴唇笑了一下,然后开始讲话:“所以今天我要谈论的是不同的建筑方法……”他停顿了下来,仿佛刚刚意识到他正在大声说出自己的雄心壮志。 然后他说:“ AGI”。

在这里

学习数据科学:我们最喜欢的资源(从免费到免费)

今天,我们想涵盖一些我们最喜欢的数据科学资源。 如标题所示,这些资源将是免费的。 有些人喜欢买书,有些人则喜欢在线课程。 因此,我们创建了此数据资源列表,从书本到课程,从免费到没有。

数据科学有很多方面。 统计信息,数据清理,编程,系统设计以及实际上……几乎所有与数据相关的其他信息都取决于公司的规模。

这篇文章将讨论我们最喜欢的这些主题资源。 现在,这些课程和书籍中的大多数都是有关统计学,Python和数据科学等主题的入门。 他们确实只会提供基础知识。 归根结底,真正的实践经验是可以真正训练您的数据科学知识的几件事。 您应该从这些资源中学习尽可能多的知识,然后申请尽可能多的实习和入门级职位,并进行面试。

用10行代码进行对象检测

摩西·奥拉芬瓦(Moses Olafenwa)

人工智能的重要领域之一 是计算机视觉。 计算机视觉是计算机和软件系统的科学,可以识别和理解图像和场景。 计算机视觉还由各个方面组成,例如图像识别,对象检测,图像生成,图像超分辨率等。 由于大量实际使用案例,对象检测可能是计算机视觉最深刻的方面。 在本教程中,我将简要介绍现代对象检测的概念,软件开发人员面临的挑战,我的团队提供的解决方案以及执行高性能对象检测的代码教程。

在这里


Apache Airflow如何为芹菜工人分配工作

雨果·莱姆(Hugo Lime)

了解Apache Airflow通过RabbitMQ队列在Celery工作人员上执行任务分配时发生的情况。

Apache Airflow是一种工具,可用于在AWS上创建工作流,例如extract-load-transform管道 。 工作流是任务的有向无环图(DAG),Airflow能够在节点群集上分配任务。 让我们看看它是如何做到的。

在这里


使用Google相册捕捉特殊的视频时刻

录制难忘时刻与朋友和亲人分享的视频已变得司空见惯。 但是,正如拥有大量视频库的任何人都可以告诉您的那样,遍历所有原始素材以寻找完美的片段以与家人和朋友共享或分享是一项非常耗时的任务。 Google相册可以自动查找视频中的神奇时刻(例如,孩子吹蜡烛或朋友跳进游泳池时),并从中创建动画,以便与朋友和家人轻松共享,从而使这一过程变得更加轻松。
在这里

Uber案例​​研究:为您的Apache Spark作业选择正确的HDFS文件格式

斯科特·肖特(Scott Short)

为了在平台上创造更好的用户体验,我们进行了一系列努力,我们的Maps Data Collection团队成员使用专用的移动应用程序来收集图像及其相关的元数据来增强我们的地图 。 例如,我们的团队捕获路牌的图像,以提高我们的地图数据的效率和质量,从而带来更加无缝的旅行体验……

在这里


您创建了一个机器学习应用程序。 现在确保它是安全的。

本·洛里卡和迈克·洛基德斯

在最近的一篇文章中 ,我们描述了构建可持续的机器学习实践将需要采取的措施。 “可持续”是指不仅仅是概念或实验证明的项目。 可持续实践是指与组织使命不可分割的项目:组织赖以生存或死亡的项目。 这些项目由稳定的工程师团队构建和支持,并由理解机器学习,为何重要和能够完成什么的管理团队支持。

在这里

开发数据科学职业框架

亚当·麦克尔希尼(Adam McElhinney)

在Uptake,数据科学家是我们工作的核心。 为此,对以下内容进行良好的定义非常重要:数据科学家做什么? 如何评估数据科学家的绩效; 以及数据科学家的职业生涯如何发展。 一旦有了这些定义,就可以将它们用作所有雇用,发展,薪酬,退出和晋升决定的基础。

在这里

使用ML可解释性工具和技术诊断心脏病

罗伯·哈兰德(Rob Harrand)

简介在机器学习的所有应用程序中,使用黑匣子诊断任何严重疾病始终是一件很难的事。 如果模型的输出是特定的治疗过程(可能有副作用),手术或没有治疗,则人们会想知道原因

该数据集提供许多变量以及患有或不患有心脏病的目标状况。 下面,首先在简单的随机森林模型中使用数据,然后使用ML可解释性工具和技术研究模型。
在这里

非常感谢您的阅读。 如果您有兴趣获取有关我们最喜欢的文章的更新,请在此处注册以获取每周新闻。

翻译自: https://hackernoon.com/10-great-articles-on-data-science-and-data-engineering-d5abdf4a4a44

数据工程 数据科学

数据工程 数据科学_10篇关于数据科学和数据工程的伟大文章相关推荐

  1. wdnas群晖nas_WD 西部数据 伪NAS折腾记 篇三:WD 西部数据 MyCloud安装黑群晖教程

    WD 西部数据 伪NAS折腾记 篇三:WD 西部数据 MyCloud安装黑群晖教程 2015-12-10 18:21:45 82点赞 408收藏 92评论 首先感谢一下nasyun的大神zwl2012 ...

  2. 大数据笔记30—Hadoop基础篇13(Hive优化及数据倾斜)

    Hive优化及数据倾斜 知识点01:回顾 知识点02:目标 知识点03:Hive函数:多行转多列 知识点04:Hive函数:多行转单列 知识点05:Hive函数:多列转多行 知识点06:Hive函数: ...

  3. 精通数据科学_10篇文章变得更加精通数据科学

    精通数据科学 当领英发布其第三份年度新兴工作报告时 ,各地的工程师都说:"阿们". 超过一半的清单是工程角色,并且首次出现了新的领域,例如机器人技术. 但是数据科学也有很强的表现. ...

  4. 【工程处理技巧一篇】基于半规则数据的命名实体消歧识别【未完】

    作者:finallyly 出处:博客园(转载请注明作者和出处) 看到这篇文章的标题,您一定会以为此篇博客要讲解一个何等高深的算法.其实不然,本篇博客旨在分享笔者在处理那些繁杂.冗踏.低端甚至于极其TM ...

  5. 数据中台应用实战50篇(一)-企业级数据中台的建设方法架构和技术栈

    前言 多数企业都意识到数据的重要性,都希望利用数据来驱动业务发展.但经常会听到这样一句话:"我们企业现在业务都还没做起来,连数据都没有,还不到考虑数据利用的时候." 这句话在某种程 ...

  6. 中国工程程院院士高文:从大数据科学到人工智能的迁移过程

    本文转自: 创客总部–>产业数字化智库 11月6日,京东举行JDD京东金融全球数据探索者大会,在全球范围内寻求志同道合的伙伴共同探索大数据和人工智能在金融领域的最佳实践.中国工程程院院士.北京大 ...

  7. 数据科学和人工智能技术笔记 七、特征工程

    七.特征工程 作者:Chris Albon 译者:飞龙 协议:CC BY-NC-SA 4.0 稀疏特征矩阵上的降维 # 加载库 from sklearn.preprocessing import St ...

  8. 数据科学教育白皮书联合发布!顶级数据人才成长路径

    Datawhale原创 联合发布:和鲸科技.腾云大学.AWS.Datawhale 寄语:为什么要加快推进高校的数据科学教育?数据科学的知识体系包括哪些内容?数据科学人才的成长路径及教育方法论?我们希望 ...

  9. 大数据竞赛平台——Kaggle 入门篇

    这篇文章适合那些刚接触Kaggle.想尽快熟悉Kaggle并且独立完成一个竞赛项目的网友,对于已经在Kaggle上参赛过的网友来说,大可不必耗费时间阅读本文.本文分为两部分介绍Kaggle,第一部分简 ...

最新文章

  1. 瑟瑟发抖!2020年博士学位论文将抽查50%、硕士20%!
  2. FFMPEG视音频编解码学习(1)
  3. 多维卷积与一维卷积的统一性(运算篇)
  4. mysql备份工具 :mysqldump mydumper Xtrabackup 原理
  5. java 开源so库_NDK使用之引用.so开源库
  6. form表单通过checkbox_飞冰表单解决方案 - FormBinder
  7. php防止跨域提交,PHP防止跨域提交表单的简单示例
  8. 互联网晚报 | 3月26日 星期六 |​ 竞拍规则优化,部分城市土地市场有所回暖;​​武汉房贷利率下调...
  9. Android SDK Manager配置
  10. javascript技巧大全
  11. 个性化互联网时代,互联网营销
  12. weka进行十折交叉验证
  13. 六自由度机械臂研究(2)- 机械臂坐标系建立
  14. 麦考利久期公式(c语言实现)
  15. tensorflow安装
  16. excel vba批量发送邮件
  17. 计算机课第一节可以讲些什么,高职《大学计算机基础》第1节课讲点什么?
  18. 【C++】数列求和-加强版
  19. 阿里云华北1235、华东1、华东2和华南1分别对应哪些城市?地域节点物理数据中心在哪?...
  20. 金明的预算方案(01背包)

热门文章

  1. 如何解决MTP 驱动更新的问题(手机插上电脑无法显示U盘弹窗)?
  2. 解决BASE64Encoder报错的问题
  3. 分享一个免费的图片去水印网站
  4. 【软件工程】第1章软件工程概论之CASE工具与环境
  5. 关于element table 动态表头+动态表头及内容+表格优化+初始化表格+隐藏功能,技术提升请来!
  6. 电子通信类考研的建议
  7. 播音主持学习心得之发声时怎么控制气息
  8. Sublime text 3 格式化HTML代码
  9. c++编程求解二元二次方程组_C++编程风格约定
  10. 程序员,要不要考软考高级职称