摘要: 5月最热门的GitHub存储库和顶级Reddit讨论,戳进来~

GitHub和Reddit都是比较有趣的平台,在这里,我不仅学习了数据科学的一些最佳应用,而且还了解数据科学家们是如何编程的。

一直以来,GitHub都是开发人员之间进行协作的终极平台,并且,我们也看到了据科学和机器学习社区以同样的热情来改善它。

而Reddit仍然是一个很好的数据科学领域知识和见解的来源。人们在这个平台上共享代码、数据科学新闻、寻求帮助和意见、发表研究论文等。

这篇文章总结了Reddit平台上5月份的一些关于数据科学的讨论,其中包括数据科学家在未来3年的作用以及有史以来最好的机器学习论文集。在GitHub社区中,英特尔开放了其NLP架构库,微软推出ML.NET以支持Dot Net开发者进行机器学习等。

让我们来看看GitHub上的顶级存储库以及Reddit上个月发生的有趣讨论吧。下面是之前四个月较为流行的GitHub存储库和顶级Reddit讨论(从四月起):

一月

二月

三月

四月

ML.NET

ML.NET是一个开源机器学习框架。不需要任何构建机器学习模型的经验,机器学习和.NET开发人员就可以轻松使用.NET开发自己的模型。这是预发行版本,包含了基本的分类和回归算法。

ML.NET最初由Microsoft创建的,并且已用于各种产品,如Windows,Excel,Access,Bing等。此版本还捆绑了用于各种模型训练任务的.NET API。

NLP Architect

NLP Architect是一个开源Python库,由英特尔实验室的研究人员开发和开源,旨在帮助数据科学家够探索自然语言处理(NLP)和自然语言理解(NLU)领域最先进的深度学习技术。

这个库中我最喜欢的组件之一就是可视化组件,可视化组件很整洁的显示了模型的注释。更多NLP Architect的信息请点击这里

Amazon Scraper

Python包可以让开发人员在亚马逊上搜索和提取产品信息。你需要分析哪些产品,只需使用该包即可,而不再需要编码来确定。只需输入想要搜索的关键字和最大产品数量(可选),就可以输出CSV格式,然后进行分析。

PIGO – Face Detection in Go

Pigo是基于《基于像素强度比较的对象检测》论文、用Go语言开发的人脸检测库。Pigo库的主要特点如下:

1.处理速度快。

2.在检测前不需要做图像预处理。

3.不需要计算积分图像,图像金字塔,HOG金字塔或其他类似的数据结构。

4.人脸检测基于以二进制文件数据树结构编码的像素强度比较

RL-Adventure-2: Policy Gradients

这是所有强化学习(RL)爱好者所喜欢的库。深度学习推动了强化学习编写了一个人工智能机器人以人类专家级技能来玩Atari游戏。 该存储库涵盖了策略梯度算法的新扩展,这是目前解决强化学习问题最受欢迎的默认选择之一。 这些扩展缩短了训练时间、优化了强化学习的整体表现。

Reddit讨论

实时手势姿态估计

这个视频引起了数据科学家和机器学习发烧友的广泛关注,我希望你能看完这个视频,然后你就会很好地了解这项技术是如何实施的。

你会选择哪篇研究论文来证明机器学习是完美的

如果你是一个机器学习菜鸟,又或者是正在寻找一些用来阅读或参考的研究论文,这是一个很好的话题。这个话题中列举了一些优秀的机器学习研究论文,每个数据科学家都将从中受益匪浅。该讨论包括从基本机器学习概念(如高斯模型)到高级概念(如神经艺术风格转换),使用简单功能的增强级联等快速对象检测等论文。这是一个必读话题。

目前,我们对泛化有什么了解?对于泛化,我们接下来应该提什么问题?

深度学习中的泛化一直都是一个争议不断的话题。正如作者所说的那样,我们仍然需要在不少场景中努力实现泛化。这个话题围绕目前泛化现状进行了深入探讨,以及它为什么在深度和强化学习中很难理解。这个话题帖子很长,如果你是这个领域的菜鸟,对于你来说可能会有点复杂。不过,我建议无论如何都要阅读这个话题,因为这个话题中包含了一些经验丰富和知识渊博的数据科学家的看法。

医疗行业的机器学习状况

该话题专门研究了医疗行业的机器学习现状。医疗领域数据科学家分享了他们工作中的经验和观点。想要查看任何生命科学领域机器学习和深度学习的任何信息,请参阅该话题!

数据科学家3年后潜在的职业发展方向

这是大多数人在进入该领域之前非常关心的一个问题。随着自动化机器学习工具的迅速采用,公司在几年内会需要数据科学家吗?本话题收集了数据科学中不同人员对未来几年内的职业发展方向的看法。想要寻求职业方向的指导,请查看这一话题!

原文链接

本文为云栖社区原创内容,未经允许不得转载。

知道这些用于数据科学和机器学习的GitHub存储库和Reddit主题吗?相关推荐

  1. 用于数据科学和机器学习的GitHub存储库和Reddit主题

    GitHub和Reddit都是比较有趣的平台,在这里,我不仅学习了数据科学的一些最佳应用,而且还了解数据科学家们是如何编程的. 一直以来,GitHub都是开发人员之间进行协作的终极平台,并且,我们也看 ...

  2. 16个用于数据科学和机器学习的顶级平台

    调研机构Gartner公司将数据科学和机器学习平台定义为"具有凝聚力的软件应用程序,它提供了创建多种数据科学解决方案以及将这些解决方案合并到业务流程.周围基础设施和产品中所必需的基本构建块的 ...

  3. 大数据 机器学习 分类算法_13种用于数据科学的机器学习分类算法及其代码

    大数据 机器学习 分类算法 The roundup of most common classification algorithms along with their python and r cod ...

  4. 5月Github上最热门的数据科学和机器学习项目TOP5

    作者 | PRANAV DAR 译者 | SAMBODHI 编辑 | Debra AI 前线导读:如果你是开发者,那一定对 GitHub 不会陌生,截止到 2018 年 4 月 10 日(GitHub ...

  5. Python机器学习:数据科学,机器学习和人工智能的主要发展技术趋势概述

    1.介绍 Python因易于学习而广为人知,并且它仍然是数据科学,机器学习和科学计算中使用最广泛的语言.根据最近的一项民意的调查,该调查对1,800多名研究人员分析,数据科学和机器学习偏好的参与者进行 ...

  6. 学习数据科学、机器学习与AI没有多大交集,一文告诉你三者最大区别

    翻译 | AI科技大本营 参与 | Shawn 编辑 | Donna [AI科技大本营导读]我们常常提及数据科学.机器学习和人工智能,也有一个整体的概念.但是,如果要清晰地说出三者的定义分别是什么,区 ...

  7. 微软python在线学习_微软再推免费在线 Python 教程,面向数据科学和机器学习初学者...

    去年九月,微软曾面向 Python 初学者,推出了一套免费的教程视频.从基本介绍和 VS Code 的配置讲起,循序渐进语法概念等基础内容讲解.目前为止,该系列视频播放量已达到将近 180 万次. 近 ...

  8. Github上的10个数据科学和机器学习知识库

    来源:DeepHub IMBA 本文共1200字,建议阅读5分钟在本文中将介绍一些对数据科学和机器学习爱好者最有用的 Github 代码库.(排名顺序不分先后) 1.The Algorithm 数据结 ...

  9. 独家 | 2020年22个广泛使用的数据科学与机器学习工具(附链接)

    作者:RAM DEWANI 翻译:欧阳锦 校对:陈汉青 本文长度为4600字,建议阅读11分钟 本文为大家从两个方面--大数据和数据科学,介绍了本年度的22个被广泛使用的数据科学和机器学习工具.结合了 ...

最新文章

  1. python程序员工作怎样-现在Python就业薪资高吗?Python程序员前景怎么样?
  2. 用Python对XML读取和处理
  3. python语言format用法_python基础_格式化输出(%用法和format用法)
  4. React 之 高阶组件的理解
  5. Unity3D_NGUI_安卓APK安装包瘦身实践
  6. 从Java 11中删除的API
  7. xib 设置阴影_影响uiview阴影的约束?
  8. jQuery框架学习第八天:ASP.NET jQuery实施方案
  9. MongoDB入门系列(二):Insert、Update、Delete、Drop
  10. spring boot2 整合(三)JOOQ工具
  11. pytorch常见问题之cpu占满
  12. BFS(两点搜索) UVA 11624 Fire!
  13. 如何合理分配Elasticsearch的分片和副本
  14. go env 命令介绍
  15. SQL 复合查询条件(AND,OR,NOT)对NULL值的处理
  16. 浅谈SpringAOP功能源码执行逻辑
  17. 用python解决搬砖问题_如何像要饭一般”用“python (一)(非编程类工作/科研搬砖工)...
  18. word自动生成目录如何设置第一页和页码不齐问题
  19. 【转】如何向App Sotre提交应用
  20. 简单的学生选课系统——基于Servlet+Ajax

热门文章

  1. 【LeetCode笔记】94 144 145. 二叉树的前序、中序、后序遍历的迭代与递归(Java、dfs、迭代)
  2. java 格式化字符串_Java入门 - 语言基础 - 14.String类
  3. 平台允许同时在线人数 显示_12万人同时在线,游戏未正式发售,国产“糖豆人”已诞生?...
  4. mysql mode_MYSQL中的sql_mode模式
  5. ov5640帧率配置_逃离塔科夫怎么提升帧率 帧率优化建议_单机游戏_游戏攻略
  6. 该计算机没有运行windows无线服务器,老司机示范win7系统诊断提示此计算机上没有运行的windows无线服务的恢复方法...
  7. 如何反映两条曲线的拟合精度_你知道850加工中心定位精度的检测有哪些吗?
  8. 二阶龙格库塔公式推导_带你走进最美数学公式
  9. python导入模块有几种方式、各有什么特点_Python导入模块的几种姿势
  10. 天大校花,博士发Nature,30岁不到当耶鲁教授!