点击上方“CSDN”,选择“置顶公众号”

关键时刻,第一时间送达!

作为一名狂热的数据科学爱好者,本文作者整理了 2017 年 Github 上尤为实用的数据科学资源,希望和大家共同学习。

学习资源

Awesome Data Science

这个 GitHub 库是数据科学的终极资源指南。 多年来,它建立在各种各样的贡献之上,包括入门指南、信息图、以及人们在 Twitter,Facebook,Instagram 等社交网站上关注的学习内容。无论你是刚刚入门的新手还是经验丰富的数据科学家,都有很多资源可供参考学习。

目录如下:

项目地址:https://github.com/bulutyazilim/awesome-datascience

Machine Learning / Deep Learning Cheat Sheet

该项目以速查表形式介绍了机器学习/深度学习的常用工具和技术。本速查表手册的范围很广,从非常简单的工具到深度学习等技术。

不同类型的速查表有 Panda、Numpy、scikit、matplotlib、ggplot、dplyr、tidyr、pySpark 和神经网络。

项目地址:https://github.com/kailashahirwar/cheatsheets-ai

牛津大学自然语言处理高级课程

在自然语言处理(NLP)领域,斯坦福大学的研究一直是名列前茅。但是随着深度学习的到来,NLP 已经取得了巨大的进步,这都归功于 RNN 和 LSTMs 等深度学习体系结构的能力。

这个基于牛津大学 NLP 课程的资源库将 NLP 的教育提升到一个新的水平。本课程是一门实践性的课程,涵盖了诸如使用 RNNs 进行语言建模、语音识别、文本转语音等方面的技术。该存储库是为所有的牛津讲座提供的一站式服务,为实际应用提供授课材料。

项目地址:https://github.com/oxford-cs-deepnlp-2017/lecture

PyTorch – Tutorial

截至目前,PyTorch 是 TensorFlow 的唯一竞争对手,且在维护和声誉方面使其成为了颇具竞争力的深度学习框架。因为 Pythonic 风格编程、动态计算以及更快的原型开发,Pytorch 已经获得了深度学习社区的广泛关注。

该资源库包含了用于深度学习任务代码, 从基础地创建一个 PyTorch 的神经网络到编码 RNNs、GANs 和神经类型迁移。其中的大多数模型已经实现了 30 多行代码。这充分说明了 PyTorch 的抽象能力,以便研究人员可以专注于迅速找到正确的模型,而无需纠缠于编程语言和工具选择等细节。

项目地址:https://github.com/yunjey/pytorch-tutorial

Resources of NIPS 2017

该资源库是 NIPS 2017 年会议上的资源和所有受邀演讲、教程和研讨会的 PPT。

NIPS 是一年一度的机器学习和计算神经科学会议。

近几年来,数据科学领域内的突破性研究都曾作为研究结果出现在 NIPS 大会上。如果你想保持领先的地位,那么这个就是很好的学习资源!

项目地址:https://github.com/hindupuravinash/nips2017

开源软件库

TensorFlow

TensorFlow 发布已有 2 年的时间,它一直保持着机器学习和深度学习顶级库的地位。Google Brain 和 TensorFlow 社区一直在积极地贡献并保持最新的发展,尤其是在深度学习领域。

TensorFlow 最初是使用数据流图进行数值计算的开源软件库,但从目前来看,它已经成为构建深度学习模型的完整框架。虽然 TensorFlow 主要支持 Python,但它也支持诸如 C、C++ 和 Java 等语言。此外,它也可以在移动平台上运行!

项目地址:https://github.com/tensorflow/tensorflow

TuriCreate:一个简化的机器学习库

TuriCreate 是苹果最近贡献的一个开源项目,它为机器学习模型提供易于使用的创建方法和部署方法,这些机器学习模型包括目标检测、人体姿势识别和推荐系统等复杂任务。

可能我们作为机器学习爱好者会比较熟悉 GraphLab Create,一个非常简便高效的机器学习库,而当初创建该库的公司 TuriCreate 被苹果收购时,造成了很大反响。

TuriCreate 是针对 Python 开发的,且它最强的的特征是将机器学习模型部署到 Core ML 中,用于开发 iOS、macOS、watchOS 和 tvOS 等应用程序。

项目地址:https://github.com/apple/turicreate

OpenPose

OpenPose 是一个多人关键点检测库,它可以帮助我们实时地检测图像或视频中某个人的位置。OpenPose 软件库由 CMU 的感知计算实验室开发并维护,对于说明开源研究如何快速应用于部署到工业中,它是非常好的一个案例。

OpenPose 的一个使用案例是帮助解决活动检测问题,即演员完成的动作或活动能被实时捕捉到。然后这些关键点和它们的动作可用来制作动画片。OpenPose 不仅有 C++的 API 以使开发者能快速地访问它,同时它还有简单的命令行界面用来处理图像或视频。

项目地址: https://github.com/CMU-Perceptual-Computing-Lab/openpose

DeepSpeech

DeepSpeech 是百度开发的开源实现库,它提供了当前顶尖的语音转文本合成技术。它基于 TensorFlow 和 Python,但也可以绑定到 NodeJS 或使用命令行运行。

Mozilla 一直是构建 DeepSpeech 和开源软件库的主要研究力量,Mozilla 技术战略副总裁 Sean White 在一篇博文中写道:「目前只有少数商用质量的语音识别引擎是开源的,它们大多数由大型公司主宰。这样就减少了初创公司、研究人员和传统企业为它们的用户定制特定的产品与服务。但我们与机器学习社区的众多开发者和研究者共同完善了该开源库,因此目前 DeepSpeech 已经使用了复杂和前沿的机器学习技术创建语音到文本的引擎。」

项目地址: https://github.com/mozilla/DeepSpeech

Mobile Deep Learning

该资源库将数据科学中的当前最佳技术移植到了移动平台上。该 repo 由百度研究院开发,目的是将深度学习模型以低复杂性和高速度部署到移动设备(例如 Android 和 IOS)上。

下图解释了一个简单的用例,即目标检测。它可以识别目标(例如一张图像中的手机)的准确位置,很棒不是吗?

项目地址:https://github.com/baidu/mobile-deep-learning

Visdom

Visdom 支持图表、图像和文本在协作者之间进行传播。你可以用编程的方式组织可视化空间,或者通过 UI 为实时数据创建仪表盘,检查实验结果,或者调试实验代码。

绘图函数中的输入会发生改变,尽管大部分输入是数据的张量 X(而非数据本身)和(可选)张量 Y(包含可选数据变量,如标签或时间戳)。它支持所有基本图表类型,以创建 Plotly 支持的可视化。

Visdom 支持使用 PyTorch 和 Numpy。

项目地址:https://github.com/facebookresearch/visdom

Deep Photo Style Transfer

这个 repo 是基于近期论文《Deep Photo Style Transfer》,该论文介绍了一种用于摄影风格迁移的深度学习方法,可处理大量图像内容,同时有效迁移参考风格。该方法成功克服了失真,满足了大量场景中的摄影风格迁移需求,包括时间、天气、季节、艺术编辑等场景。

项目地址:https://github.com/luanfujun/deep-photo-styletransfer

CycleGAN

CycleGAN 是一个有趣且功能强大的库,展现了最先进技术的潜力。举例来说,下图大致展示了该库的能力:调整图像景深。这里的关键点在于,你并没有实现告诉算法哪一部分需要重点关注。算法完全一高自己做到了!

目前该库用 Lua 编写,但是它也可以在命令行中使用。

项目地址:https://github.com/junyanz/CycleGAN

Seq2seq

Seq2seq 最初是为机器翻译而开发的,但后来被开发用于其他各种任务,包括摘要生成、对话建模和图像捕捉。只要一个问题的结构是将输入数据编码为一种格式,并将其解码为另一种格式,就可以使用 Seq2seq 框架。它使用 Python 所有流行的 TensorFlow 库进行编程。

项目地址:https://github.com/google/seq2seq

Pix2code

这是一个非常令人兴奋的深度学习项目,它尝试为给定的 GUI 自动生成代码。在构建网站或移动设备界面时,前端工程师通常必须编写大量重复的代码,这比较费时且低效率。实质上,这阻碍了开发者将大部分时间用于实现其正在构建软件的功能及逻辑。Pix2code 的目的是通过将过程自动化来克服这一困难。它基于一种新颖的方法,允许以单个 GUI 截图作为输入来生成计算机 token。

Pix2code 是使用 Python 编写,可将移动设备和网站界面的捕捉图像转换成代码。

项目地址:https://github.com/tonybeltramelli/pix2code

原文:15 Trending Data Science GitHub Repositories you can not miss in 2017

链接:https://www.analyticsvidhya.com/blog/2017/12/15-data-science-repositories-github-2017/

作者: SUNIL RAY

编译:苏宓

GitHub 上 15 个优秀开源项目告诉你如何上手数据科学!相关推荐

  1. vue github开源项目_11月份Github上最热门的开源项目

    开源最前线(ID:OpenSourceTop) 猿妹整编 转载请注明来源作者 11 月份 GitHub 上最热门的开源项目排行已经出炉啦,在本月的名单中,有15亿参数量的通用语言模型.还有NLP工具包 ...

  2. 2020年2月Github上最热门的开源项目

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 来自:开源最前线(ID:OpenSourceTop)  2月份GitHub上最热门 ...

  3. [转]2020年2月份Github上最热门的开源项目,速来围观

    随着疫情被逐渐控制,好消息一天天传来,相信用不了多久我们就能恢复正常生活了. 宅在家这么久,对于专业技能你落下了多少? 2月份GitHub上最热门的开源项目排行已经出炉啦,和我一起来看看上榜详情: 1 ...

  4. 6月份Github上最热门的开源项目排行出炉

    6月份Github上最热门的开源项目排行出炉,一起来看看本月上榜的开源项目有哪些: 1. the-art-of-command-line https://github.com/jlevy/the-ar ...

  5. 2020年5月Github上最热门的开源项目

    5月份GitHub上最热门的开源项目排行已经出炉啦,一起来看看上榜详情吧 1 cwa-app-android https://github.com/corona-warn-app/cwa-app-an ...

  6. 2020年7月Github上最热门的开源项目

    来自:开源最前线(ID:OpenSourceTop) 7月份GitHub上最热门的开源项目排行已经出炉啦,一起来看看上榜详情吧 1 tsunami-security-scanner https://g ...

  7. 2020年1月Github上最热门的开源项目

    来自:开源最前线(ID:OpenSourceTop)  1月份GitHub上最热门的开源项目排行已经出炉啦,一起来看看上榜详情: 1 the-book-of-secret-knowledge http ...

  8. 近期GitHub上最热门的开源项目(附链接)

    2 月份 GitHub 上最热门的开源项目又出炉了,又有哪些新的项目挤进热门榜单了呢,一起来看看. 1.nocode https://github.com/kelseyhightower/nocode ...

  9. GitHub上不错的Android开源项目(二)

    摘要:GitHub上的开源项目不胜枚举,通过这些项目,也能让开发者在应用开发过程中事半功倍,作为开发者的你,在用这些开源项目吗?今天我们将介绍另外20个在GitHub上备受欢迎的Android开源项目 ...

最新文章

  1. 我熬了几个大夜,学完一套 海外博士 总结的「卷积神经网络、目标检测、OpenCV」笔记!...
  2. Spring Cloud Stream Binder 实现
  3. 在Nature都点赞的大会上,马斯克被「脑机接口之父」炮轰了:他说的话,我一个字都不认同...
  4. C# 仿金山毒霸启动和关闭淡入淡出效果
  5. 数据库面试题之PL/SQL面试题
  6. HashMap简单源码及多线程下的死循环
  7. 【图像分割】基于matlab蚁群优化模糊聚类图像分割【含Matlab源码 130期】
  8. 机器学习:弱监督学习简介
  9. oracle redo查询,ORACLE UNDO REDO查看
  10. SpringCloud11-GateWay网关
  11. Uva 437 巴比伦塔  UVA10003
  12. Mac升级python3版本
  13. 苹果手机通话记录删除了怎么恢复?
  14. Excel -- 排序与排名
  15. 谷歌的seo原理是什么
  16. 国外名校在线学位申请
  17. 微信小程序 - 登录获取openid和用户信息(适配getUserProfile)
  18. 网络爬虫:基于有道的文本翻译
  19. Chopper-Python version 1.0
  20. 当前的几种开源游戏服务端介绍

热门文章

  1. php美顏滤镜,PHP GIF / PNG True Colorize滤镜,可保留亮度和Alpha
  2. redis 值字符串前面部分乱码_Spring-RedisTemplate写入数据乱码问题的复现与解决
  3. arduino运行java_调试在Arduino MKR1000上运行的Arduino Uno代码
  4. Windows拷贝大文件
  5. 下一代 Windows 将至,是全新的 Windows 11 还是 Windows 10 的延续?
  6. 揭秘 Python 火爆背后的真实现状,2020 Python 开发者调查
  7. 2021 最新的 Web 开发趋势
  8. IntelliJ IDEA、Kotlin、PyCharm 背后公司 JetBrains 遭美国调查!
  9. 网信办拟规定:平台未经用户同意不得强制订阅关注账号;Twitter回应大范围宕机;Krita 4.4.0发布|极客头条
  10. 提升源代码安全管控 从源头保护敏感数据