来源:PaperWeekly

本文共1700字,建议阅读6分钟。
本文为你精选近期Github上的13款深度学习开源工具包和数据集,一起Star和Fork吧~


01


#Swift for TensorFlow

Swift for TensorFlow 为 TensorFlow 提供了一种新的编程模型,将 TensorFlow 计算图与 Eager Execution 的灵活性和表达能力结合在了一起,同时还注重提高整个软件架构每一层的可用性。

本项目的设计基础是 Graph Program Extraction 算法,它可以让你用 Eager Execution 式的编程模型来轻松地实现代码,同时还保留 TensorFlow 计算图的高性能优势。此外,本项目还将高级的自动微分功能直接集成在了 Swift 语言和编译器里面。

项目链接

https://github.com/tensorflow/swift

02

#可视化降维Python工具包

HyperTools 是一个具有可视化功能的降维工具包,其基本流程是输入高维数据,调用降维函数,同时进行绘图。

▲ 效果展示

项目链接

https://github.com/ContextLab/hypertools

03

GluonNLP

#NLP深度学习工具包

GluonNLP 提供了 NLP 方向的顶尖深度学习模型实现,并且构建了文本数据管道和模型的模块。它专门面向工程师、研究人员和学者设计,大家可以基于这些模型快速实现研究思路,做出产品原型。

该项目具有如下特征: 

1. 训练脚本来重现论文中的 state-of-the-art 结果;

2. 针对常见 NLP 任务的预训练模型;

3. 精心设计的 API,可以极大减少实现的复杂性;

4. 中文社区支持。

▲ 案例展示

项目链接

https://github.com/dmlc/gluon-nlp

04


GluonCV

#CV深度学习工具包

GluonCV 提供了 CV 方向的顶尖深度学习模型实现。该项目能帮助工程师、研究人员和学者快速打造产品原型、验证新思路以及学习计算机视觉。

该工具包提供如下功能:

1. 近年重要论文的复现;

2. 详细文档提供使用说明和代码讲解;

3. 提供预训练的模型可以直接使用;

4. 性能评测,方便大家在不同模型之间做取舍;

5. 每个模型实现和接口尽量保证一致性,降低使用新模型的学习门槛;

6. 定时做重新训练保证代码正确性;

7. 中文社区支持。

▲ 案例展示

项目链接

https://github.com/dmlc/gluon-cv

05


PyTorch Summary

#PyTorch版Keras API: model.summary()

Keras 框架有一个用于模型可视化的简洁 API —— model.summary(),本项目实现了用于 PyTorch 框架中的 model.summary() 功能,用于输出模型各层的详细参数。

▲ 效果展示

项目链接

https://github.com/sksq96/pytorch-summary

06


NCRF++

#基于PyTorch的Neural版本CRF++

本项目是基于 PyTorch 的神经网络序列标注开源库,包含了几种最先进的神经网络序列标注模型(LSTMCRF, CNNCRF 等),算是神经网络版的 CRF++。它可以让用户快速重现论文中的模型(如 Ma et. al ACL 2016; Lample et. al NAACL2016)。

该项目具有以下几个特点:

1. 无需写代码:只要通过修改配置文件就可以对模型的结构进行配置,无需任何代码工作;

2. 自由添加特征:该项目不仅集成了几种经典的特征结构(如 char-lstm, char-gru, char-cnn)还可以添加自定义的特征并初始化特征向量;

3. 高效准确:利用该开源库可以轻松重现之前的多篇论文的结果,大部分情况下会得到比论文更高的精度。同时该项目时完全基于 batch 计算实现的,因此计算速度很快(2000 句/秒);

4. Nbest 输出:其 CRF 结构支持输出 top-n 个最优 label 序列,并给出对应的序列概率。

▲ 结构设计

项目链接

https://github.com/jiesutd/NCRFpp

07


Adversarial Robustness Toolbox

#IBM开源对抗机器学习库

Adversarial Robustness Toolbox 是由 IBM 团队开源的对抗机器学习库,其主要用于检测模型及对抗攻击,为开发人员加强 AI 模型被误导的防御性,让 AI 系统变得更加安全。

本项目实现了以下分类器攻防方法:

攻击:

  • Deep Fool (Moosavi-Dezfooli et al., 2015)

  • Fast Gradient Method (Goodfellow et al., 2014)

  • Jacobian Saliency Map (Papernot et al., 2016)

  • Universal Perturbation (Moosavi-Dezfooli et al., 2016)

  • Virtual Adversarial Method (Moosavi-Dezfooli et al., 2015)

  • C&W Attack (Carlini and Wagner, 2016)

  • NewtonFool (Jang et al., 2017)

防御:


  • Feature squeezing (Xu et al., 2017)

  • Spatial smoothing (Xu et al., 2017)

  • Label smoothing (Warde-Farley and Goodfellow, 2016)

  • Adversarial training (Szegedy et al., 2013)

  • Virtual adversarial training (Miyato et al., 2017)

项目链接

https://github.com/IBM/adversarial-robustness-toolbox

08


Chatbot

#可以进行训练的聊天机器人

本项目是一个可以自己进行训练的聊天机器人,可以根据自己的语料训练出想要的对话机器人。本次训练的语料是从互联网上找到的 shooter 训练语料,语料质量很差劲,仅作为演示代码来用,大家可以使用自己的语料。

项目链接

https://github.com/zhaoyingjun/chatbot

09


SparkFlow

#基于Spark平台的TensorFlow实现

SparkFlow 是一个基于 Spark 平台的 TensorFlow 实现,让用户更方便在 Spark 上部署 TensorFlow 程序,更好地利用分布式平台进行深度学习模型的训练。

▲ MNIST深度学习示例

项目链接

https://github.com/lifeomic/sparkflow

10


Tweet Generator

#模拟任何Twitter用户发推文

Tweet Generator 是一个模拟 Twitter 用户风格生成推文的工具。本项目基于 textgenrnn,并使用上下文标签对网络进行训练以获得更好的推文合成。

textgenrnn 是一个基于 Keras 和 TensorFlow 的 Python 3 模块,只需几行代码即可训练文本生成网络。

▲ 效果展示

项目链接

https://github.com/minimaxir/tweet-generator

11


DL Project Template

#深度学习工程模板

本项目是由美图云事业部开源的深度学习工程模板,简化加载数据、构建网络、训练模型和预测样本的流程。

▲ 框架图

▲ 文件夹结构

项目链接

https://github.com/SpikeKing/DL-Project-Template

12


STAIR Actions

#用于动作识别的大规模视频数据集

STAIR Actions 是一个用于动作识别的大规模视频数据集,包含 100 类诸如吃饭、喝水、洗手、扔垃圾等人类日常行为,每一类动作有 1000 个左右的视频。作者保留了 10% 的数据用于后续比赛。

▲ 数据集规模

▲ 100种行为列表

项目链接

https://github.com/STAIR-Lab-CIT/STAIR-actions

13


Moonlight Optical Music Recognition

#基于TensorFlow的光学乐谱识别工具

本项目是一个基于 TensorFlow 的光学乐谱识别工具,它通过读取包含乐谱的 PNG 图像来输出 MusicXML 格式乐谱或 NoteSequence 消息。

项目链接

https://github.com/tensorflow/moonlight

精选 Github 近期13款开源工具包!(附数据集、链接)相关推荐

  1. 【GitHubDailyShare】主打小而美的功能,GitHub 上一款开源的 3D 建模

    GitHub 上一款开源的 3D 建模工具:Plasticity,主打小而美的功能,为概念艺术创作而生,可通过各类快捷操作,快速完成 3D 建模工作. GitHub:github.com/nkalle ...

  2. 13 款开源的全文搜索引擎

    主要介绍13款现有的开源搜索引擎,你可以将它们用在你的项目中以实现检索功能. 1.  Lucene Lucene的开发语言是Java,也是Java家族中最为出名的一个开源搜索引擎,在Java世界中已经 ...

  3. github创建项目_用了 GitHub 上这款开源神器后,创建项目文档变得 so easy!

    大家好,我是小 G. 今天跟大家分享一个可用于快速创建项目文档的开源神器:MkDocs. https://github.com/mkdocs/mkdocs 该项目创建自 2014 年,目前 GitHu ...

  4. 13 款开源的全文检索引擎

    http://www.iteye.com/news/27484 1.  Lucene Lucene的开发语言是Java,也是Java家族中最为出名的一个开源搜索引擎,在Java世界中已经是标准的全文检 ...

  5. 13款开源搜索引擎的介绍

    本文档转载自 http://blog.csdn.net/xum2008/article/details/8740063 对现有的开源的搜索引擎的一个简单介绍: Lucene Lucene的开发语言是J ...

  6. 13 款开源全文检索引擎

    Lucene Lucene的开发语言是Java,也是Java家族中最为出名的一个开源搜索引擎,在Java世界中已经是标准的全文检索程序,它提供了完整的查询引擎和索引引擎,没有中文分词引擎,需要自己去实 ...

  7. asp.net core文档下载_推荐一个必备的开源项目 (附下载链接)

    点击上方"阿拉奇学Java",选择"置顶或者星标" 优质文章第一时间送达! 推荐阅读 | 大白话讲解技术专业用语 很多人都会遇到下载相关的需求,如果是只下载一个 ...

  8. 【推荐】1657- 灵活可扩展,2023年值得尝试的13款富文本编辑器

    作为前端开发人员,我们经常需要为网站和应用程序添加文本内容.与传统的文本编辑器不同,富文本编辑器可让您轻松创建各种类型的文本内容,包括加粗字体.斜体字.框架.列表.图片和视频等. 本文我将向大家推荐 ...

  9. 灵活可扩展,2023年值得尝试的13款富文本编辑器

    作为前端开发人员,我们经常需要为网站和应用程序添加文本内容.与传统的文本编辑器不同,富文本编辑器可让您轻松创建各种类型的文本内容,包括加粗字体.斜体字.框架.列表.图片和视频等. 本文我将向大家推荐 ...

最新文章

  1. LeetCode简单题之托普利茨矩阵
  2. 能源枯竭?在能源互联网时代不存在!
  3. python matplotlib模块画出的图像转换为.tiff格式
  4. 2021-04-09 linux的shell脚本简单教程
  5. mysql ip比较大小_MySQL优化/面试,看这一篇就够了
  6. Modifier ‘public‘ is redundant for interface methods错误
  7. ListView删除选中的多项目
  8. 添加到界面前获取尺寸
  9. 注意,GitHub发布重大更新,关系到所有程序员!
  10. 用Scratch制作血量条的方法+源码
  11. C++-win32-GetLastError的返回值的含义
  12. 安装 GVM 11 的 OS选择说明
  13. 【pandas】df.str.contains包含多个值写法
  14. 基于Jetson NX的模型部署
  15. WPF教程(二)--Application WPF程序启动方式
  16. 又一年没有中国队的世界杯,你还会熬夜打call吗?网友的回答亮了
  17. 腾讯手游助手弹窗提示检测到兼容的Hyper-v正在运行,请关闭后重试
  18. 【数据堂开放数据】活体检测数据免费开放
  19. 洛谷 P1157 组合的输出 Python题解
  20. 人类到目前为止发现的唯一一个素数公式

热门文章

  1. [自带避雷针]DropShadowEffect导致内存暴涨
  2. 【机器学习实战】第7章 集成方法(随机森林和 AdaBoost)
  3. 十分钟用Windows服务器简单搭建DHCP中继代理!!
  4. 姗姗来迟的Serverless如何助力微服务和DevOps
  5. Java 内部类分析
  6. Windows Phone本地数据库(SQLCE):5、[Association]attribute(翻译)(转)
  7. 软件构建发布自动化[摘抄]
  8. 获取用户的IP地址的三个属性的区别
  9. 因为WMI配置,无法执行Sql Server 系统配置检查器的解决办法
  10. 如何解决现有的问题——VBA课程第五次讨论2007年12月13日