来源:PaperWeekly

本文共1000字,建议阅读5分钟
本文为你介绍9个最新机器学习开源项目。

本文带你快速 get 每个精选Github项目的亮点和痛点,时刻紧跟 AI 前沿成果。

01

InsightFace

#基于MXNet的人脸识别开源库

InsightFace 是 DeepInsight 实验室对其论文 ArcFace: Additive Angular Margin Loss for Deep Face Recognition 的开源实现。本文工作将 MegaFace 的精度提升到 98%,超过俄罗斯 Vocord 公司保持的 91% 的纪录。

此外,该项目还包括打包对齐好的人脸训练数据(MS1M 和 VGG2)、网络框架(ResNet,InceptionResNet_v2,DenseNet,DPN 和 MobiletNet)和 loss 设计(Softmax,SphereFace,AMSoftmax,CosFace 和 Triplet Loss)。

在此基础上,研究人员可以专注于人脸识别的算法实验,工业界也可以方便地根据自身需求训练,或者凭借该项目提供的高精度预训练模型进行产品化。

论文链接:https://www.paperweekly.site/ papers/1785

项目链接:https://github.com/deepinsight/ insightface

02

#Python图像增强库

Augmentor 是一个 Python 图像增强库,减少了使用图像库自己编写代码的繁杂工序,能够批量完成图像的旋转,放大,缩小,添加噪音以扩充数据量。

▲ 输入图像

▲ 输出图像

项目链接:https://github.com/mdbloice/ Augmentor

03

#序列距离测算

TextDistance 是一个包含 30+ 种算法的 Python 库,用于计算两个或多个序列之间的距离。

项目特性如下:

  • 30+ 种算法

  • 纯 Python 实现

  • 操作简便

  • 支持两种以上序列对比

  • 部分算法具备多种实现

  • 支持 Numpy 获取最大速度优化

项目链接:https://github.com/orsinium/ textdistance

04

Neural Network Voices

#模仿Kate Winslet说话

本项目是 Siraj Raval 在 YouTube 上发布的神经网络语音合成教学视频对应代码,如何使用深度神经网络将普通人的声音转化为英国著名女演员 Kate Winslet 的声音。本项目使用的数据集为 Kate Winslet 朗读的有声书音频。

教学视频:https://youtu.be/6KHSPiYlZ-U

项目链接:https://github.com/llSourcell/ Neural_Network_Voices

05

Personae

#强化、监督学习在金融市场中的应用

Personae 基于 TensorFlow 和 PyTorch 对深度强化学习、监督学习算法和论文进行实现,并尝试将其应用于金融市场(股市)。该项目已实现的算法包含 DDPG,Policy Gradient 和 DualAttnRNN。

▲ 股票交易收益对比

▲ 股价预测结果

项目链接:https://github.com/ceruleanacg/ Personae

06

NNDial

#端到端对话系统开源工具包

NNDial 是一个用于构建端到端可训练任务型对话模型的开源工具包,本项目来自剑桥大学,使用的数据集为 CamRest676。

▲ 测试结果

项目链接:https://github.com/shawnwun/ NNDIAL

07

Voice Activity Detection Toolkit

#语音端点检测工具包

本项目是论文 Voice Activity Detection Using an Adaptive Context Attention Model 的开源实现,此外还包含作者团队自行录制的语音数据集。

该工具包支持 4 种基于 MRCG 的分类器:

  • 自适应上下文注意模型(ACAM)

  • 增强型深度神经网络(bDNN)

  • 深度神经网络(DNN)

  • 基于LSTM的循环神经网络(LSTM-RNN)


项目链接:https://github.com/jtkim-kaist/VAD

08

Knowledge Graph Representation

#用PyTorch实现知识图谱表示

该项目整理了知识图谱表示常用的四个数据集,提供了数据清洗整理的代码,用 PyTorch 实现了四种基于平移的算法。在评估阶段,使用了多进程加速,将 MeanRank 和 Hits@10 的评估时间压缩到小于 1 分钟。

项目链接:https://github.com/jimmywang heng/knowledge_representation_pytorch

09

PyHanLP

#HanLP的Python接口

本项目是汉语言处理包 HanLP 的 Python 接口,支持自动下载与升级 HanLP,兼容 py2 和 py3。

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

HanLP 可提供中文分词、词性标注、命名实体识别、关键词提取、文本推荐、依存句法分析、文本分类、word2vec 和语料库工具等功能。

HanLP主页:http://www.hankcs.com/nlp/ hanlp.html

项目链接:https://github.com/hankcs/pyhanlp

有趣的Github项目万里挑一 !(附论文、项目链接)相关推荐

  1. PyQt6/PySide6:账本项目前端制作【附完整项目地址】

    0. 前言 最近在家里闲着没事,正好又看到朋友@studentWheat发了篇用Tkinter做的账本,于是决定跟他一起改进这个程序. 屏幕截图: 1. 后端 后端主要是朋友做的,在这里就不多说了,放 ...

  2. AAAI2020中的四篇推荐系统好文(附论文下载链接)

    AAAI中推荐系统的文章并不多,目之所及处仅有四篇.内容上覆盖了评论推荐.多目标推荐以及图神经网络等话题. 本文基于AAAI中的这四篇推荐系统论文,展开瞅一瞅它们都讲了些什么. 第一篇文章:可解释评论 ...

  3. 【华为推荐论文】如何学习未知样本?基于反事实学习的推荐系统技术研究(附论文下载链接)...

    华为诺亚方舟实验室发布了最新研究成果<Improving Ad Click Prediction by Considering Non-displayed Events>,提出了一种基于反 ...

  4. 好看的论文千篇一律,有趣的Github项目万里挑一!

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  5. 基于多视角学习和个性化注意力机制的新闻推荐(附论文下载链接)

    编者按:个性化新闻推荐是新闻行业必然的发展方向,在其实现过程中面临着三个关键问题,即分析用户兴趣.根据新闻内容建模和新闻排序.本文将这三个问题划归为新闻信息与用户兴趣的多样性问题,并由此出发,提出了基 ...

  6. ICML 2019 | 强化学习用于推荐系统,蚂蚁金服提出生成对抗用户模型(附论文下载链接)...

    选自arXiv 作者:Xinshi Chen.Shuang Li.Hui Li.Shaohua Jiang.Yuan Qi.Le Song 机器之心编译 参与:李诗萌.shooting 将强化学习用于 ...

  7. 【推荐论文】基于多视角学习和个性化注意力机制的新闻推荐(附论文下载链接)...

    编者按:个性化新闻推荐是新闻行业必然的发展方向,在其实现过程中面临着三个关键问题,即分析用户兴趣.根据新闻内容建模和新闻排序.本文将这三个问题划归为新闻信息与用户兴趣的多样性问题,并由此出发,提出了基 ...

  8. 【经典回顾】YouTube 深度学习推荐系统的十大工程问题(附论文下载链接)

    这篇文章主要介绍了 YouTube 深度学习系统论文中的十个工程问题,为了方便进行问题定位,我们还是简单介绍一下背景知识,简单回顾一下 Deep Neural Networks for YouTube ...

  9. 【论文】基于层次化注意力图网络和多视角学习的商品推荐(附论文下载链接)...

    编者按:在电子商务的发展中,个性化推荐技术对于提升平台运营水平.商户营收以及用户购物体验都发挥着至关重要的作用.精进这一技术的关键在于准确有效的用户和商品表示与交互.微软亚洲研究院在 EMNLP 20 ...

最新文章

  1. python字典随时添加元素和值
  2. hackerrank---Sets - Symmetric Difference
  3. 经典永驻,重温设计模式 |硬核!
  4. ajax基本流程,AJAX基本流程
  5. tcp java实例_实现了基于TCP的Java Socket编程实例代码
  6. 【转】VS编程,快速折叠或者展开代码到 #region 级别的设置方法。
  7. 动手Lab|利用CSI和Kubernetes实现动态扩容
  8. Web前端工作笔记007---h5 canvas_雨滴头像合成_图像合成_合成雨滴头像
  9. jQuery-元素节点操作
  10. Springboot+vue项目旅游管理系统
  11. 计算机控制的行业规模,2019年中国DCS控制系统行业市场现状及竞争格局分析,内资“两家独大”「图」...
  12. Hologres数据迁移之holo-shipper
  13. c语言if语句用法总结,C语言if语句总结.doc
  14. These songs can cheer you up when life gets hard
  15. 很抱歉,你不涨工资,正是因为你“太努力”!
  16. BC20/BC26-opencpu移植cjson,mqtt等注意事项
  17. 卷积神经网络发展(网络骨架:Backbone)
  18. 最新(2014-09-22)中国IT互联网公司市值排名(单位:亿美元)
  19. 使用C语言实现LED1/LED2/LED3灯点亮
  20. 2010年全球地震统计 4月14日 更新

热门文章

  1. Java多线程之线程池的使用示例
  2. 关于ES性能调优几件必须知道的事
  3. 数据结构实验之链表五:单链表的拆分-sdut
  4. leetcode解题报告:188 Best Time to Buy and Sell Stock IV
  5. Android string.xml 通配符 %$用法
  6. 使用sendfile()让数据传输得到最优化,TCP_CORK、TCP_DEFER_ACCEPT和TCP_QUICKACK优化网络...
  7. php中 继承中的概念,JavaScript_JavaScript中的继承方式详解,js继承的概念 js里常用的如下 - phpStudy...
  8. c语言程序能够在不同的操作系统下运行,这说明c语言具有很好的,程序设计(C)作业一(有答案)...
  9. padding在css中是什么意思,CSS里的padding是什么意思?
  10. python中判断字符是否为中文