作者    | Walker

转载自 | 磐创AI

【导读】:本文为大家总结了二月份最热门的机器学习项目top5。想要获取更多的机器学习、深度学习资源,欢迎大家点击上方蓝字关注我们的公众号:深度学习与计算机视觉

No1: StyleGAN — OfficialTensorFlow Implementation

github地址:https://github.com/NVlabs/stylegan

上面的图片看起来像一幅典型的拼贴画,但事实上,这个收藏里的人都不是真的,这些人都是不存在的。所有这些人都是由称为Stylegan的算法生成的。

自从几年前发明了GAN算法,它的性能一直在稳步提升,但Stylegan的出将比赛提升了好几个level。开发人员提出了两种新的、自动化的方法来量化这些图像的质量,并公开了大量高质量的人脸数据集。

该github库同时也包含算法的官方TensorFlow实现。以下是了解有关Stylegan的一些关键资源:

Link

Description

http://stylegan.xyz/paper

Paper PDF.

http://stylegan.xyz/video

Result video.

http://stylegan.xyz/code

Source code.

http://stylegan.xyz/ffhq

Flickr-Faces-HQ dataset.

http://stylegan.xyz/drive

Google Drive folder.

No2:OpenAI’s Ground-Breaking Language Model – GPT-2

github地址:https://github.com/openai/gpt-2

下面来介绍一种来自于OpenAI的突破性语言模型GPT-2。2019年2月,GPT-2获得了非官方的“最受欢迎的”自然语言处理图书馆奖。但他们启动GPT-2的方式引起了不少关注,该团队声称该模型工作得很好,但由于害怕恶意使用。他们不能完全开放源代码。然而,他们还是在Github中发布了一个模型的较小版本,访问上述链接即可看到。

GPT-2是一个具有15亿参数的大型语言模型。该模型已经在800万个网页的数据集上进行了训练,当给定文本中的前一个单词时,模型的目标是预测下一个单词。

此外,我们还可以通过一些其它资源了解GPT-2:

  • Blog Post(https://blog.openai.com/better-language-models/)

  • Official Paper

(https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf)

No3:SC-FEGAN

Github地址:https://github.com/JoYoungjoo/SC-FEGAN

另一个GAN?!没错–Gans正在以狂风暴雨之势席卷数据科学世界。SC-FEGAN在风格上和我们上面讨论的Stylegan算法一样有趣。

上图完美地说明了SC-FEGAN的作用。SC-FEGAN用深度网络编辑面部图像,SC-FEGAN非常适合使用带有草图和颜色的直观输入,进而生成高质量的合成图像。我们使用SN-patchGAN鉴别器和Unet-like 产生器和选通卷积层,当然你可以使用开发人员训练过的深层神经网络编辑各种面部图像。

此外该存储库中还包含了帮助您在自己的计算机上构建SC-FEGAN模型的步骤。还等什么?赶紧来试一下吧!

No4:LazyNLP for Creating Massive TextDatasets

github地址:https://github.com/chiphuyen/lazynlp

LazyNLP背后的原理其实很简单——它能够对网站进行爬取、清理和消除重复数据,从而创建大量的单语数据集。Lazynlp将允许您创建比OpenAI用于培训GPT-2模型的数据集更大的数据集。使用这个库,您应该能够创建比OpenAI用于GPT-2的数据集大的数据集。

这个Github存储库还列出了创建自己的自定义NLP数据集需要遵循的5个步骤。如果您对这个项目感兴趣,点击上方链接具体查看详细信息。

No5:Subsync

github地址:https://github.com/smacke/subsync

该项目的实施始于2019年的哈克伊利诺斯州,获得了荣誉奖(排名前5名),Subsync是关于“语言无关自动同步字幕到视频,使字幕在视频中对齐到正确的起点”。该算法是利用python中的傅立叶变换技术建立的。

此外,Subsync也可以在VLC媒体播放器中工作!该模型大约需要20-30秒的训练时间(具体训练时间要取决于视频长度)。

最后我们给大家介绍一个数据集,Flickr-Faces-HQ Dataset (FFHQ)。(Github地址:https://github.com/NVlabs/ffhq-dataset)。

该数据非常适合学习和使用GAN进行试验,适用于当我们想要搜索高质量图像数据的场景。该数据集由70000张超高质量图像(1024 x 1024)组成,包含的人脸的维度有:如年龄、种族、形象背景等。

欢迎扫码关注:

觉得赞你就点在看,多谢大佬

热点项目|近期Github热门项目Top5相关推荐

  1. github上好的c语言项目,2019 github热门项目

    zdog zdog是一款js 3D引擎,zdog不同于其他的js 3D引擎的地方在于所有的API引用全部都是2D绘图,所以zdog项目才会简单,但是高效. 一起来做马里奥吧! craft craft是 ...

  2. GitHub 热门项目:PyTorch 资源大全

    (给Python开发者加星标,提升Python技能) 整理:Python开发者(id:PythonCoder) PyTorch 是一个开源的深度学习框架,能够在强大的 GPU 加速基础上实现张量和动态 ...

  3. GitHub 热门项目:机器学习编程 100 天

    (点击上方公号,快速关注我们) 整理:Python开发者(id:PythonCoder) 推荐一个 GitHub 热门项目:100 Days of ML Coding  | 机器学习编程 100 天 ...

  4. 【人工智能项目】机器学习热门项目-波士顿房价

    [人工智能项目]机器学习热门项目-波士顿房价 1.数据概览分析 1.1 数据概览 本次提供: train.csv,训练集: test.csv,测试集: submission.csv 真实房价文件: 训 ...

  5. 编辑精选 | 每周为你推荐Github热门项目、学习资源等优质内容!

    开发者周刊 <2019-05-07 第 08 期> **学习往期:**https://letter.csdn.net/news/newsletter/index/45 **邮件订阅:**h ...

  6. #每日播报# 8月6日 Github 热门项目汇总

    这是一份来自美国的网友利用 Github 的 API 获取的每日 Github 上热门项目列表,该网友每天都会发布更新列表.下面是 8月6日的热门项目列表: **objective-c ** Chri ...

  7. CTOlib码库介绍(GitHub热门项目收录网站)

    网站链接:https://www.ctolib.com/ CTOlib码库每日更新收录GitHub上各编程语言的热门项目.活跃项目.教程等资源,目前(2020.2.12)已经收录了56493个,共65 ...

  8. GitHub热门项目 | PyTorch 资源大全,7400多星

    整理:Python开发者(id:PythonCoder) PyTorch 是一个开源的深度学习框架,能够在强大的 GPU 加速基础上实现张量和动态神经网络. 有下面这些公司/机构在用 PyTorch. ...

  9. 1、eclipse 使用git提交项目至github进行项目托管

    1.登录github创建仓库 2.eclipse 选中要上传的项目,创建本地仓库 3.finish之后,整个项目的效果为: 1.项目文件夹内多了.git文件夹,该文件夹为该项目的本地仓库,用于管理版本 ...

最新文章

  1. TCP/IP详解学习笔记(9)-TCP协议概述
  2. R语言使用vcd包的spine函数可视化spinogram图(spinogram图是被归一化的堆叠条形图、这样每个条形的高度一样、内部显示不同分布的比例)
  3. LNMP环境搭建(二)集成Nginx与PHP
  4. Nginx前端设置反向代理,后端Apache如何获取访客的真实IP,结合PHP。
  5. 链表之单链表约瑟夫问题(二)
  6. 自学html代码,新手学HTML代码的简易方法
  7. CSS_照片墙例子 相对定位
  8. Nodejs模块初始化
  9. 原型化系统---失物招领APP
  10. 【李宏毅2020 ML/DL】P4 Basic Concept
  11. python100例详解-Python编程之属性和方法实例详解
  12. 【分享】React函数式组件写法优劣
  13. 免费pdf转换成txt转换器
  14. J2EE项目数据字典设计
  15. 心力哲学——艰难多变环境下快乐、自由与生存力的源泉(二)
  16. 买房建房装修之风水知识,多图
  17. Codeforces 273D Dima and Figure
  18. BioBERT: a pre-trained biomedical language representation model for biomedical text mining
  19. 基础运维神器:开源的裸金属服务器管理平台RackShift
  20. c语言一维数组教学设计,C语言教学中一维数组教学设计.doc

热门文章

  1. ftp服务器搭建(实现只上传禁止下载)
  2. 20220327解决elsevier latex模板作者单位报错
  3. 带你了解IP地址的分类与子网划分
  4. DUMA: Reading Comprehension with Transposition Thinking
  5. 为什么房地产投资者对虚拟土地疯狂?
  6. php解决m3u8卡顿,m3u8直播源为什么移动很流畅,电信很卡
  7. 零基础学习Unity 教你掌握游戏开发!!!
  8. 【第52题】常用的数学工具类9-大乐透号码生成器
  9. 关于程序员工作时如何进入“心流”状态
  10. 如何将多个PDF文件合并成一个大的PDF文件