开源最前线(ID:OpenSourceTop) 猿妹 整编

整理自:https://github.com/pwxcoo/chinese-xinhua

清华大学在 GitHub 开源了一项神器叫万词王(Want Wrong),不是你们想的那个万磁王,号称是首个支持中文及跨语言查询的开源在线反向词典。

给大家普及一下,什么叫反向词典?

普通的词典告诉你某个词语的定义,而反向词典恰好相反,可以告诉你哪些词语符合你输入描述的意思。上图为万词王在线反向词典的页面截图,其中演示了反向查词的一个示例,输入 “山非常高”,系统将返回一系列模型认为表达 “山非常高” 意思的词语,例如 “高峻”、“巍峨” 等。

01 反向词典可以用来做什么?

  • 解决“舌尖现象”(tip-of-the-tongue,又称话到嘴边说不出来),即暂时性忘词的问题

  • 帮助语言学习者学习、巩固词汇

  • 改善选词性失语者患者的生活质量,该病的症状是可以识别并描述一个物体,但是无法记起该物体的名字

简单来说,就是现在的年轻人都会有词穷的时候,当你词穷的时候,这个工具就可以派上用场了,比如你心慌意乱拿不定主意的时候,不知道用哪个词,你就可以将它输进去,就会得到犹豫不决、不意乱心慌等100个词语。而且词性和韵脚也是可以自定义选择。

除此之外,它还支持汉语、英语、汉英、英汉等多种不同转化方式。

整体的系统架构也很简单:

万词王的核心模型是之前清华大学计算机系自然语言处理实验室(THUNLP)发表在AAAI-20上的一篇论文提出的多通道反向词典模型:Multi-channel Reverse Dictionary Model [论文] [代码],其模型架构如下所示:

02 关于清华大学自然语言处理与社会人文计算实验室

清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)成立于20世纪70年代末,最初在黄昌宁教授的带领下从事中文信息处理方面的研究工作,是国内开展自然语言处理研究最早、深具影响力的科研单位,同时也是中国中文信息学会(全国一级学会)计算语言学专业委员会的挂靠单位。实验室学术带头人为孙茂松教授,实验室教师队伍还包括刘洋教授和刘知远副教授。

实验室面向以中文为核心的自然语言处理前沿基础课题开展系统深入的研究工作,研究领域涵盖计算语言学的核心问题以及社会计算和人文计算,近年来在973、863、国家自然科学基金等项目的支持下,实验室师生在IJCAI、AAAI、ACL、EMNLP等国际顶级会议和期刊上发表多篇高水平学术论文,与CMU、NUS、Google等国际名校和企业有长期良好的合作关系,培养的优秀毕业生大多到清华大学、谷歌、百度、阿里、微软等著名高校和企业工作。

WantWords由THUNLP开发和维护,项目指导教师为孙茂松教授和刘知远副教授,开发团队成员包括岂凡超,张磊,杨延辉。

目前,Wantwords已经在GitHub上标星 4.8K,累计分支 452 个。

GitHub地址:

https://github.com/thunlp/WantWords

资料分享

其实B站已经要非常多资料,但是还是有些小伙伴找不到,资料多了也眼花缭乱,小编找了一批某机构4个月付费培训教程:视频、代码、课件、软件,统统都有,很适合新手学习 。

如何获取?

1. 识别并关注下方公众号,建议复制关键字;
2. 在下面公众号后台回复关键字「666」。

												

清华大学开源了一项神器,在 GitHub 爆了!相关推荐

  1. 清华大学开源了一项神器,已经在GitHub爆了

    近日,清华大学在GitHub开源了一款名为万词王(WantWords)的神器,号称是首个支持中文和跨语言查询的开源在线反向词典. 什么是反向词典?普通词典告诉你一个词的定义,而反向词典恰恰相反,它可以 ...

  2. 清华大学开源一款神器,好用到爆

    看着风景美如画,本想吟诗说点啥. 奈何自己没文化,一句卧槽行天下! 好不容易出门旅个游,拍点照片发个朋友圈,本来想配个应景好词佳句,但奈何肚里没有墨水,绞尽脑汁也想不出来,随便弄个"卧槽,好 ...

  3. 谷歌更强 NLP 模型 XLNet 开源:20 项任务全面碾压 BERT!

    谷歌更强 NLP 模型 XLNet 开源:20 项任务全面碾压 BERT! 11 月份,谷歌研究团队在 GitHub 上发布了万众期待的 BERT,它不仅在 11 项 NLP 测试中刷新了最高成绩,甚 ...

  4. 开源需自立!Android、GitHub、Apache全线告急!

    作者 | 胡巍巍&伍杏玲 责编 | 唐小引 出品 | CSDN(ID:CSDNnews) 华为四面楚歌,"破窗效应"爆发! 继5月16日美国商务部工业与安全局(BIS)将华 ...

  5. python wheel库(安装包查找)(适用于Python扩展程序包的非官方Windows二进制文件、Pypi官方库、清华大学开源软件镜像源)

    适用于Python扩展程序包的非官方Windows二进制文件 Unofficial Windows Binaries for Python Extension Packages Pypi官方库 官方库 ...

  6. Ubuntu Linux 操作系统-清华大学开源软件镜像站下载

    Ubuntu 是一个由全球化的专业开发团队建造的操作系统.它包含了所有您需要的应用程序:浏览器.Office 套件.多媒体程序.即时消息等.Ubuntu 是一个 Windows 和 Office 的开 ...

  7. Linux、Qt等安装镜像下载--清华大学开源软件镜像站

    很好用的镜像下载网站,分享给大家 清华大学开源软件镜像站 https://mirrors.tuna.tsinghua.edu.cn/

  8. Python学习八:pip 最常用命令、pip升级、pip 清华大学开源软件镜像站、Python日期和时间(Time模块、日历(Calendar)模块)

    pip 是 Python 包管理工具,该工具提供了对Python 包的查找.下载.安装.卸载的功能. 注意:Python 2.7.9 + 或 Python 3.4+ 以上版本都自带 pip 工具. p ...

  9. conda 使用清华大学开源软件镜像

    conda 使用清华大学开源软件镜像 Anaconda的安装步骤不在本文的讨论中,我们主要是学习一下如何配置conda的镜像,以及一些问题的解决过程 配置镜像 在conda安装好之后,默认的镜像是官方 ...

最新文章

  1. MySQL 的 Binlog 日志处理工具(Canal/Maxwell/Databus/DTS)对比
  2. 跨时钟域处理——脉冲同步器
  3. STM32接口FSMC/FMC难点详解
  4. linux的线程要makefile,Linux内核线程之父pid=2的kthreadd线程
  5. 获取生产订单的系统状态
  6. String、StringBuffer比较
  7. adsl拨号无公网地址如何用ddns_【好玩的网络-第5期】分享自编ddns程序,17行代码轻松实现免费ddns,服务器或nas玩家的福音...
  8. oracle数据提交不上去,oracle数据库命令窗口执行了语句但是没有提交会有什么影响吗...
  9. android 摇一摇动画效果,android 微信摇一摇动画效果
  10. excel匹配_「最全」Excel中查找匹配函数
  11. 转摘:工厂方法模式(Factory Method Pattern)
  12. 奇异值分解SVD与在降维中的应用
  13. Oracle Primavera P6EPPM Mobile/App 安卓移动端分享(长期更新)
  14. 自学android刷机包,Android刷机包解包打包
  15. linux lzma 函数 调用,Lzma(7-zip)和zlib
  16. mysql查询所有男生中姓王的_MySQL的查询练习
  17. Camera构图之三分法
  18. 手工玫瑰花_立体折纸玫瑰花的手工玫瑰花折纸大全教程
  19. BI 前端实践 6:自定义模板展示多维分析结果
  20. Stanford University CS144 调试方法

热门文章

  1. Widgets基础篇(上)
  2. 苹果手机充电越充越少是怎么回事_手机充电时充电器发热怎么回事
  3. 配置OpenGL时遇到的一些问题
  4. uni-app高德地图配置
  5. 深入华为研发最核心地带:产品规划,聆听华为最大产品经理:任总,对产品规划理解:产品规划如何客户需求导向?如何对待变态需求?如何把握市场节凑?
  6. Geoserver中跨域问题解决
  7. 服务器操作系统镜像,镜像服务器操作系统
  8. Arcgis 只有边界线的情况下如何截取目标区域(掩膜裁剪)
  9. GMIC秒拍移动视频峰会|行业大咖齐聚,畅谈短视频平台力量
  10. Galileo新版SD卡系统无法启动问题研究 [精华]