原文链接:https://github.com/fighting41love/hardNLU


NLU is hard!!!

一直关注刘群老师的微博,常常看见他分享的一些好玩的#自然语言理解太难了#。
遂整理了NLU实在是太难了系列语句,大家一笑无妨。这里列举了一些关于分词、实体识别、知识图谱相关的语句,按照难度从低到高排列,最高难度的放在了最后(需要强大的知识图谱哦,欢迎大家把答案开在issue里)。

难度:※※ 两颗星

  1. 来到杨过曾经生活过的地方,小龙女动情地说:“我也想过过过儿过过的生活。”
  2. 来到儿子等校车的地方,邓超对孙俪说:“我也想等等等等等过的那辆车。”
  3. 赵敏说:我也想控忌忌己不想无忌。
  4. 你也想犯范范范玮琪犯过的错吗
  5. 对叙打击是一次性行为?

  1. 《绿林俊杰》–林俊杰做错了什么?为什么要绿他

难度:※※※ 三颗星

  1. 写给卖豆芽的对联: 长长长长长长长,长长长长长长长。(solution: changzhangchangzhangchangchangzhang zhangchangzhangchangzhangzhangchang,zhangchangchangzhangchangzhangchang,zhangchangzhangchangzhangchangchang)
  2. 季姬寂,集鸡,鸡即棘鸡。棘鸡饥叽,季姬及箕稷济鸡。鸡既济,跻姬笈,季姬忌,急咭鸡,鸡急,继圾几,季姬急,即籍箕击鸡,箕疾击几伎,伎即齑,鸡叽集几基,季姬急极屐击鸡,鸡既殛,季姬激,即记《季姬击鸡记》。
  3. 石室诗士施氏,嗜狮,誓食十狮。氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。施氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。《施氏食狮史》
  4. 去商店买东西一算账1001块,小王对老板说:“一块钱算了。” 老板说好的。于是小王放下一块钱就走了,老板死命追了小王五条街又要小王付了1000,小王感慨:#自然语言理解太难了# ​
  5. “碳碳键键能能否否定定律一” ​
  6. 书《无线电法国别研究》


13. 要去见投资人,出门时,发现车钥匙下面压了一张员工的小字条,写着“老板,加油!”,瞬间感觉好有温度,当时心理就泪奔了。心里默默发誓:我一定会努力的! 车开了15分钟后,没油了。。。


14. 他快抱不起儿子了,因为他太胖了
15. 中文里面“大胜”和“大败”意思相同,刚发现英文里面也有类似的现象:valuable和invaluable都是表示非常有价值的意思
16. How can I help you? 我能帮您什么?我怎么可以帮你!米国某酒店前台翻译机

  1. 一家名为“宝鸡有一群怀揣着梦想的少年相信在牛大叔的带领下会创造生命的奇迹网络科技有限公司”走红网络,该公司全名长达39个字,还是一句主谓宾齐全的句子。宝鸡工商部门表示,该公司属合法注册,但名字太长不利于刻公章开发票

  1. “一位友好的哥谭市民” “一位友好/的哥/谭市民”

难度:※※※※ 四颗星

  1. 宝宝的经纪人睡了宝宝的宝宝,宝宝不知道宝宝的宝宝是不是宝宝的亲生的宝宝,宝宝的宝宝为什么要这样对待宝宝!宝宝真的很难过!宝宝现在最担心的是宝宝的宝宝是不是宝宝的宝宝,如果宝宝的宝宝不是宝宝的宝宝那真是吓死宝宝了。

  1. 中不不建交是受印度的影响,中不建交不受印度的影响。

难度:※※※※※ 五颗星

  1. NLP同学接招。这玩意非得配合超强知识图谱才能解决,非单纯NLP技术搞的定


一些搞笑的

  1. 台湾朋友发的[允悲]金门那边应对海漂死猪的防疫文件及吐槽

  1. 高兴地日韩游。接连看到这样两条微博,感叹取名字太难了,#自然语言理解太难了#

  1. 于谦的父亲,是个卖参的人
  2. 叫我起床

  1. 这宣传标语,从左往右读和从右往左读意思截然相反啊

6.从小便相识,大便情更浓


一些easy的作为结尾

  1. 校长说衣服上除了校徽别别别的
  2. 过几天天天天气不好
  3. 看见西门吹雪点上了灯,叶孤城冷笑着说:“我也想吹吹吹雪吹过的灯”,然后就吹灭了灯。
  4. 今天多得谢逊出手相救,在这里我想真心感谢“谢谢谢逊大侠出手”
  5. 灭霸把美队按在地上一边摩擦一边给他洗脑,被打残的钢铁侠说:灭霸爸爸叭叭叭叭儿的在那叭叭啥呢
  6. 姑姑你估估我鼓鼓的口袋里有多少谷和菇!!
  7. “你看到王刚了吗”“王刚刚刚刚走”
  8. 张杰陪俩女儿跳格子:俏俏我们不要跳跳跳跳过的格子啦
  9. 骑车出门差点摔跤,还好我一把把把把住了
  10. 我朋友问父亲:我大大大(大大爷)和我姑姑谁年龄大?朋友爸爸说:你大大大大!
  11. 我背有点驼,麻麻说“你的背得背背背背佳
  12. 南京市长江大桥

NLU(Natural Language Understanding)太难了相关推荐

  1. TINYBERT: DISTILLING BERT FOR NATURAL LANGUAGE UNDERSTANDING

    TINYBERT: DISTILLING BERT FOR NATURAL LANGUAGE UNDERSTANDING 来源:ICLR 2020 在审 链接:https://arxiv.org/pd ...

  2. 自然语言理解(Natural Language Understanding)

    1. 引言 Siri,Cortana,Google Now,小冰,度秘,随着技术的进步和自然人机交互需求的扩大,个人智能助理渐渐成了各大巨头争夺的下一个入口.这些智能助理尽管能力有大有小,但有一个共同 ...

  3. 【模型蒸馏】TinyBERT: Distilling BERT for Natural Language Understanding

    总述 TinyBert主要探究如何使用模型蒸馏来实现BERT模型的压缩. 主要包括两个创新点: 对Transformer的参数进行蒸馏,需要同时注意embedding,attention_weight ...

  4. Self-training Improves Pre-training for Natural Language Understanding,NAACL2021

    本文研究了半监督学习中通过自监督训练利用非标记数据的一种方法.具体来说,引入了SentAugment,这是一种数据增强方法,它从有标签的数据中计算特定于任务的查询嵌入,从从网络上爬取的数十亿个无标签的 ...

  5. Self-training Improves Pre-training for Natural Language Understanding 笔记

    self-training,是用训练好的模型的预测结果 作为 伪target,混入原训练集一起训练, 该文的创新在于提出一种文本相似度算法从海量文本中找出和 训练集中的文本 相似的文本, 然后用训练好 ...

  6. NATURAL LANGUAGE INFERENCE OVER INTERACTION SPACE

    文章目录 ABSTRACT 1 INTRODUCTION 2 RELATED WORK 3 MODEL 3.1 INTERACTIVE INFERENCE NETWORK 3.2 DENSELY IN ...

  7. EMNLP2020 | 近期必读Natural Language Inference精选论文

    **AMiner平台**由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务 ...

  8. Snips Voice Platform: an embedded Spoken Language Understanding system for private-by-design voice i

    摘要 the Snips Voice Platform 语音平台 Spoken Language Understanding 口语语言理解 on microprocessors typical of ...

  9. Deep Learning in Natural Language Processing中文连载(三)

    第二章 对话语言理解中的深度学习 Gokhan Tur, Asli Celikyilmaz, 何晓东,Dilek Hakkani-Tür 以及邓力 摘要  人工智能的最新进展导致对话助手的可用性增加, ...

最新文章

  1. php查找二维数组下标,PHP实现二维数组中的查找算法小结
  2. AI与基因科学的对话:从“人工智能”到“动物智能”
  3. moveTaskToback退后台
  4. JVM源码分析-Java运行
  5. 存储器的分配与回收算法实现_垃圾内存回收算法
  6. 2、JDBC连接数据库
  7. 干货|EOS和它引领的POS新时代
  8. idea创建文件自定义注释
  9. The method setClass(Context, Class?) in the type Intent is not applicable for the arguments (GameV
  10. 一个程序员的创业失败教训
  11. PAT乙级 1013 数素数
  12. 520晚上,我用python破解了前女友的加密文件,结果却发现。。。
  13. android parcelable 对象,Android实现Parcelable对象序列化的实例
  14. python集成包地址 Anaconda 一键安装拥有所有包
  15. espcms简约版的表单,提示页,搜索列表页
  16. Tcp四次挥手谁需要等待,为什么等待时间为2MSL
  17. 零信任兴起:从理念到实践
  18. android夏时令问题
  19. 小酷智慧地图3D导览v1.0.87打卡定位 地图打卡
  20. 《科学之路》读书笔记

热门文章

  1. 量子计算(十四):超导量子芯片
  2. 《VC++深入详解》第三章
  3. 如何远程公司 居家办公日渐常态 企业如何做好远程办公
  4. Windows添加route
  5. 正则表达式练习题(含答案)
  6. 深圳高新技术企业补贴政策及有何好处,补贴30万
  7. 我用过的最好脑图工具——Xmind(含安装包)
  8. kali使用笔记本自带无线网卡_生活日常(教你笔记本电脑如何正确使用WiFi)
  9. 解决HA is not enable for this namenode错误
  10. C语言中“=,^=,|=”分别表示什么意