目录

文章目录

  • 目录
  • 前言
  • 问答系统基础一
  • 问答系统基础二
    • 问答系统术语
  • 问答系统基础三
  • 问答系统基础四
  • 问答系统基础五

前言

硕士生涯结束,开始专心做一件自己觉得有用的工具,先做工程,后搞理论。
自然语言处理是一个非常难的问题,同时是人工智能皇冠上的明珠。
接下来会记录一系列自然语言处理的笔记,来自于哈工大老师关毅。

问答系统基础一

IBM这个人,蓝色巨人,硅谷海盗。
Watson 对话系统,doing。
老师自我吐槽,扯淡时间多于工作的时间。
问答系统基本概念。
问答的简史:问答的所有问题?
1机器翻译2语音识别3数据库
自然语言控制机器人动作,积木世界。
LUNAR系统。
扩充知识转移网络进行句法分析。
LIFER系统
CHAT-80系统
START系统
MURAX系统
AskFeeres系统
人肉高科技,人工恢复问题
十万篇相关文档分析,相关问题答案未实现。

问答系统基础二

在各个步骤,建立统计分类模型。
问答式信息检索。

会议检索,评测技术平台,check。
1问句处理?
2海量答案对应?
3事实性陈述即可解决

问答系统术语

问题类型 question type
答案类型 answer type
问句焦点 question focus
问句主题 question topic
候选段落 candidate passage
候选答案 candidate answer
答案所属类别,最型问题,观点问题,因果类问题,事实类问题
问句对应的目标类型。

问答系统基础三

2008年,认识到自己目前做的和想做的距离有多大。
焦点:实体的属性。
主题:讨论的实体。

候选段落:由搜索引擎响应用户问句而检索得到的文本片段。
候选答案:可能的答案
{1找到候选段落2与问句匹配并检查段落的语义3抽取答案}
{1相似段落2语义匹配法3语法匹配法}
智能化信息检索结构图
语法,语义,专业知识库
元搜索,满足确切的未知的点。

问答系统基础四

网页重复太多(一些搜索引擎死了,百度活下来了)
工程问题细节超多,这才是你的生命线。

数据库索引技术,PAT树,B+树,哈希树,My SQL
智能化信息,检索模型。
{布尔,向量空间,概率模型}
基于结构映射理论的新型信息,检索模型,系统相似模型。
向量空间模型的本源理论模型,通用性理论模型。
自然语言处理技术:各个技术的综合。
完善自己的理论,做应用课题。
原创理论时代。复杂性,精度是冲突的。
问答式基础理论。

问答系统基础五

项目研究进展报告提纲:
1开放域问答系统概要设计
2工作进展与展望
3主要阶段性成果
4总结
用户层:用户交互,语言分析识别,个性化信息。
最终肯定要个性化发展。
机器学习,ranking结果
NLP+NLG。
三层体系,四层系统。
语义层,用户层,强化学习技术。

自然语言处理笔记8-哈工大 关毅相关推荐

  1. 自然语言处理笔记4-哈工大 关毅

    目录 文章目录 目录 前言 汉语语料库的多级加工(1) 汉语语料库的多级加工(2) 汉语语料库的多级加工(3) 汉语语料库的多级加工(4) 汉语语料库的多级加工(5) 汉语语料库的多级加工(6) 汉语 ...

  2. 自然语言处理笔记2-哈工大 关毅

    目录 文章目录 目录 前言 自然语言处理概论(七) 自然语言处理概论(八) 数学基础和语言学基础(1) 数学基础和语言学基础(2) 数学基础和语言学基础(3) 数学基础和语言学基础(4) 数学基础和语 ...

  3. 自然语言处理笔记10-哈工大 关毅

    目录 文章目录 目录 前言 基于认知科学原理的相似模型(五) 基于认知科学原理的相似模型(六) 面向旅游领域的问答系统实验 前言 硕士生涯结束,开始专心做一件自己觉得有用的工具,先做工程,后搞理论. ...

  4. 自然语言处理笔记6-哈工大 关毅

    目录 文章目录 目录 前言 Markov模型1 Markov模型2 Markov 模型3 Markov模型4 Markov模型(5) 前言 硕士生涯结束,开始专心做一件自己觉得有用的工具,先做工程,后 ...

  5. 自然语言处理笔记9-哈工大 关毅

    目录 文章目录 目录 前言 课堂总结(一) 课堂总结(二) 课堂总结(三) 课堂总结(四) 前言 硕士生涯结束,开始专心做一件自己觉得有用的工具,先做工程,后搞理论. 自然语言处理是一个非常难的问题, ...

  6. 自然语言处理笔记7-哈工大 关毅

    目录 文章目录 目录 前言 句法分析技术1 句法分析技术2 句法分析技术3 句法分析技术4 前言 硕士生涯结束,开始专心做一件自己觉得有用的工具,先做工程,后搞理论. 自然语言处理是一个非常难的问题, ...

  7. 自然语言处理笔记5-哈工大 关毅

    目录 文章目录 目录 前言 n-gram语言模型(一) n-gram语言模型(二) n-gram语言模型(三) n-gram语言模型(四) n-gram语言模型(五) n-gram语言模型(六) n- ...

  8. 自然语言处理笔记3-哈工大 关毅

    目录 文章目录 目录 前言 汉语的分词与频度统计(1) 汉语词汇的特点 汉语的分词与频度统计(2) 汉语的分词与频度统计(3) 汉语的分词与频度统计(4) 汉语的分词与频度统计(5) 汉语的分词与频度 ...

  9. 自然语言处理笔记11-哈工大 关毅

    目录 文章目录 目录 前言 一篇论文的诞生(1) 一篇论文的诞生(2) 一片论文的诞生(3) 前言 硕士生涯结束,开始专心做一件自己觉得有用的工具,先做工程,后搞理论. 自然语言处理是一个非常难的问题 ...

最新文章

  1. 摆放家具-家具类以及创建家具对象
  2. atm系统的用例模型_战斗系统执行式测试经验汇总
  3. ssl1760-商店选址问题【图论,最短路】
  4. 单元素枚举类实现单例模式
  5. 在Docker里面安装Ubuntu,并且使用ssh进行连接
  6. 中国电子学会scratch等级考试二级
  7. django-cookie与session的应用场景
  8. iis由5.1变成5.0——怎么回事呢
  9. Android SDK怎么救砖,Android手机刷机变砖后无法开机的修复方法
  10. python爬虫实战——爬取猫眼电影TOP100并导入excel表
  11. java中md5加密和解密_java的MD5加密与解密
  12. SOIC 和 SOP区别
  13. 基于SSL/TLS双向安全连接设备CA证书认证
  14. 将ttc改为otf_Font Renamer字体更名、重命名工具_支持ttf、ttc、otf、pfb字体 V3.0 下载...
  15. Ubuntu18.04风扇狂转的解决办法
  16. 机场生产运行数据统计指标-第二篇-航班类
  17. 论文阅读—图像分割方法综述(三)(arXiv:[cs:cv]20200410)
  18. flutter 文字下划线 行距
  19. 雅思等出国留学成绩要求一知半解?戳这里
  20. BUUCTF 每日打卡 2021-4-14

热门文章

  1. iOS 图表工具charts之LineChartView
  2. 密码泛在化实践者之路
  3. TYPE-C手机如何同时充电不影响传输USB2.0数据功能
  4. 火影抽卡模拟器1.0.2
  5. sql查询字符串截取方法
  6. exsi删除虚拟机提示在当前状况下不允许执行此操作解决方法、vmware删除虚拟机提示在当前状况下不允许执行此操作解决方法
  7. 金税盘 USB无法识别的解决方法、金税盘插上电脑没反应、航天信息
  8. SAP HUM 事务代码HUMO为整托做Scrap
  9. 计算机b级excel函数,大学计算机一级excel函数归类 2
  10. 《梁祝》-化蝶(五线谱)