1.假设句子按单词顺序为w1,w2,...,wn ,那么这个句子的概率公式为?
句子S在语料库中出现的概率P(S)=P(w1,w2,w3...wn)。根据条件概率公式P(w1,w2,w3...wn)=P(w1)*P(w2|w1)*p(w3|w1,w2)...P(wn|w1,w2...w(n-1))。
2.是否句子越长概率就越低?为什么?
3.一个语言模型的困惑度是怎么计算的?是什么意义?
理论方法:迷惑度/困惑度/混乱度(preplexity),其基本思想是给测试集的句子赋予较高概率值的语言模型较好,当语言模型训练完之后,测试集中的句子都是正常的句子,那么训练好的模型就是在测试集上的概率越高越好,公式如下:
由公式可知,迷惑度越小,句子概率越大,语言模型越好

4.神经网络的语言模型相对N-Gram模型有哪些改进的地方?实际的应用情况如何?
5.Word2Vec中skip-gram,cbow两者比较的优缺点是哪些?
6.HMM, CRF两者比较的优缺点是哪些?
7.Blue评价指标是干嘛用的?他考虑了哪些因素?缺点是什么?
8.做一个翻译模型,如果输出的词典很大,例如有100万个词,要怎么解决这个计算量问题?
9.什么是交叉熵?和KL距离有什么关系?
10.sgd, momentum, adagrad, adam这些优化算法之间的关系和区别是怎样的?分别适用于什么场景
11.理论上两层的神经网络可以拟合任意函数,为什么现在大多数是用多层的神经网络?
12.生成模型和判别模型两者差别是啥?分别适用于什么场景?
13.AUC的评估指标是怎么定义的?如果计算的AUC结果<0.5,主要是什么原因导致的?
14.逻辑回归和线性回归的区别是啥?适用场景分别是?
15.编码实现softmax

自然语言处理基础知识HR相关推荐

  1. NLP汉语自然语言处理入门基础知识介绍

    NLP汉语自然语言处理入门基础知识介绍 自然语言处理定义: 自然语言处理是一门计算机科学.人工智能以及语言学的交叉学科.虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部 ...

  2. 《统计自然语言处理》读书笔记 一.基础知识及概念介绍

    最近准备学习自然语言处理相关的知识,主要参考<统计自然语言处理·宗成庆>和<Natural Language Processing with Python>,推荐大家阅读.第一 ...

  3. 计算机wrod初级考试题及答案,计算机基础知识+Word基础知识+Excel基础知识试题答案解析.doc...

    文档介绍: 计算机基础知识+ Word基础知识+ Excel基础知识 第一部分 一.单项选择题 1.世界上第一台电子数字计算机取名为(    ). A.UNIVAC    B.EDSAC    C.E ...

  4. 华南理工计算机基础知识题,华南理工_计算机应用基础_随堂练习答案(2017年)

    华南理工_计算机应用基础_随堂练习答案(2017年) (18页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 19.9 积分 . . . .华南理工-计算 ...

  5. java中文乱码解决之道(二)—–字符编码详解:基础知识 + ASCII + GB**

    原文出处:http://cmsblogs.com/?p=1412 在上篇博文(java中文乱码解决之道(一)-–认识字符集)中,LZ简单介绍了主流的字符编码,对各种编码都是点到为止,以下LZ将详细阐述 ...

  6. python基础一入门必备知识-Python快速入门指南基础知识详细说明

    随着人工智能大火,我们身边几乎处处充满着AL的气息,就连停车,都是机器人值班了. 可是很多人都不知道人工智能是由什么开发的,各种相关联的框架都是以Python作为主要语言开发出来的. Python本身 ...

  7. 福建高职单招计算机基础知识,福建高职单招计算机类试题及标准答案

    计算机类专业基础知识试题 第Ⅰ卷 一.单项选择题(在每小题的四个备选答案中,选出一个正确答案,并将正确的字母标号 填涂在答题卡相应在位置上,每小题3分,共120分) 1.世界上第一台计算机(ENIAC ...

  8. 知识图谱基础知识(一): 概念和构建

    推荐: 知识图谱构建技术一览 知识图谱基础知识之三--知识图谱的构建过程 目录 一.什么是知识图谱 二.知识图谱的分层架构 三.知识图谱构架技术 (一)数据获取(Data Acquisition) ( ...

  9. DL:深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

    DL:深度学习(神经网络)的简介.基础知识(神经元/感知机.训练策略.预测原理).算法分类.经典案例应用之详细攻略 目录 深度学习(神经网络)的简介 1.深度学习浪潮兴起的三大因素 深度学习(神经网络 ...

最新文章

  1. oracle pl/sql 程序设计 历史笔记整理
  2. 【转载】通俗理解极大似然估计
  3. 1026 Modular multiplication of polynomials
  4. rails3系统架构
  5. oracle日期的sql,Oracle中一些和日期有关的SQL查询
  6. 李宏毅机器学习——无监督学习(五)
  7. 帝国cms二次开发留言板自定义字段教程
  8. 【无线安全实践入门】破解WiFi密码的多个方法
  9. 进制转换模板——短除法
  10. WeChatTweak-微信小助手 v1.2.2 详细安装教程
  11. vant中的swipe
  12. n+1天 吾日三省吾身
  13. 公司给你调岗降薪,逼你主动辞职如何应对?
  14. vuex的基本应用(vuex的购物车案例)
  15. Unity修改批量修改名字工具
  16. 批量重命名文件中的照片
  17. [Step By Step]SAP HANA中创建分析视图(Analytic View)
  18. 简单爬虫爬取头像,妈妈再也不用担心我头像不够用了
  19. sketch(三)--插件
  20. 安装Windows server 2003系统后无法安装显卡驱动的解决办法 (转载)

热门文章

  1. JVM02----垃圾收集上(堆)
  2. 使用async读取异步数据
  3. 单链表(c语言实现)贼详细
  4. 【IntelliJ】IntelliJ IDEA的安装破解及使用
  5. 【Codeforces Round #450 (Div. 2) B】Position in Fraction
  6. js中sort()方法的用法,参数以及排序原理
  7. 文字不间断滚动(转)
  8. Mongodb亿级数据量的性能测试zz
  9. 【资源】编程珠玑I 源码
  10. 在.NET 中实现 AOP