Name Entity Recognition(命名实体识别) - 知乎

特征除了人工的方式还可以用深度学习的方式提取

可尝试的特征:

1.Bag of word features

--当前词:Colin

--前后词:prefessor,proposed

--bigram: Prefessor Colin,Colin proposed

2.词性相关的

--当前词:名词

--前后词:名词,动词

3.前缀 or 后缀

当前词:Co,in

前后词:pr,ed,or

4.单词特点

--词长

--是否包含大写?

--统计多少个大写?

--是否包含"-"

--是否包含数字

5.stemming(可以先用统计的算法得到) + 单词特征

6.句法特征

--语法(句法分析 ,Parsing)

通过cky(动态规划)算法获取语法树

--依赖关系(Dependency Parsing)

CRF++ 特征工程相关推荐

  1. 竞赛专题(四)特征工程-竞赛中的必杀技

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 为了帮助更多竞赛选手入门进阶比赛,通过数据竞赛提升理论实践能力和团队协作能力.Data ...

  2. NLP学习笔记6--Lecture/语言模型/预处理/独热编码/word2vec/文本特征工程

    语言模型用来判断:是否一句话从语法上通顺 先分词  然后算出联合概率 怎么算? chain rule 条件很长的时候 会遇到一个问题 sparsity 数据的稀疏性 用马尔科夫假设  最简单的假设 之 ...

  3. 算法工程师面试——机器学习,特征工程基础

    文章目录 特征工程 为什么要归一化 类别型特征编码 如何处理高维组合特征 常见距离度量方式有哪些? 文本表示模型有什么? 图像数据不足时的处理方法 缺失值如何处理? 模型评估 有哪些常见的评价指标 准 ...

  4. 手把手教你用Python实现自动特征工程

    任何参与过机器学习比赛的人,都能深深体会特征工程在构建机器学习模型中的重要性,它决定了你在比赛排行榜中的位置. 特征工程具有强大的潜力,但是手动操作是个缓慢且艰巨的过程.Prateek Joshi,是 ...

  5. Auto ML自动特征工程

    Auto ML自动特征工程 特征工程是在做机器学习训练的过程中必不可少的环节,特征工程就是找出对模型结果有益的特征交叉关系,通常特征工程需要耗费算法工程师大量的精力去尝试.针对这样的场景,PAI推出智 ...

  6. 【机器学习入门】(10) 特征工程:特征抽取,字典特征抽取、文本特征抽取,附完整python代码

    各位同学好,今天和大家介绍一下python机器学习中的特征工程.在将数据放入模型之前,需要对数据的一些特征进行特征抽取,方法有: (1) 字典特征抽取 DictVectorizer(),(2) 文本特 ...

  7. 特征工程:特征生成,特征选择(三)

    转自:https://blog.csdn.net/cymy001/article/details/79169862 特征生成 特征工程中引入的新特征,需要验证它确实能提高预测得准确度,而不是加入一个无 ...

  8. 【直播】王茂霖:二手车交易价格预测-千变万化特征工程(河北高校数据挖掘邀请赛)

    二手车交易价格预测-千变万化特征工程 目前 河北高校数据挖掘邀请赛 正在如火如荼的进行中.为了大家更好的参赛,王茂霖分享了 从0梳理1场数据挖掘赛事!,完整梳理了从环境准备.数据读取.数据分析.特征工 ...

  9. 手动特征工程已经OUT了!自动特征工程才是改进机器学习的方式

    作者 | William Koehrsen 译者 | linstancy 编辑 | Jane 出品 | AI科技大本营 [导读]近年来,我们在自动模型选择和超参数调优方面取得了进展,但机器学习流程中最 ...

最新文章

  1. vim中tab键8空格换4空格
  2. 【数据结构】HashMap 面试题8问
  3. 2022年,我该用JAX吗?GitHub 1.6万星,这个年轻的工具并不完美
  4. java ee期末项目相关
  5. boost::geometry::detail::overlay::get_turn_info用法的测试程序
  6. python程序 爱意_[Python]快学学怎么Python爬一段情书送女朋友吧
  7. JavaFX UI控件教程(十二)之List View
  8. ZeroMQ接口函数之 :zmq_msg_get - 获取消息的性质
  9. servlet请求的执行过程_Springmvc执行流程
  10. pandas 学习 ——Series
  11. python官方帮助文档中文版-python中文版
  12. 数学建模评价类方法01——灵敏度分析
  13. php curl 417,PHP Curl 417 Expectation Failed解决办法
  14. python程序怎么给别人运行_如何把自己写的python程序给别人用
  15. 微信小程序图片懒加载插件
  16. DWC PCIE学习笔记(一)-----PCIE PHY接口
  17. curl ip.sb查询公网ip
  18. Informatica保障江苏电信规范化ETL开发
  19. 标致雪铁龙诊断软件diagbox 安装说明视频下载链接
  20. 一个完整小巧的Redux全家桶项目

热门文章

  1. android编程获取网络和wifi状态及调用网络设置界面,Android编程获取网络连接状态(3G/Wifi)及调用网络配置界面 - Android平台开发技术 - 博客园...
  2. mysql5.7.14 配置文件_mysql 5.7.14 安装配置方法图文教程(转)
  3. 数据中心基础设施建设方案
  4. php xml 增删改查,PHP实现对xml进行简单的增删改查(CRUD)操作示例
  5. 成功解决将python的列表格式输出数值(如pandas.read_excel().describe()),批量转到表格内daiding
  6. Python的IDE之PyCharm:PyCharm的使用技巧图文教程(修改Pycharm默认风格颜色、编辑器内代码注释区域的颜色、编辑器内的Python Interpreter等)之详细攻略
  7. Database:Database数据库的简介、类型及其区别(关系数据库VS非关系型数据库)、案例应用之详细攻略
  8. CV:传统视觉知识—机器视觉系统的基础知识(机器视觉三要素+典型的工业机器视觉系统五大组件)
  9. Py之yacs:yacs的简介、安装、使用方法之详细攻略
  10. DL之GANDCGNNcGAN:GANDCGNNcGAN算法思路、关键步骤的相关配图和论文集合