工业级自然语言处理spaCy开源库的使用

文章目录

  • 一. spaCy介绍
    • 1.1. 什么是spaCy
    • 1.2. spaCy的优势
    • 1.3. spaCy的处理过程(Processing Pipeline)
    • 1.4. spaCy 安装
  • 二. 词语、短语、名字和概念的检索
    • 2.1. spacy介绍
    • 2.2. 训练好的流程
    • 2.3. 基于规则的匹配
      • 2.3.1. 为何不直接用正则表达式?
      • 2.3.2. 模板匹配
      • 2.3.3. 使用Matcher
      • 2.3.4. 匹配词汇属性
      • 2.3.5. 匹配其它的词符属性
      • 2.3.6. 使用运算符和量词

『NLP学习笔记』工业级自然语言处理spaCy开源库的使用相关推荐

  1. 『NLP学习笔记』TextCNN文本分类原理及Pytorch实现

    TextCNN文本分类原理及Pytorch实现 文章目录 一. TextCNN网络结构 1.1. CNN在文本分类上得应用 1.2. 回顾CNN以及Pytorch解析 1.2.1. CNN特点 1.2 ...

  2. 『NLP学习笔记』长短期记忆网络LSTM介绍

    长短期记忆网络LSTM介绍 文章目录 一. 循环神经网络 二. 长期依赖问题 三. LSTM 网络 四. LSTM 背后的核心理念 4.1 忘记门 4.2 输入门 4.3 输出门 五. LSTM总结( ...

  3. 『NLP学习笔记』Transformer技术详细介绍

    Transformer技术详细介绍! 文章目录 一. 整体结构图 二. 输入部分 2.1. 词向量 2.2. 位置编码 三. 注意力机制 3.1. 注意力机制的本质 3.2. 举例说明 3.3. Tr ...

  4. 『NLP学习笔记』Cross Entropy Loss 的硬截断、软化到 Focal Loss

    Cross Entropy Loss 的硬截断.软化到 Focal Loss 文章目录 一. 二分类模型 二. 修正的交叉少损失(硬截断) 2.1. 引入 2.1. 实现代码 三. 软化Loss 四. ...

  5. 『NLP学习笔记』HugeGraph套件安装与使用指南

    HugeGraph套件安装与使用指南! 文章目录 一. 平台概述 二. HugeGraph-Server环境配置 2.1. 对应版本 2.2. 环境依赖 1. 安装JDK-1.8 2. 安装 GCC- ...

  6. 『NLP学习笔记』Sklearn计算准确率、精确率、召回率及F1 Score

    Sklearn计算准确率.精确率.召回率及F1 Score! 文章目录 一. 混淆矩阵 1.1. 混淆矩阵定义 1.2. 例子演示 二. 准确率 2.1. 准确率定义 2.2. 例子演示 三. 精确率 ...

  7. 『NLP学习笔记』Triton推理服务器加速模型推理

    Triton推理服务器加速模型推理! 文章目录 一. Triton简要介绍 二. Triton Inference Server安装与使用 2.1. 安装Triton Docker镜像 2.2. 创建 ...

  8. 『NLP学习笔记』BERT文本分类实战

    BERT技术详细介绍! 文章目录 一. 数据集介绍 二. 数据读取 三. 训练集和验证集划分 四. 数据分词tokenizer 五. 定义数据读取(继承Dataset类) 六. 定义模型以及优化方法 ...

  9. 『Python学习笔记』Mac系统汇总:终端文件显示不同颜色Pycharm代码模板JAVA环境变量

    Mac系统:终端文件显示不同颜色&Pycharm代码模板&JAVA环境变量! 文章目录 一. 显示不同颜色 二. mac电脑怎么设置触控板拖动 三. mac系统中termius终端中文 ...

最新文章

  1. PYTHON——数据存储:MySQL数据库
  2. 动态创建DeepZoom
  3. 剑指offer(1-10题)详解
  4. Dubbo Admin服务测试功能
  5. 我们在使用计算机时,不能做什么?,11秋季学期计算机应用技术基础学习周期_01任务-在线作业[1]1...
  6. 十二、安装redis3.2
  7. 在CentOS上的Docker私有注册表
  8. Elmedia Player Pro Mac使用技巧,Elmedia键盘快捷键
  9. Keil Assistant 插件 fromelf 文件路径报错及hex、bin、axf、elf文件之间关系
  10. 操作系统调度算法理解
  11. LED背光源照明技术迅速发展
  12. 数值分析原理课程实验——牛顿(Newton)迭代法
  13. 致远OA A8 漏洞综合工具
  14. C++定时切换桌面背景
  15. 老人与海好词100英文带翻译_老人与海优美段落英文,英文的优美句子,带翻译,越多越好,谢谢...
  16. vue 3 + mo.js 实现点赞粒子特效【实战】
  17. 若依@Excel注解自动获取导出字段,字典解析
  18. Java分布式中文分词组件 - word分词(转自:https://github.com/ysc/word)
  19. uber幽灵车_Uber&Careem合并:新兴的出租车服务将在中东和北非地区产生影响?...
  20. Apicloud——关于上传图片、视频

热门文章

  1. DXP在画PCB图时,选中或拖动原件时,原件不能显示出来
  2. u盘读不出来怎么修复?数据还有机会恢复吗?
  3. Excel中的数据筛选和高级筛选
  4. elasticsearch集群搭建
  5. 蒂森mc2服务器老显示fc00,蒂森电梯MC2控制系统电梯的常见故障的处理方法.pdf
  6. 安装GNOME中文桌面环境
  7. keil5字体颜色设置
  8. HDU5420 : Victor and Proposition
  9. 极光开发者周刊【No.0709】
  10. 关于if 与 else if / if