Paoding's Knives (庖丁解牛分词)基于Java的开源中文分词器组件,提供lucene和sore接口,具有 高效率和高扩展性。引入隐喻,采用完全的面向对象涉及,构思先进。

高效率:在Plll 1G内存个人机器上,1秒可准确分词100万汉字。

采用基于 不限制个数的词典文件对文章进行有效的切分,使能够对词汇分类定义。

能够对未知的词汇进行合理解析,仅支持java语言。

使用paoding的步骤,需要paoding-dic-home.properties中添加

paoding.dic.home=classpath:dic
paoding.dic.home.config-fisrt=this

测试:

结果:



Poading Analysis相关推荐

  1. TensorRT Analysis Report分析报告

    TensorRT Analysis Report 一.介绍 TensorRT是一个高性能的深度学习推理(Inference)优化器,可以为深度学习应用提供低延迟.高吞吐率的部署推理.TensorRT可 ...

  2. PCA(Principal Component Analysis)的原理、算法步骤和实现。

    PCA的原理介绍:  PCA(Principal Component Analysis)是一种常用的数据分析方法.PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分 ...

  3. 机器学习与高维信息检索 - Note 7 - 核主成分分析(Kernel Principal Component Analysis,K-PCA)

    Note 7 - 核主成分分析(Kernel Principal Component Analysis) 核主成分分析 Note 7 - 核主成分分析(Kernel Principal Compone ...

  4. 机器学习与高维信息检索 - Note 4 - 主成分分析及其现代解释(Principal Component Analysis, PCA)及相关实例

    主成分分析及其现代解释 4. 主成分分析及其现代解释 Principal Component Analysis and Its Modern Interpretations 4.1 几何学解释 The ...

  5. 【免费软件测试视频-0013】——Loadrunner9.0 SLA Analysis

    LR9.0---SLA Analysis http://www.3atesting.com/mv/bencandy.php?fid=15&id=16 转载于:https://www.cnblo ...

  6. OpenCV3.3中主成分分析(Principal Components Analysis, PCA)接口简介及使用

    OpenCV3.3中给出了主成分分析(Principal Components Analysis, PCA)的实现,即cv::PCA类,类的声明在include/opencv2/core.hpp文件中 ...

  7. 笔试算法题(58):二分查找树性能分析(Binary Search Tree Performance Analysis)

    议题:二分查找树性能分析(Binary Search Tree Performance Analysis) 分析: 二叉搜索树(Binary Search Tree,BST)是一颗典型的二叉树,同时任 ...

  8. Classifying dynamic textures via spatiotemporal fractal analysis(许教授)

    提出了:dynamic fractal spectrum (动态分形谱) 来处理动态纹理序列 预备知识: 分形(fractal analysis):局部形态和整体态的相似.分形理论所揭示的" ...

  9. 高斯判别分析 Gaussian Discriminant Analysis

    如果在我们的分类问题中,输入特征xx是连续型随机变量,高斯判别模型(Gaussian Discriminant Analysis,GDA)就可以派上用场了. 以二分类问题为例进行说明,模型建立如下: ...

最新文章

  1. julia const报错_我爱Julia之入门-004
  2. WinForm 之Control.Invoke 和Control.BeginInvoke 方法的使用 Control 不能在创建它的 Thread 之外被调用。但可以通过 invoke 来保证 C
  3. composer安装及使用
  4. azkaban config: nodes:_关于Nordic SDK的sdk.config.h
  5. 内存泄露检测工具比较
  6. Android App图片轮播效果的组件化
  7. Linux 系统增加Swap分区扩容运行内存
  8. 3W | 跟着小小学会这些 Java 工程师面试题,月薪至少 3 W
  9. echarts中datazoom相关配置
  10. mfc 学习的第二天
  11. gom引擎物品和武器的外观Shape值拓展算法
  12. AtCoder Grand Contest 003 D - Anticube
  13. 数字时钟——FPGA
  14. 126邮件POP3,SMTP服务器与端口设置
  15. 更换系统的jdk版本
  16. CAD绘图时怎么查看所绘制图形两点间的距离?
  17. camera杂项---两种shutter
  18. SEO知识(总结土著游民)(1)
  19. 前端经典面试题 | 闭包的作用和原理
  20. 王者荣耀最失败的英雄是?失败英雄应该有哪些特征?

热门文章

  1. NUMERIC和DECIMAL区别
  2. 什么是JAVAweb?
  3. dd腾讯云阿里云并安装相应代理加速github
  4. OpenCV学习(13) 细化算法(1)
  5. 用unity制作2d钟表
  6. centos安装NIS
  7. Python||报错:TypeError: can only join an iterable
  8. PHP面向对象基础七
  9. Basler相机调用及图像存储
  10. 论文中的参考文献规范