做互联网系统 分词是必不可少的。除非咱不需要搜索、标签或者关键字分析等。

在网上看到的一个列表,不错,放出来给大家。

这里简单点评下:(我简单体验了几个,没有全部用,像搜狗之类的,看下名称我就不想用,想来也不是很好用,不要问为什么)

如果是为了快速实现功能,而且我们没有太多的二次开发力量,那么我们应该使用REST API 模式的分词接口。直接调用,人家更新我们也自动跟着更新。不过,一旦人家歇菜,我们也跟着歇菜。所以使用REST API风格的分词要做好后手准备。另外,如果你需要有一些个性化功能,是木有的,这就是 “懒”和”笨“的代价。

REST API接口的大家可以试一下。BosonNLP和新浪云,如果专注中文,那么新浪是比较好的选择。新浪早年的产品,譬如上个世纪90年代,还是很差的。现在的新浪很多产品还是值得学习的。(呀~~~不小心暴露了年龄)

PHP分词

如果你认为PHP是世界上最好的语言,那么选择SCWS是必须的啦。需要安装扩展,自己可以修改词库,配置也方便。适合于PHP大法传人和有一定二次开发能力的人。如果你能修改源码那就更屌了。

Java分词

如果你认为其他语言都是玩具,只有java才是宇宙最强的语言。那么你可以使用IKAnalyzer,结合Lucene能实现相对比较完善的搜索系统。

如果有能力可以看看源码,修改并不是特别复杂。总比看C要简单的多

其他的几个 我就看了看,也没啥兴趣用。

从性价比来说,我只会选在REST API模式的分词。我认为在我有生之年不太可能”他们死了,我还活着”。另外,分词已经不值得我们这些商业程序员去做深入研究。当然如果你是基础技术建设者另当别论。

腾讯文智java近义词API_常用的分词组件或API,该怎么选型?相关推荐

  1. JAVA ik es_安装elasticsearch及中文IK和近义词配置

    安装elasticsearch及中文IK和近义词配置 安装java环境 java环境是elasticsearch安装必须的 yum install java-1.8.0-openjdk 安装elast ...

  2. 【005】WikiDiff-英文近义词辨析网站

    英语学习到一定程度后经常会遇到辨析近义词的难点,对于非英语母语国家的人来说有些单词之间细微的差别很难把握,使用WikiDiff网站可以很好的解决这一难题. 地址:WikiDiff | 登陆后,输入需要 ...

  3. JAVA程序设计:近义词句子(LeetCode:5110)

    给你一个近义词表 synonyms 和一个句子 text , synonyms 表中是一些近义词对 ,你可以将句子 text 中每个单词用它的近义词来替换. 请你找出所有用近义词替换后的句子,按 字典 ...

  4. 安装elasticsearch及中文IK和近义词配置

    安装elasticsearch及中文IK和近义词配置 安装java环境 java环境是elasticsearch安装必须的 yum install java-1.8.0-openjdk 安装elast ...

  5. 腾讯文智自然语言处理-分词API Python小实验

    我本人在做中文地址的分词算法的优化,为了获得尽量好的分词后的小样本,先后试验了中科院计算所的ICTCLAS.Python上的结巴分词.腾讯文智自然语言处理.因为结巴开源而且原理不复杂,代码可读性较强, ...

  6. 【Elasticsearch】相关性,近义词匹配,纠错匹配

    目录 相关性 布尔模型 词频/逆向文档频率(TF/IDF) 词频 逆向文档频率 字段长度归一值 结合使用 向量空间模型 Lucene 的实用评分函数 近义词匹配 近义词查询原理 同义词过滤器 纠错匹配 ...

  7. 自然语言处理(NLP)之求近义词和类比词<MXNet中GloVe和FastText的模型使用>

    这节主要就是熟悉MXNet框架中的两种模型:GloVe和FastText的模型(词嵌入名称),每个模型下面有很多不同的词向量,这些基本都来自wiki维基百科和twitter推特这些子集预训练得到的. ...

  8. 为什么电子计算机奏出美妙的交响,近义词反义词).doc

    <近义词反义词).doc>由会员分享,提供在线免费全文阅读可下载,此文档格式为doc,更多相关<近义词反义词).doc>文档请在天天文库搜索. 1.四 延安我把你追寻1 追寻 ...

  9. ​ES elasticsearch-analysis-dynamic-synonym​连接数据库动态更新synonym近义词

    前言 在很多搜索场景中,我们希望能够搜索出搜索词相关的目标,同时也希望能搜索出其近义词相关的目标.例如在商品搜索中,搜索"瓠瓜",也希望能够搜索出"西葫芦",但 ...

最新文章

  1. python发邮件实例_python 发邮件实例
  2. 【Groovy】Groovy 方法调用 ( 使用闭包创建接口对象 | 接口中有一个函数 | 接口中有多个函数 )
  3. java 贝塞尔_java贝塞尔曲线翻页效果
  4. python管理系统项目首选公司_Python 项目的部署,目前互联网公司有哪些成熟的方案?...
  5. upload-labs_pass10_点空点绕过_pass11_双写文件扩展名
  6. 利用浏览器调试功能 计算 百度网盘 文件数量 V2
  7. java异常自定义返回信息,Spring Boot 如何自定义返回错误码错误信息
  8. The Clean Architecture--一篇很不错的关于架构的文章
  9. GDAL被java调用 Cannot find proj.db
  10. CentOS 7安装Mysql并设置开机自启动
  11. 一个OEIS数列的通式
  12. 为什么要进行TracePro模拟?
  13. SOPC之占空比控制LED(小梅哥AC620)
  14. ASCII字符绘图网站推荐及使用Python绘制ASCII字符画
  15. Python 集和篇
  16. StudentManagerSystem(学生管理系统)(利用Result类,各种工具类)
  17. 论文阅读--SAP-SSE: Protecting Search Patterns and Access Patterns in Searchable Symmetric Encryption
  18. 高校圆桌派话题征集第五期来咯
  19. 自己动手做Arduino玩具(三)
  20. GD32报错Feature(s) : RDI, FlashBP, FlashDL, JFlash, GDB

热门文章

  1. 浅谈工作/学习中找bug的思路_0_调试、try-catch以及打印报错信息和百度的方法、No default constructor for entity: com.gyf.bos.mod
  2. 【转】100种消灭无聊的方法,很有爱,看到第100个,我笑喷了
  3. Java基础05-面向对象private\this\static关键字
  4. c 语言中双向链表逆转编程题,C/C++ 双链表之逆序的实例详解
  5. 1013基于SSM的汽车销售管理系统
  6. python123网页版切屏_我能绕过各学习平台的切屏检测
  7. 百度K站不存在!站长请安心?
  8. 计算机学院宋威教授,北方工业大学计算机技术(领域)研究生导师介绍:宋威
  9. 如何计算产生SPWM所需要的占空比
  10. 优化性能的iOS网络图片浏览工具第三方