腾讯文智java近义词API_常用的分词组件或API,该怎么选型?
做互联网系统 分词是必不可少的。除非咱不需要搜索、标签或者关键字分析等。
在网上看到的一个列表,不错,放出来给大家。
这里简单点评下:(我简单体验了几个,没有全部用,像搜狗之类的,看下名称我就不想用,想来也不是很好用,不要问为什么)
如果是为了快速实现功能,而且我们没有太多的二次开发力量,那么我们应该使用REST API 模式的分词接口。直接调用,人家更新我们也自动跟着更新。不过,一旦人家歇菜,我们也跟着歇菜。所以使用REST API风格的分词要做好后手准备。另外,如果你需要有一些个性化功能,是木有的,这就是 “懒”和”笨“的代价。
REST API接口的大家可以试一下。BosonNLP和新浪云,如果专注中文,那么新浪是比较好的选择。新浪早年的产品,譬如上个世纪90年代,还是很差的。现在的新浪很多产品还是值得学习的。(呀~~~不小心暴露了年龄)
PHP分词
如果你认为PHP是世界上最好的语言,那么选择SCWS是必须的啦。需要安装扩展,自己可以修改词库,配置也方便。适合于PHP大法传人和有一定二次开发能力的人。如果你能修改源码那就更屌了。
Java分词
如果你认为其他语言都是玩具,只有java才是宇宙最强的语言。那么你可以使用IKAnalyzer,结合Lucene能实现相对比较完善的搜索系统。
如果有能力可以看看源码,修改并不是特别复杂。总比看C要简单的多
其他的几个 我就看了看,也没啥兴趣用。
从性价比来说,我只会选在REST API模式的分词。我认为在我有生之年不太可能”他们死了,我还活着”。另外,分词已经不值得我们这些商业程序员去做深入研究。当然如果你是基础技术建设者另当别论。
腾讯文智java近义词API_常用的分词组件或API,该怎么选型?相关推荐
- JAVA ik es_安装elasticsearch及中文IK和近义词配置
安装elasticsearch及中文IK和近义词配置 安装java环境 java环境是elasticsearch安装必须的 yum install java-1.8.0-openjdk 安装elast ...
- 【005】WikiDiff-英文近义词辨析网站
英语学习到一定程度后经常会遇到辨析近义词的难点,对于非英语母语国家的人来说有些单词之间细微的差别很难把握,使用WikiDiff网站可以很好的解决这一难题. 地址:WikiDiff | 登陆后,输入需要 ...
- JAVA程序设计:近义词句子(LeetCode:5110)
给你一个近义词表 synonyms 和一个句子 text , synonyms 表中是一些近义词对 ,你可以将句子 text 中每个单词用它的近义词来替换. 请你找出所有用近义词替换后的句子,按 字典 ...
- 安装elasticsearch及中文IK和近义词配置
安装elasticsearch及中文IK和近义词配置 安装java环境 java环境是elasticsearch安装必须的 yum install java-1.8.0-openjdk 安装elast ...
- 腾讯文智自然语言处理-分词API Python小实验
我本人在做中文地址的分词算法的优化,为了获得尽量好的分词后的小样本,先后试验了中科院计算所的ICTCLAS.Python上的结巴分词.腾讯文智自然语言处理.因为结巴开源而且原理不复杂,代码可读性较强, ...
- 【Elasticsearch】相关性,近义词匹配,纠错匹配
目录 相关性 布尔模型 词频/逆向文档频率(TF/IDF) 词频 逆向文档频率 字段长度归一值 结合使用 向量空间模型 Lucene 的实用评分函数 近义词匹配 近义词查询原理 同义词过滤器 纠错匹配 ...
- 自然语言处理(NLP)之求近义词和类比词<MXNet中GloVe和FastText的模型使用>
这节主要就是熟悉MXNet框架中的两种模型:GloVe和FastText的模型(词嵌入名称),每个模型下面有很多不同的词向量,这些基本都来自wiki维基百科和twitter推特这些子集预训练得到的. ...
- 为什么电子计算机奏出美妙的交响,近义词反义词).doc
<近义词反义词).doc>由会员分享,提供在线免费全文阅读可下载,此文档格式为doc,更多相关<近义词反义词).doc>文档请在天天文库搜索. 1.四 延安我把你追寻1 追寻 ...
- ES elasticsearch-analysis-dynamic-synonym连接数据库动态更新synonym近义词
前言 在很多搜索场景中,我们希望能够搜索出搜索词相关的目标,同时也希望能搜索出其近义词相关的目标.例如在商品搜索中,搜索"瓠瓜",也希望能够搜索出"西葫芦",但 ...
最新文章
- python发邮件实例_python 发邮件实例
- 【Groovy】Groovy 方法调用 ( 使用闭包创建接口对象 | 接口中有一个函数 | 接口中有多个函数 )
- java 贝塞尔_java贝塞尔曲线翻页效果
- python管理系统项目首选公司_Python 项目的部署,目前互联网公司有哪些成熟的方案?...
- upload-labs_pass10_点空点绕过_pass11_双写文件扩展名
- 利用浏览器调试功能 计算 百度网盘 文件数量 V2
- java异常自定义返回信息,Spring Boot 如何自定义返回错误码错误信息
- The Clean Architecture--一篇很不错的关于架构的文章
- GDAL被java调用 Cannot find proj.db
- CentOS 7安装Mysql并设置开机自启动
- 一个OEIS数列的通式
- 为什么要进行TracePro模拟?
- SOPC之占空比控制LED(小梅哥AC620)
- ASCII字符绘图网站推荐及使用Python绘制ASCII字符画
- Python 集和篇
- StudentManagerSystem(学生管理系统)(利用Result类,各种工具类)
- 论文阅读--SAP-SSE: Protecting Search Patterns and Access Patterns in Searchable Symmetric Encryption
- 高校圆桌派话题征集第五期来咯
- 自己动手做Arduino玩具(三)
- GD32报错Feature(s) : RDI, FlashBP, FlashDL, JFlash, GDB
热门文章
- 浅谈工作/学习中找bug的思路_0_调试、try-catch以及打印报错信息和百度的方法、No default constructor for entity: com.gyf.bos.mod
- 【转】100种消灭无聊的方法,很有爱,看到第100个,我笑喷了
- Java基础05-面向对象private\this\static关键字
- c 语言中双向链表逆转编程题,C/C++ 双链表之逆序的实例详解
- 1013基于SSM的汽车销售管理系统
- python123网页版切屏_我能绕过各学习平台的切屏检测
- 百度K站不存在!站长请安心?
- 计算机学院宋威教授,北方工业大学计算机技术(领域)研究生导师介绍:宋威
- 如何计算产生SPWM所需要的占空比
- 优化性能的iOS网络图片浏览工具第三方