自然语言处理工具HanLP被收录中国大数据产业发展的创新技术新书《数据之翼》
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。
在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领中国大数据产业发展的创新技术》。在本书的第一章节收录介绍了大快搜索自主研发的Hanlp技术。
图:数据之翼-引领中国大数据产业发展的创新技术
Hanlp是由大快搜索高级研究员何晗主导开发的完全开源的项目,具有精度高、速度快、内存省的特点。
2014年,还在攻读日语本科的何晗(大快搜索高级研究员)一定没想到,机缘巧合研发的一款中文分词器,在随后几年中几经迭代,并在商用市场大放异彩。
而看似是“无心插柳柳成荫”的事情,却凝聚着何晗对Hanlp工匠式的锤炼。
Hanlp是由一系列模型与算法组成的工具包,目标是普及自然语言处理(NLP)在生产环境中的应用。Hanlp具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点:能够提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。
自然语言处理工具HanLP被收录中国大数据产业发展的创新技术新书《数据之翼》相关推荐
- 自然语言处理工具HanLP被收录中国大数据产业发展的创新技术新书《数据之翼》...
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评"2018中国大数据基础软件领域领军企业",并成功入选中国数字化转型TOP100服务商. 在本届 ...
- 益丰大药房互联网医院,积极推动中国大健康产业发展变革
互联网的出现,促进了我们生活中很多行业运转模式的改变,不过在初期,医药领域却发展较慢,这主要源于该行业的特殊性以及政策限制.但由于疫情的爆发,却加速了互联网+医+药+支付的发展,根据2021年< ...
- 《2022大数据产业年度创新技术突破》榜重磅发布丨金猿奖
年度金猿榜单/奖项 本届"数据猿年度金猿策划活动--2022大数据产业创新技术突破榜单/奖项"由金猿&数据猿共同推出. 数据智能产业创新服务媒体 --聚焦数智 · 改 ...
- 自然语言处理工具hanlp自定义词汇添加图解
过程分析 1.添加新词需要确定无缓存文件,否则无法使用成功,因为词典会优先加载缓存文件 2.再确认缓存文件不在时,打开本地词典按照格式添加自定义词汇. 3.调用分词函数重新生成缓存文件,这时会报一个找 ...
- 2022-2028年中国大飞机项目产业链分析及投资咨询报告
[报告类型]产业研究 [报告价格]¥4500起 [出版时间]即时更新(交付时间约3个工作日) [发布机构]智研瞻产业研究院 [报告格式]PDF版 本报告介绍了中国大飞机项目行业市场行业相关概述.中国大 ...
- 全球及中国大健康产业投资潜力与运营价值分析报告2022-2028年
全球及中国大健康产业投资潜力与运营价值分析报告2022-2028年 ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ ➜ <修订日期>:2 ...
- 《2022大数据产业年度创新服务企业》榜重磅发布丨金猿奖
年度金猿榜单/奖项 本届"数据猿年度金猿策划活动--2021大数据产业创新服务企业榜单/奖项"由金猿&数据猿&上海大数据联盟共同推出. 数据智能产业创新服务媒 ...
- 全球大数据产业发展现状与应用趋势
核心提示:世界上许多国家都已经认识到了大数据所蕴含的重要战略意义,纷纷开始在国家层面进行战略部署,以迎接大数据技术革命正在带来的新的机遇和挑战. 1 大数据发展概述 当今是一个数据爆发增长的时代.移动 ...
- 《中国人工智能学会通讯》——4.27 电子数据取证理论与技术
4.27 电子数据取证理论与技术 电子数据取证的概念 电子数据取证是指恢复已被破坏的计算机数据及提供相关的电子数据证据.利用计算机软硬件技术,以符合法律规范的方式对计算机入侵.破坏.欺诈.攻击等违法犯 ...
最新文章
- 到底什么时候该使用MQ
- java与众包的联系_众包、众筹和众创是什么 三者区别与联系
- python的jupyter的使用教程-JupyterNotebook设置Python环境的方法步骤
- 网络布线,多图、有细节,【炮哥】讲诉,值得无经验午饭手抄
- python语法错误常见原因_python3中open()的语法错误,不知道原因
- python教程循环语句,Python基础教程之循环语句(for、while和嵌套循环)
- 树的存储结构-孩子链表
- 学java专科_专科学历可以学习java开发吗
- markdown 本地链接_记录笔记、markdown工具推荐
- jQuery/Zepto的Bootstrap轮播图中图片自适应宽高并居中插件
- 简单而常用的shell 命令
- hadoop权威指南笔记
- Windows xp Ms08067漏洞复现
- 批量建模:有序多分类Logistic回归(Ordinal Logistic Regression)
- 用STEP7-MicroWIN SMART能搜索到CPU 也能控制PLC指示灯闪烁,但是下载程序仍提示当前IP地址失败请检查IP地址、网络连接
- 微信公众号及CSDN文章爬取
- RTL8812AU/21AU and RTL8814AU drivers and linux driver
- C语言基础——数据输入输出
- “屌丝”真实逆袭经历,大专毕业到成为公司的Java方向核心技术骨干,我的学习经历值得你借鉴!
- 一名程序员眼里中国量化投资的未来
热门文章
- Android 12 启动画面-SplashScreen
- php给图片添加水印方法汇总(包括文字水印和图片水印)
- 为什么使用join 代替子查询_为什么外墙贴砖要使用专用瓷砖胶代替水泥砂浆?...
- 赛马网基本算法之一 (股神问题)
- 盘古网络php维护面试题,【面经】网易游戏非技术岗面经-雷火盘古伏羲事业群...
- python常用数据类型转换(str、list、tuple、set、dict)方法编码与解码字符串格式化处理时间格式化
- 小提琴图等需要注意的分类排序问题
- 我越努力生活,生活就越努力的干我
- 《认知觉醒:开启自我改变的原动力》--触动的点与思考
- 如何恢复u盘数据?简单的操作方法