[Python]利用jieba.analyse进行 关键词 提取
1、简单应用
代码如下:
1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 # @File : jieba.analyse.py 4 # @Author: 赵路仓 5 # @Date : 2020/3/14 6 # @Desc : 提取关键字 7 # @Contact : 398333404@qq.com 8 9 import jieba.analyse 10 11 12 text='安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开' 13 Key=jieba.analyse.extract_tags(text,topK=3) 14 print(Key)
2、含参使用
keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
- 第一个参数:待提取关键词的文本
- 第二个参数:返回关键词的数量,重要性从高到低排序
- 第三个参数:是否同时返回每个关键词的权重
- 第四个参数:词性过滤,为空表示不过滤,若提供则仅返回符合词性要求的关键词
代码如下:
1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 # @File : jieba.analyse.py 4 # @Author: 赵路仓 5 # @Date : 2020/3/14 6 # @Desc : 提取关键字 7 # @Contact : 398333404@qq.com 8 9 import jieba.analyse 10 11 12 # 字符串前面加u表示使用unicode编码 13 content = u'安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开' 14 15 keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 16 # 访问提取结果 17 for item in keywords: 18 # 分别为关键词和相应的权重 19 print(item[0], item[1])
[Python]利用jieba.analyse进行 关键词 提取相关推荐
- python 英文关键词提取_python 利用jieba.analyse进行 关键词提取
1.简单应用 代码如下: #!/usr/bin/env python # -*- coding: utf-8 -*- # @File : jieba.analyse.py # @Author: 赵路仓 ...
- 利用jieba.analyse进行 关键词 提取
利用jieba.analyse进行 关键词 提取 import jieba.analysetext='2020年5月11日至17日,全市共接报电信诈骗警情80宗.' Key=jieba.analyse ...
- Python——利用AC自动机进行关键词提取
Python--利用AC自动机进行关键词提取 目标:在之前写的文章[Python实现多模匹配--AC自动机]基础上,安装gcc(C编译器),再装ahocorasick ,并完成从文本中提取关键词的任务 ...
- python利用jieba(textRank、TFIDF)提取关键字
from jieba import analyse print("tfidf: ") tfidf = analyse.extract_tags text = "线程是程序 ...
- python 利用jieba读取txt文本进行分词后存入新txt
python 利用jieba读取txt文本进行分词后存入新txt import jieba txt = open("news.txt",encoding='UTF-8').read ...
- Python开发练习-对比三种jieba分词的关键词提取结果
jieba分词是一个很不错的中文分词库,其中关键词提取常用,不同的提取方式结果略有不同,关键词提取优化还是可以做一下的. import os import pathlib import jieba i ...
- python 使用jieba.analyse提取句子级的关键字
安装所需要的库 jieba(pip install jieba) 方法参数解释 jieba.analyse.extract_tags(sentence, topK=5, withWeight=True ...
- python分词训练_python练习17:用jieba分词做关键词提取,用matplotlib做可视化
jieba分词 是一款开源的中文分词包,同时它还带有分析模块,可以用TF-IDF等算法进行关键词分析 jieba 下面的小程序的基本思路是: 通过jieba从 保存好的txt文本中提取关键词,根据关键 ...
- python利用jieba实现中文分词
jieba是一款强大的python第三方中文分词库.目前jieba已经支持四种分词模式: 精确模式:试图将句子最精确地切开,不存在冗余数据,适合文本分析. 全模式:把句子中所有的可以成词的词语都扫描出 ...
最新文章
- SCLS:中科院遗传发育在拟南芥二半萜类化合物调控根系微生物组取得突破进展
- php-fpm定义成集群资源时报错解决方法
- Fennec Alpha 1 for Windows Mobile available
- 数据结构火车订票系统C语言课程设计,求助一个数据结构C语言课程设计源代码订票系统^:^!...
- ev3编码软件linux,利用官方固件搭建EV3自制系统
- 生产环境遇到难题,你是如何解决的?
- 线性分类模型python_python SVM 线性分类模型的实现
- Vue异步组件Demo 1
- success.php
- Android项目报错:Could not resolve com.android.support.constraint:constraint-layout:2.0.2.
- 计算机怎么格式化硬盘,电脑格式化硬盘 电脑格式化硬盘要怎么操作
- Jcrop实现图片裁剪
- 高通wlan驱动之tgt_mgmt_txrx_rx_frame_handler函数
- FWT快速沃尔什变换及其应用
- 设置标题栏背景色,背景色是自定义背景色
- 常用的网络营销推广渠道方式
- [生命科学] 生物基础实验之三引物检测突变体
- 1月书讯:Hello 2021! (下)
- 施一公:我对科研的体验
- 手机扫码报修系统有哪些功能?