python 使用jieba.analyse提取句子级的关键字
安装所需要的库
jieba(pip install jieba)
方法参数解释
jieba.analyse.extract_tags(sentence, topK=5, withWeight=True, allowPOS=())
参数说明 :
sentence 需要提取的字符串,必须是str类型,不能是list
topK 提取前多少个关键字
withWeight 是否返回每个关键词的权重
allowPOS是允许的提取的词性,默认为allowPOS=‘ns’, ‘n’, ‘vn’, ‘v’,提取地名、名词、动名词、动词
原理
jieba.analyse.extract_tags()提取关键字的原理是使用TF-IDF算法
python 实现使用jieba.analyse提取句子级的关键字
# -*- coding: utf-8 -*-
# @Time : 2019/5/11 11:18
# @Author : 未来战士biubiu!!
# @FileName: __init__.py.py# python提取句子中的关键字
import jieba.analyse
import random,osos.chdir('D:\DOCUMENT/U1\Python3_Demo\TL_NER\DATA')f_tar = open('fenci_data_target.txt', 'r', encoding='utf-8')data_tar = f_tar.readlines()#随机从txt文件中提取50行
ran_tar = random.sample(data_tar, 50)for src in ran_tar:src_temp = src.strip()print('src_temp',src_temp)print(jieba.analyse.extract_tags(sentence=src_temp,topK=10,allowPOS=('ns','n')))
运行结果
感觉效果还是不错的,我只提取了名词和地点。
文件是我一个旅游项目的数据,从中随机抽取了50行作为备选文字。
python 使用jieba.analyse提取句子级的关键字相关推荐
- [Python]利用jieba.analyse进行 关键词 提取
1.简单应用 代码如下: 1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 # @File : jieba.analyse.py 4 # @Aut ...
- python 英文关键词提取_python 利用jieba.analyse进行 关键词提取
1.简单应用 代码如下: #!/usr/bin/env python # -*- coding: utf-8 -*- # @File : jieba.analyse.py # @Author: 赵路仓 ...
- 【论文泛读130】SEOVER:基于句子级情感取向向量的会话情感识别模型
贴一下汇总贴:论文阅读记录 论文链接:<SEOVER: Sentence-level Emotion Orientation Vector based Conversation Emotion ...
- jieba.analyse的使用:提取关键字
① jieba.analyse.extract_tags 提取关键字: 第一个参数:待提取关键词的文本 第二个参数:返回关键词的数量,重要性从高到低排序 第三个参数:是否同时返回每个关键词的权重 第四 ...
- python用jieba模块分词实现关键词提取
人工智能大数据与深度学习 公众号: weic2c 每个txt文件夹里面存放一个用户的全部微博数据,在result_all文件里面存放了全部用户的微博数据,这里实现读取每个用户的数据 ...
- 机器学习入门-提取文章的主题词 1.jieba.analyse.extract_tags(提取主题词)
1.jieba.analyse.extract_tags(text) text必须是一连串的字符串才可以 第一步:进行语料库的读取 第二步:进行分词操作 第三步:载入停用词,同时对分词后的语料库进行 ...
- jieba.analyse的使用:提取关键字/词频制作词云
jieba.analyse的使用:提取关键字/词频制作词云 ① jieba.analyse.extract_tags 提取关键字: print("***案例1***"*3) txt ...
- 利用jieba.analyse进行 关键词 提取
利用jieba.analyse进行 关键词 提取 import jieba.analysetext='2020年5月11日至17日,全市共接报电信诈骗警情80宗.' Key=jieba.analyse ...
- python nlp 句子提取_关于nlp:使用NLTK python进行因果句提取
我正在从水事故报告中提取因果关系句子.我在这里使用NLTK作为工具.我通过采用20个因果关系句子结构手动创建了regExp语法[请参见下面的示例].构造的语法是以下类型的 grammar = r''' ...
最新文章
- 在cxf中使用配置避免增加字段导致客户端必须更新、同步实体属性的问题
- kiss原则包括什么_求职干货想让HR瞬间对你产生好感?简历做好这三个原则
- 4-20模块 序列化模块 hashlib模块
- 如何判断一个创业公司是否有上市前景?
- JDK演化系列(1.0~~~1.9)
- lpc2000 filash utility 程序烧写工具_单片机烧录程序的次数
- 人在低谷是最应该看的六句话!(深度好文)
- 高甜预警|甜齁你的情人节促销海报设计模板
- Note 7会让三星有什么样的命运呢?
- 190531每日一句
- 宝塔面板反向代理怎么设置
- python_根据出生年份算年龄
- 关于react-router-dom 6.0.1的基础写法 解决Error: A <Route> is only ever to be used as the child of <Routes>
- 微信公众号(服务号)接入开发之微信授权登陆
- 全国多省市推广盘扣脚手架,模架大咖怎么看?
- 基于微信小程序的社区垃圾回收管理系统小程序
- android paint跑马灯,Android使用Canvas实现跑马灯
- linux 指定某个节点,11g RAC单独关闭某个节点的疑问
- c语言编写f16仿真程序,想学习一下 用C语言开发PIC的F16和F18系列单片机, 结果让IDE开发环境给搞悲剧,巨难用,...
- 21款免费的HTML5响应式模板(附下载