使用jieba提取文本TF-IDF关键词

首先安装依赖：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ jieba

然后使用如下代码：

import jieba.analysedef tfidf_ana(content):content_s = "".join(content).strip()title_keys = jieba.analyse.extract_tags(content_s, topK=6, withWeight=False)  # topK为期望得到的关键词个数title_keys = ','.join(title_keys)return title_keys# 开始测试
data = tfidf_ana("2019年，复杂的外部环境、全球经济放缓的较大可能性，叠加中国经济前期不利因素的累积效应，经济下行""压力进一步凸显，但是变中危和机同生共存，紧扣重要战略机遇新内涵，做好“六稳”工作，变压力为加快推动""经济高质量发展的动力。一是进一步发展好对外贸易关系，推进新全球化，以经贸关系为主线稳定外部环境。""稳妥应对外部经济环境变化，稳步发展“一带一路”贸易畅通，积极参与全球经济和贸易治理体系变革与发展，""坚持维护WTO的多边机制，维护中国在外贸中的合理权益和地位。二是稳妥处置地方政府债务风险和衍生金融风险。""为地方政府“开前门、堵后门”，辅以金融政策支持，为之构建合理的债务处置出口；合理划分中央和地方各级政府的财权、""事权，使地方政府的事权和财权相匹配，并有资源能够化解已有的债务问题，使之成为中国经济发展的助推器，而非风险源。""三是加快经济的深化改革和扩大开放。我国经济韧性强健，产业门类齐全，人员技能熟练，经济纵深宽广，抗风险能力强大，""加快经济的深化改革和扩大开放，深化国资国企、财税金融、土地、市场准入、社会管理等领域改革，推动体制机制创新，""不仅能进一步激发全社会的发展活力，为实现“六稳”目标打下坚实的基础，还能吸引中国经济对国际社会的吸引力，""形成互惠互利，提升中国应对全球经济衰退风险的能力，提高中国在推进新型全球化进程中的权益。")
# 新闻来源：http://finance.eastmoney.com/a/201903011056589916.html
print(data)

使用jieba提取文本TF-IDF关键词相关推荐

关键词提取算法—TF/IDF算法
关键词提取算法一般可分为有监督学习和无监督学习两类. 有监督的关键词提取方法可以通过分类的方式进行,通过构建一个较为完善的词表,然后判断每个文档与词表中的每个词的匹配程度,以类似打标签的方式,达到关键 ...
python提取文本中的字符串到新的txt_Python实现jieba对文本分词并写入新的文本文件，然后提取出文本中的关键词...
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. Python实现jieba对文本分词并写入新的文本文件,然后提取出文本中的关键词思想先对文本进行 ...
NLP：基于snownlp库对文本实现提取文本关键词和文本摘要
NLP:基于snownlp库对文本实现提取文本关键词和文本摘要目录输出结果 1.测试文本设计思路核心代码输出结果 1.测试文本今天一大早,两位男子在故宫抽烟对镜头炫耀的视频在网络上传播,引 ...
python中文文本分词_SnowNLP：?中文分词?词性标准?提取文本摘要,?提取文本关键词,?转换成拼音?繁体转简体的处理中文文本的Python3 类库...
SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和Te ...
搜索引擎：文本分类——TF/IDF算法
原理 TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类.TFIDF实际上是:TF * IDF,TF ...
NLP：基于nltk和jieba库对文本实现提取文本摘要(两种方法实现：top_n_summary和mean_scored_summary)
NLP:基于nltk和jieba库对文本实现提取文本摘要(两种方法实现:top_n_summary和mean_scored_summary) 目录输出结果设计思路核心代码输出结果 1.测试文本 ...
python使用jieba得到文本关键词TextRank
TextRank基本介绍 TextRank论文: Mihalcea, Rada, and Paul Tarau. "Textrank: Bringing order into text.&q ...
TF-IDF 提取文本关键词
这篇博客主要是为了总结一下学习TF-IDF提取关键词的方法,同时整合一下代码. 目的:使用jieba分词器提取文本中的主题 import jieba #分词器 import jieba.analyse ...
文本特征抽取的向量空间模型（VSM）和TF/IDF方法
文本特征抽取两组小说,一组是爱情的,另一组是科幻的.我们能否用支持向量机训练一个模型,用来识别小说类型呢? 这个并不容易.因为支持向量机这类机器学习算法只能接受数学里面的向量作为输入.如果用它来做文 ...

使用jieba提取文本TF-IDF关键词

使用jieba提取文本TF-IDF关键词相关推荐

最新文章

热门文章