首先安装依赖:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ jieba

然后使用如下代码:

import jieba.analysedef tfidf_ana(content):content_s = "".join(content).strip()title_keys = jieba.analyse.extract_tags(content_s, topK=6, withWeight=False)  # topK为期望得到的关键词个数title_keys = ','.join(title_keys)return title_keys# 开始测试
data = tfidf_ana("2019年,复杂的外部环境、全球经济放缓的较大可能性,叠加中国经济前期不利因素的累积效应,经济下行""压力进一步凸显,但是变中危和机同生共存,紧扣重要战略机遇新内涵,做好“六稳”工作,变压力为加快推动""经济高质量发展的动力。一是进一步发展好对外贸易关系,推进新全球化,以经贸关系为主线稳定外部环境。""稳妥应对外部经济环境变化,稳步发展“一带一路”贸易畅通,积极参与全球经济和贸易治理体系变革与发展,""坚持维护WTO的多边机制,维护中国在外贸中的合理权益和地位。二是稳妥处置地方政府债务风险和衍生金融风险。""为地方政府“开前门、堵后门”,辅以金融政策支持,为之构建合理的债务处置出口;合理划分中央和地方各级政府的财权、""事权,使地方政府的事权和财权相匹配,并有资源能够化解已有的债务问题,使之成为中国经济发展的助推器,而非风险源。""三是加快经济的深化改革和扩大开放。我国经济韧性强健,产业门类齐全,人员技能熟练,经济纵深宽广,抗风险能力强大,""加快经济的深化改革和扩大开放,深化国资国企、财税金融、土地、市场准入、社会管理等领域改革,推动体制机制创新,""不仅能进一步激发全社会的发展活力,为实现“六稳”目标打下坚实的基础,还能吸引中国经济对国际社会的吸引力,""形成互惠互利,提升中国应对全球经济衰退风险的能力,提高中国在推进新型全球化进程中的权益。")
# 新闻来源:http://finance.eastmoney.com/a/201903011056589916.html
print(data)

使用jieba提取文本TF-IDF关键词相关推荐

  1. 关键词提取算法—TF/IDF算法

    关键词提取算法一般可分为有监督学习和无监督学习两类. 有监督的关键词提取方法可以通过分类的方式进行,通过构建一个较为完善的词表,然后判断每个文档与词表中的每个词的匹配程度,以类似打标签的方式,达到关键 ...

  2. python提取文本中的字符串到新的txt_Python实现jieba对文本分词并写入新的文本文件,然后提取出文本中的关键词...

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. Python实现jieba对文本分词并写入新的文本文件,然后提取出文本中的关键词思想 先对文本进行 ...

  3. NLP:基于snownlp库对文本实现提取文本关键词和文本摘要

    NLP:基于snownlp库对文本实现提取文本关键词和文本摘要 目录 输出结果 1.测试文本 设计思路 核心代码 输出结果 1.测试文本 今天一大早,两位男子在故宫抽烟对镜头炫耀的视频在网络上传播,引 ...

  4. python中文文本分词_SnowNLP:?中文分词?词性标准?提取文本摘要,?提取文本关键词,?转换成拼音?繁体转简体的 处理中文文本的Python3 类库...

    SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和Te ...

  5. 搜索引擎:文本分类——TF/IDF算法

    原理 TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类.TFIDF实际上是:TF * IDF,TF ...

  6. NLP:基于nltk和jieba库对文本实现提取文本摘要(两种方法实现:top_n_summary和mean_scored_summary)

    NLP:基于nltk和jieba库对文本实现提取文本摘要(两种方法实现:top_n_summary和mean_scored_summary) 目录 输出结果 设计思路 核心代码 输出结果 1.测试文本 ...

  7. python使用jieba得到文本关键词TextRank

    TextRank基本介绍 TextRank论文: Mihalcea, Rada, and Paul Tarau. "Textrank: Bringing order into text.&q ...

  8. TF-IDF 提取文本关键词

    这篇博客主要是为了总结一下学习TF-IDF提取关键词的方法,同时整合一下代码. 目的:使用jieba分词器提取文本中的主题 import jieba #分词器 import jieba.analyse ...

  9. 文本特征抽取的向量空间模型(VSM)和TF/IDF方法

    文本特征抽取 两组小说,一组是爱情的,另一组是科幻的.我们能否用支持向量机训练一个模型,用来识别小说类型呢? 这个并不容易.因为支持向量机这类机器学习算法只能接受数学里面的向量作为输入.如果用它来做文 ...

最新文章

  1. Paper9:Fast RCNN
  2. 1578: [Usaco2009 Feb]Stock Market 股票市场
  3. [MySQL] MySQL的自己主动化安装部署
  4. java 对象数据 搜索,java – 使用反射检索对象的数据类型
  5. 工程代码_特征工程学习,19 项实践 Tips!代码已开源!
  6. STL源码剖析 读书笔记一 2013-5-4
  7. Java并发教程–阻塞队列
  8. uva 1312——Cricket Field
  9. python习题week3
  10. springmvc 处理器方法返回的是string 重定向到处理器方法
  11. .net mvc 一个Action的 HttpGet 和 HttpPost
  12. Java:项目启动报错java: -source 1.5 中不支持 diamond 运算符 (请使用 -source 7 或更高版本以启用 diamond 运算符)
  13. Java基础知识强化之IO流笔记19:FileOutputStream的三个write方法
  14. Word怎么填服务器草稿位置,Word步骤制作目录的索引符号的操作
  15. flv转mp4(ffmpeg)
  16. VMware12安装win7图文教程
  17. windows中Appium-desktop配合安卓模拟器的完美使用
  18. 计算机考研11408总分418上岸攻略
  19. Mysql基础到进阶精品视频教程附讲义文档 91课
  20. HBase的Nonce实现分析

热门文章

  1. python中print(chr(65))_Python语句print(chr(97))的运行结果是( )。_学小易找答案
  2. fx5u mc协议_SLMP协议和MC协议
  3. 关于并发数与在线数的概念
  4. liunx 下的动态地址分配服务DHCP
  5. 计算机完成了加法操作执行的是,cpu是通过运算器中的什么来完成加法运算的
  6. encoder decoder模型_3分钟|聊一聊 Decoder 模块
  7. 用python海龟画图_天呐!python 的乌龟绘图怎么用啊!?
  8. orcal 工具能连接上 程序连接不上_电脑无线网络连接不上怎么办
  9. zip 打包_Thinkphp6利用ZipArchive打包下载文件
  10. 程序员说的demo是什么意思_“黄龄说的什么意思”???