import pandas as pd

import jieba

import jieba.analyse

filename = "E:\\数据处理\\隐患类型.txt"

#载入数据

df_data = pd.read_csv(filename, header=0, encoding=‘gbk‘, dtype=str)#DataFrame

#去重并转换为list

ls_data = df_data.drop_duplicates().values.tolist()#df_data.values为array类型

ls_data = ";".join([str(j) for i in ls_data for j in i])#将列表元素转换为一个字符串,供lcut函数使用

print(ls_data)

seg_list = jieba.lcut(ls_data, cut_all=False, HMM=True) # 精确切割模式(默认为精确模式)

seg = ‘/‘.join(seg_list)#str类型

#关键词抽取

tags = jieba.analyse.extract_tags(seg, topK=300, withWeight=True, allowPOS=(‘ns‘, ‘n‘, ‘vn‘, ‘v‘),)

import pyecharts.options as opts

from pyecharts.charts import WordCloud

def wordcloud():

g = WordCloud()

g.add(series_name="热点分析", data_pair=tags, word_size_range=[6, 66])

g.set_global_opts(

title_opts=opts.TitleOpts(

title="高频词条", title_textstyle_opts=opts.TextStyleOpts(font_size=23)

),

tooltip_opts=opts.TooltipOpts(is_show=True),

)

#.render("basic_wordcloud.html")

return g

# 使用snapshot-selenium渲染成图片

from snapshot_selenium import snapshot

from pyecharts.render import make_snapshot

make_snapshot(snapshot, wordcloud().render(), "E:\\数据处理\\词云图2.png")# 保存为图片

原文:https://www.cnblogs.com/zxfei/p/13091810.html

python如何分析高频词_python数据分析高频词提取,pyecharts词云制作并保存相关推荐

  1. python案例分析大学生薪资_Python数据分析实战:解密数据分析师的薪资和需求

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:CPDA数据说 喜欢的朋友欢迎关注小编,除了分享技术文章之外还有很多 ...

  2. python 股票分析常用库_Python数据分析常用库有哪些?Python学习!

    Python为什么受欢迎?因为Python简单.易懂.好用,是一门高级的编程语言;除此之外,Python提供了大量的第三方库,开箱即用,方便.免费,非常适合从事数据分析领域的工作. 大家也都知道,Py ...

  3. python案例分析大学生薪资_Python数据分析的案例。。

    本文来源于数据<Python数据分析>动物书 .. 分享一下电子版本的下载地址: git@github.com:hashmapybx/learn_python.git  这里可以下载到对应 ...

  4. python便捷数据怎么获取_Python数据分析入门——从数据获取到可视化

    基本信息 作者: 沈祥壮 ISBN:9787121336539 上架时间:2018-3-22 出版日期:2018 年3月 开本:16开 页码:260 版次:1-1 [插图] 编辑推荐 了解基本的Pyt ...

  5. python中ndarray对象实例化_Python数据分析之Numpy学习 2——NumPy 基础 ndarray对象

    Python数据分析之Numpy学习 2 -- NumPy 基础学习 NumPy(Numerical Python)是高性能科学计算和数据分析的基础包.NumPy的主要对象是同构数据多维容器(homo ...

  6. python pandas 分类汇总用法_python数据分析之pandas常用命令整理

    原标题:python数据分析之pandas常用命令整理 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型 ,提供了高效地 ...

  7. python分析微博粉丝_python数据分析微博热门

    接上篇,这一篇将从技术层面讲讲是如何实现的.阅读本文您将会了解如何用python爬取微博的评论以及如何用python word_cloud库进行数据可视化. 准备工作 为什么要用m站地址?因为m站可以 ...

  8. python分析数据走势_Python数据分析及可视化实例之个股走势预测(26)

    1.项目背景: 仅仅用来练手,个股走势如果真预测准确了,都就改行当操盘手了,哈哈! 但话又说回来,如果把数据曲线特征提取出来,再进行对比异常判断,也是可以的. 数据源,请关注微信公众号:海豹战队,回复 ...

  9. python分析数据走势_python数据分析应用 - 近5年八类资产价格走势分析

    最近发现PYTHON与TABLEAU的组合简直就是我们数据分析爱好者的绝佳工具组合.最近对大类资产配置这个问题产生了较大的兴趣,笔者就使用python作为数据获取.数据处理的工具,同时采用tablea ...

最新文章

  1. Ubuntu 20.04系统中安装vncserver的方法步骤
  2. Chrome浏览器不支持字体小于12px的解决办法
  3. android连接mysql查询表内记录_Android Room数据库多表查询的使用实例
  4. 工业用微型计算机(21)-指令系统(17)
  5. MMKV集成与原理,赶紧学起来
  6. Knative 实战:基于阿里云 Kafka 实现消息推送
  7. 开发悬赏任务兼职系统运营版源码,仿蚂蚁帮扶众人帮平台
  8. .htaccess使用说明
  9. 武汉新增职位数同比下降44.25%,这些企业却在猛招人,“来多少,要多少”
  10. 自考的那些事儿(二):第二次自考完了???
  11. WebService的应用之winform身份验证
  12. 苹果Mac全新的文件启动方式:Hapigo
  13. 提高Android应用辅助功能的方法Accessibility
  14. Ansible Ad-Hoc与常用模块
  15. 记录:创建Django项目,在vscode中运行django项目
  16. C#版OPOS打印(基于北洋OPOS SDK二次开发包,支持EPSON和北洋、佳博、商祺等支持标准ESC/POS指令的POS打印机)...
  17. “贴吧之父”俞军20年的方法论:顶级与平庸的差距有多大?
  18. 红米k30支持html,红米K30S至尊纪念版发布:骁龙865+支持144Hz高刷
  19. vscode和IDEA分别如何克隆git上的项目
  20. 小型气象站参数有哪些

热门文章

  1. 记-linux中使用docker安装mysql
  2. 缔造微软帝国的程序员保罗·艾伦因病离世
  3. 《Android群英传》读书笔记---10.2(终篇)
  4. 第三部分 和弦铃声格式
  5. 面试感悟----一名3年工作经验的程序员应该具备的技能(转载自@五月的仓颉)...
  6. B. Lorry (贪心)
  7. Xcode10打包引起iOS9系统的用户启动App随机崩溃的问题修复记录
  8. 谈谈深度学习中的 Batch_Size Batch_Size(批尺寸)是机器学习中一个重要参数,涉及诸多矛盾,下面逐一展开。 首先,为什么需要有 Batch_Size 这个参数? Batch 的选
  9. 七骑士android版上线时间,七骑士新版本登场 开启征服樱之国度旅程
  10. 一文读懂WiFi网络摄像机参数设置的含义