下面将爬取中国男女比例数据,生成柱状图,折线图,词云生成,放入HTML文件中

首先导入需要用到的库

import pandas as pd
import requests
import urllib3
from pyecharts.charts import Bar, Line, WordCloud, Page
from pyecharts import options as opts

爬虫

rllib3.disable_warnings()# 屏蔽https证书警告
url = "http://www.stats.gov.cn/ztjc/zdtjgz/zgrkpc/dqcrkpc/ggl/202105/t20210519_1817697.html"
response = requests.get(url, verify=False)#对url网址进行请求,verify当访问https页面出现证书错误,可以使用verify来取消验证
response.encoding = response.apparent_encoding#获取响应对象的编码格式
html = response.text#得到文本数据
data = pd.read_html(html, header=0)[0]#获取html中table标签的表格
data.to_excel('爬虫数据.xlsx')#将爬取的代码放入excel表格中

数据分析

data.columns = ['地区', '男', '女', '性别比']#把每一列的列表名改为'地区','男','女','性别比'
data.drop(data.index[0:2], inplace=True)#删除第一和第二行数据
city = list(data["地区"])#把名为“地区”的列拿出来命名为city
child = list(data["性别比"])#把名为“性别比”的列拿出来命名为child
people = [list(z) for z in zip(city, child)]#把city和child的数据打包放在people中
data.to_excel('数据分析.xlsx')#将分析后的数据放入excel文件中

柱状图

bar = (Bar()#引入bar这个类.add_xaxis(city)#x轴数据定义为city.add_yaxis("男女比例", child)#y轴数据定义为child.set_global_opts(title_opts=opts.TitleOpts(title="中国男女比例分布"))#生成柱状图的标题
)

柱状图效果图片

折线图

line = (Line()#引入Line类.add_xaxis(city)#定义x轴的值.add_yaxis('男女比例', child, is_smooth=True)#定义y轴的值.set_global_opts(title_opts=opts.TitleOpts(title="中国男女比例折线图"))  # 生成折线图的标题
)

折线图效果图

词云图

wordcloud = (WordCloud()#引入WordCloud类.add("", people, word_size_range=[20, 60])#定义词云的数据.set_global_opts(title_opts=opts.TitleOpts(title="中国男女比例词云图"))#生成词云的标题
)

词云图效果图

把词云图,柱状图,词云图放入HTML文件中

page = Page(layout=Page.SimplePageLayout)#定义html中SimplePageLayout布局
page.add(bar,line,wordcloud,
)

生成HTML文件

page.render('中国男女比例分布.html')#生成一个名为中国男女比例分布的html文件

完整代码

import pandas as pd
import requests
import urllib3
from pyecharts.charts import Bar, Line, WordCloud, Page
from pyecharts import options as opts#爬虫
urllib3.disable_warnings()# 屏蔽https证书警告
url = "http://www.stats.gov.cn/ztjc/zdtjgz/zgrkpc/dqcrkpc/ggl/202105/t20210519_1817697.html"
response = requests.get(url, verify=False)#对url网址进行请求,verify当访问https页面出现证书错误,可以使用verify来取消验证
response.encoding = response.apparent_encoding#获取响应对象的编码格式
html = response.text#得到文本数据
data = pd.read_html(html, header=0)[0]#获取html中table标签的表格
data.to_excel('爬虫数据.xlsx')# 数据清洗
data.columns = ['地区', '男', '女', '性别比']#把每一列的列表名改为'地区','男','女','性别比'
data.drop(data.index[0:2], inplace=True)#删除第一和第二行数据
city = list(data["地区"])#把名为“地区”的列拿出来命名为city
child = list(data["性别比"])#把名为“性别比”的列拿出来命名为child
people = [list(z) for z in zip(city, child)]#把city和child的数据打包放在people中
data.to_excel('数据分析.xlsx')#柱状图
bar = (Bar()#引入bar这个类.add_xaxis(city)#x轴数据定义为city.add_yaxis("男女比例", child)#y轴数据定义为child.set_global_opts(title_opts=opts.TitleOpts(title="中国男女比例分布"))#生成柱状图的标题
)#折线图
line = (Line()#引入Line类.add_xaxis(city)#定义x轴的值.add_yaxis('男女比例', child, is_smooth=True)#定义y轴的值.set_global_opts(title_opts=opts.TitleOpts(title="中国男女比例折线图"))  # 生成折线图的标题
)#词云图
wordcloud = (WordCloud()#引入WordCloud类.add("", people, word_size_range=[20, 60])#定义词云的数据.set_global_opts(title_opts=opts.TitleOpts(title="中国男女比例词云图"))#生成词云的标题
)page = Page(layout=Page.SimplePageLayout)#定义html中SimplePageLayout布局
page.add(bar,line,wordcloud,
)#把柱状图,折线图,词云图放在一个html中page.render('中国男女比例分布.html')#生成一个名为中国男女比例分布的html文件

python可视化——生成HTML文件相关推荐

  1. python图标的演变_把Python脚本生成exe文件并添加版本信息和自定义图标

    pyinstaller和py2exe把Python脚本生成exe文件,并添加版本信息和自定义图标. 写了一个查找产品通道号的小程序,目前还没进行异常处理. 以下是程序源码. # -*- coding: ...

  2. python制作相册_《自拍教程73》Python 自动生成相册文件夹

    这里将告诉您<自拍教程73>Python 自动生成相册文件夹,具体操作过程:案例故事: 接Python mediainfo批量重命名图片文件,测试图片是批量重命名好了, 但是将测试图片放于 ...

  3. python做相册_《自拍教程73》Python 自动生成相册文件夹

    案例故事: 接Python mediainfo批量重命名图片文件,测试图片是批量重命名好了, 但是将测试图片放于一个文件夹相册,图库App并不能显示图片信息, 为了测试的方便性, 需要把图片放到对应的 ...

  4. Python installer生成exe文件常用命令

    Python编写好一个程序后,最终总是需要生成EXE文件拿到别的电脑上去使用. 为了实现这个目的,需要安装pyinstaller模块.如果是在原始的Python环境中,那么在CMD窗口使用:" ...

  5. python如何生成excel文件_[原创] 如何用python3自动随机生成Excel文件内容

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 首先来看效果图 文件命名 文件内容 代码说明如下 import xlrd import xlwt from my_framework.log import ...

  6. python如何生成excel文件夹_用python脚本通过excel生成文件夹树结构

    大概这样写标题是对的吧... 目标: 通过excel目录结构文档生成文件夹树结构. 也就是: 通过下面的excel 生成下面的文档树结构: 方法: 1.分析:一般文档结构都是事先构思好.可以在txt文 ...

  7. python docx table 生成_从Python docx生成docx文件,pythondocx

    python-docx是python编程语言的一个库,可以对docx文档进行读,同时也可以进行生成docx文档,这篇文档主要是讲生成docx文档. 1.生成一个空docx文档 # coding:utf ...

  8. python 爬虫生成csv文件和图_csv文件操作和爬虫抓取豆瓣影评并生成词云图

    import requests from bs4 import BeautifulSoup import csv # 自定义一个抓取每页影评的方法 def getCommentByPage(url): ...

  9. 开发利器_Pigar.快速为Python项目生成依赖文件requirements.txt?

    项目名称: pigar 项目地址: https://github.com/damnever/pigar 使用说明: usage: pigar [-h] [-v] [-u] [-s NAME [NAME ...

最新文章

  1. 2022-2028年中国抗菌玻璃行业市场研究及前瞻分析报告
  2. 数字图像处理- 3.6 锐化空间滤波器
  3. 【NOIP2013模拟】小喵喵的新家
  4. 和某ZYC巨佬的随机挑战1总结
  5. 2016蓝桥杯省赛---java---B---7(剪邮票)
  6. 【Java】封装带有泛型的序列化文件工具类
  7. Android热更新开源项目Tinker集成实践总结
  8. javascript中的undefined 和 not defined
  9. “弃用 iOS 后,我的那些 Android 替代方案!”
  10. 关于SAP性能优化的讨论
  11. 扫码枪扫码直接提交ajax,js监听页面扫码枪
  12. reset按钮失效,不能清空输入框
  13. [原创]我的网名卖烧烤的鱼缘由^_^
  14. mysql 创建 utf-8 数据库_mysql 创建数据库 utf-8
  15. 310实验室一点补充
  16. CRM客户关系管理能给企业带来什么样的效果
  17. 【FreeRTOS(一)】FreeRTOS新手入门——初识FreeRTOS
  18. Java学习(二)---SE阶段回顾
  19. 13.1-自己开发一个“单片机烧写工具”!不是开玩笑吧?原来如此^~^(OTA升级)
  20. 如何选择适合你的兴趣爱好(二十六),剪纸

热门文章

  1. 关于Visio画图与GSview转换为eps格式图片问题
  2. .net生鲜超市销售系统
  3. 「管理数学基础」1.7 矩阵理论:方阵特征值估计、圆盘定理、谱与谱半径
  4. win10配置 异地连接 遇到809错误提示
  5. Oracle中expdp与impdp--导入和导出操作步骤
  6. ant-desgin vue 弹窗拖拽功能实现
  7. 图片怎么做成透明背景?如何把图片改成透明底?
  8. 图像匹配中的特征点检测之斑点检测(一)
  9. 程序员你会修电脑吗?
  10. 2021抖音五一数据报告