20200221_2_国家非文化遗产爬虫代码
这个爬虫很简单,可以当一个入手的项目练练
from lxml import etree
import json
import requests
import pandas as pd
title=[]
type1=[]
unit=[]
content=[]
protect_unit=[]
rx_time=[]
for i in range(315):print('爬取第{}页'.format(i))recommed_url='http://www.ihchina.cn/Article/Index/getProject.html?province=&rx_time=&type=&cate=&keywords=&category_id=16&limit=10&p={0}'.format(i)res=requests.get(url=recommed_url).content.decode('utf-8','ignore')diss_dict=json.loads(res)for i in diss_dict['list']:title.append(i['title'])#名称type1.append(i['type'])#类型unit.append(i['unit'])#申报地区或单位protect_unit.append(i['protect_unit'])#保护单位content.append(i['content'])#内容rx_time.append(i['rx_time'])#时间
data={'名称':title,'类型':type1,'申报地区或单位':unit,'保护单位':protect_unit,'内容':content,'时间':rx_time
}
df=pd.DataFrame(data)
df.head()
名称 | 类型 | 申报地区或单位 | 保护单位 | 内容 | 时间 | |
---|---|---|---|---|---|---|
0 | 苗族古歌 | 民间文学 | 贵州省台江县 | 台江县非物质文化遗产保护中心 | 申报地区或单位:贵州省台江县 <br />\r\n <br />... | 2006</br>(第一批) |
1 | 苗族古歌 | 民间文学 | 贵州省黄平县 | 黄平县非物质文化遗产保护中心 | 申报地区或单位:贵州省黄平县 <br />\r\n <br />... | 2006</br>(第一批) |
2 | 苗族古歌 | 民间文学 | 湖南省花垣县 | 花垣县非物质文化遗产保护中心 | 申报地区或单位:湖南省花垣县 <br />\r\n <br />... | 2011</br>(第三批) |
3 | 布洛陀 | 民间文学 | 广西壮族自治区田阳县 | 田阳县文化馆 | 申报地区或单位:广西壮族自治区田阳县 <br />\r\n <br /... | 2006</br>(第一批) |
4 | 遮帕麻和遮咪麻 | 民间文学 | 云南省梁河县 | 梁河县文化馆 | 申报地区或单位:云南省梁河县 <br />\r\n <br />... | 2006</br>(第一批) |
df.to_excel('国家非文化遗产1.xlsx',encoding='utf-8')
20200221_2_国家非文化遗产爬虫代码相关推荐
- NTT DATA创建东盟地区历史文化遗产的数字档案并向公众开放
东京--(美国商业资讯)--NTT DATA Corporation已为东盟文化遗产数字档案(ACHDA)项目创建数字档案系统,该项目由东盟秘书处开展,旨在对东盟国家宝贵的历史文化遗产进行数字化.项目 ...
- 【python+requests】爬取“国家级非物质文化遗产代表性项目名录”
目录 非遗介绍 找数据 代码实现: josn网址: 前期准备: 包装基础函数: 主函数: 完整代码(白嫖代码抄作业): 运行结果: 非遗介绍 国家级非物质文化遗产名录是经国务院批准,由文化和旅游部(简 ...
- 013 | 民间戏剧类非物质文化遗产的保护与传承 | 大学生创新训练项目申请书 | 极致技术工厂
(一)研究目的 探讨民间戏剧类非物质文化遗产的保护与传承问题,让民间戏剧进校园,推动民间戏剧的传承人与受众群体年轻化:适当通过政治手段,推动牛娘剧走进大众视野,让民间非遗真正"活" ...
- 如何实现沉浸式旅游与非物质文化遗产的共同发展
中国非物质文化遗产资源丰富,是世界上非物质文化遗产数量最多的国家.丰富多样的资源为非物质文化遗产旅游业的建设提供了良好的基础.非物质文化遗产旅游是基于非物质文化遗产资源开发的文化旅游消费形式.文化资源 ...
- 中国书法列入非物质文化遗产
2009年12月27日01:49 京华时报 本报讯(记者侯艳)前天,中国书法列入<人类非物质文化遗产代表作名录>新闻通报会在京举行.中国书法家协会和中国艺术研究院中国书法院等有关机构将继续 ...
- 2022年湖北省第六批国家级非物质文化遗产代表性传承人推荐申报范围、名额和申报标准、材料
深入贯彻党的十九大和十九届历次全会精神,坚持以人民为中心,坚守中华文化立场.传承中华文化基因,铸牢中华民族共同体意识,贯彻"保护为主.抢救第一.合理利用.传承发展"的工作方针,深入 ...
- 深圳非遗保护添新力量,深圳市河南非物质文化遗产联合会应时而生
9月25日,在深圳市罗湖区莲塘非遗园里,深圳市河南非物质文化遗产联合会第一次筹备会顺利召开. 深圳市河南非物质文化遗产联合会(筹)是由河南省开封市非物质文化遗产保护协会,开封市非物质文化遗产保护协会, ...
- 非物质文化遗产“打柳子”亮相崇礼腊八节
图为崇礼"忆腊八送福粥打柳子"腊八节庆活动现场表演. 张志艳 摄 中新网石家庄1月13日电 (张帆 靳磊)"打柳子"是河北省张家口市崇礼区唯一一个入选张家口市非 ...
- 让珍贵的非物质文化遗产“活”起来----青城派 刘绥滨掌门人
第二季光芒姐姐·向梦想出发 三千有故事·惊破玄黄宇! 让珍贵的非物质文化遗产"活"起来----青城派 刘绥滨掌门人
- SSM毕设项目四川省非物质文化遗产之传统手工技艺数字平台i7k3a(java+VUE+Mybatis+Maven+Mysql)
SSM毕设项目四川省非物质文化遗产之传统手工技艺数字平台i7k3a(java+VUE+Mybatis+Maven+Mysql) 项目运行 环境配置: Jdk1.8 + Tomcat8.5 + Mysq ...
最新文章
- python无法打开excle_无法打开Excel fi
- 苏宁的另类“存在感”
- NYOJ 215 Sum
- 字符串野指针 百练2681
- mybatis_user_guide(2)mybatis3.4.0快速入门
- Python 最强编辑器PyCharm详细使用指南!
- winform定义数据源名称_WinForm中使用CrystalReport水晶报表——基础,分组统计,自定义数据源...
- MySql按字段分组取最大值记录 [此博文包含图片]
- Android SearchView 实现搜索框
- SpringBoot使用Swagger2实现Restful API
- 软考笔记(数据结构篇)———— KMP算法
- Raki的读paper小记:XLNet: Generalized Autoregressive Pretraining for Language Understanding
- mysql sql slave skip_MySQL的一次错误处理 SQL_SLAVE_SKIP_COUNTER
- SQL 数据库 学习 002 如何启动 SQL Server 软件
- 计算机软件著作权登记去哪查询,软件著作权在哪里查询
- 小众绿软|媒体:Soprano Audio Player v1.60
- 平方根不用计算机怎么算,怎么算立方根(平方根)?不用计算器的!
- 英文字体“磅”(Point)和中文字号的关系
- 计算机在智能建筑中的应用,【计算机技术在建筑智能化中的应用研究原稿_0材料】...
- C#DGV选择shift多选