目录

背景

效果展示

程序下载

网盘下载


背景

前几天中国数据库大会风风火火的在京举行了,期间干货满满,收获良多。在学大佬们的ppt时,发现只能一篇一篇预览,对于求知欲强烈的小编来说简直太难受了,于是便写了个程序,一键获取所有ppt。

2020年12月21日~12月23日,由 IT168 旗下 ITPUB 企业社区平台主办的第十一届中国数据库技术大会(DTCC2020),将在北京隆重召开。大会以“架构革新 高效可控”为主题,设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

历经十年的积累与沉淀,如今的DTCC已然成为国内数据库领域的技术风向标,见证了整个行业的发展与演变。作为顶级的数据领域技术盛会,DTCC2020将继续秉承一贯的干货分享和实践指导原则,期待大家的热情参与!

中国数据库大会链接:http://dtcc.it168.com/

软件环境:python 3

效果展示

话不多说,上代码

# encoding: utf-8
from bs4 import BeautifulSoup
import requests
from urllib.request import urlopen
import re
import jsondef visit(url):headers = {"User-Agent": "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; InfoPath.3)","accept": "application/json, text/javascript, */*; q=0.01","accept-encoding": "gzip, deflate, br","accept-language": "zh-CN,zh;q=0.9","content-type": "application/x-www-form-urlencoded; charset=UTF-8","cookie": "",  -- 填自己的"referer": "","sec-fetch-dest": "document","sec-fetch-mode": "navigate","sec-fetch-site": "same-origin",}res = requests.get(url,headers=headers)bsObj = BeautifulSoup(res.text, "html.parser")return bsObjdef visit_homepage(url):bsObj = visit(url)content = bsObj.find('div', class_="content")content_list = content.select("p")category = []for i in range(4,len(content_list)):try:urls = content_list[i].a['href']name = content_list[i].get_text("|").split("|")[0].replace(' ','').replace('\xa0','')category.append([name,urls])except:passprint(category)return categorydef download_pdf(conf,path):category_name = conf[0]category_url = conf[1]bsObj = visit(category_url)res = re.search(r'(.*)token:(.*?),',str(bsObj) ,re.M|re.I)token = res.group(2).replace('"','').replace(' ','')arts = re.findall(r'(.*)li data-docinfo=(.*?)}',str(bsObj) ,re.M|re.I)for art in arts:art_str = "{"+str(art).split('{')[1].replace("')","}")art_dic = json.loads(art_str)id = art_dic['id']name = art_dic['name']download_url = "https://api.z.itpub.net/download/file?st-usertoken=%s&id=%s"%(token,str(id))print(download_url)data = urlopen(download_url).read()with open(path+category_name+'__'+name, 'wb') as f:f.write(data)print("finish download  ")if __name__ == '__main__':homepage = "https://z.itpub.net/article/detail/5260C494873379BAA63BAB7C5CBD7A95"path = "/Users/xxx/Downloads/DTCC/"# downloadcategory = visit_homepage(homepage)for i in category:download_pdf(i,path)

程序下载

1、cookie换成自己的

获取cookie办法:打开开发者模式(windows F12,mac opt+command+i) 打开开发者模式,访问:homepage,network里面有cookie

2、修改path为自己的目录

网盘下载

小编也把ppt放在了百度网盘,下载链接:

链接: https://pan.baidu.com/s/1kvEeRkybkA_y65oqeYfbSg  密码: 3bma
--来自百度网盘超级会员V7的分享

Python下载中国数据库大会(DTCC2020)PPT全集相关推荐

  1. 70行Python代码,获取中国数据库大会(DTCC)全部PPT

    大家好,我是明月十四桥! 擅长领域:python黑科技.大数据后端研发.数据仓库 今日重点: ① 学会使用python 获取各种网站的ppt,可见即可爬: ② 中国数据库大会一年一届,门票昂贵,干货满 ...

  2. 2013年中国数据库大会PPT

    干货来了!!2013年中国数据库大会刚刚闭幕,PPT已经提供下载.分享给各位. 微盘打包下载:http://vdisk.weibo.com/s/ANRGLyceAFCQ 大数据革命.pdf MPP G ...

  3. 2015中国数据库大会Mongodb分享

    本次分享主要是介绍了MongoDB的3.0版本,对其性能提升进行内幕解密. 首先介绍了MongoDB的主要功能: (1)自动复制高可用 MongoDB有3中配置方式:单机.主从和复制集(replica ...

  4. 2012中国数据库技术大会演讲PPT下载

    "关于大会的更多精彩照片,请点击以下链接. 2012数据库技术大会现场图片,能找到你自己不? http://www.itpub.net/thread-1603156-1-1.html --- ...

  5. 京东城市时空数据引擎JUST亮相中国数据库技术大会(附PPT链接)

    受疫情影响,第十一届中国数据库技术大会(DTCC2020)从原定的5月份,推迟到了8月份,再推迟到了12月份.尽管如此,依然没有减退国人对数据库技术的热情.2020年12月21日-12月23日,北京国 ...

  6. 【资源下载】2016第七届中国数据库技术大会圆满结束

    为期三天的2016第七届中国数据库技术大会已于2016年14日在北京圆满结束,此次大会以"数据定义未来"为主题,邀请众多知名的国内行业技术专家,共同探讨了 MySQL.NoSQL. ...

  7. 33个PPT下载丨2018年PostgreSQL中国技术大会PPT

    之前有读者询问一些数据库相关的大会资源,小编收集整理了很多文档,创建了相应的墨天轮专栏,后续将逐个分享到"数据和云"公众号. 这里我们分享2018 PostgreSQL中国技术大会 ...

  8. 58个PPT下载丨2019 PostgreSQL中国技术大会资源放送

    之前有读者询问一些数据库相关的大会资源,小编收集整理了很多文档,创建了相应的墨天轮专栏,后续将逐个分享到"数据和云"公众号. 这里我们分享2019 PostgreSQL中国技术大会 ...

  9. 2015年中国数据库技术大会(DTCC)PPT合集

    2015年中国数据库技术大会(DTCC)PPT合集 由国内领先的IT专业网站IT168联合旗下ITPUB.ChinaUnix两大技术社区举办的2015第六届中国数据库技术大会(DTCC2015)在北京 ...

最新文章

  1. Java GUI编程:swing实现上传tiff文件至hdfs功能
  2. php集成极光推送,php推送例子(第三方极光推送)
  3. ajax异步同步加载PHP代码,jquery中的ajax同步和异步详解
  4. in use 大学英语4word_(word)大学英语考试样题四.doc
  5. PHP后端美化,基于Thinkphp5.5表白墙源码,已美化后端
  6. 【网游加速器源码】PC/IOS/Android/安卓手游加速器客户端源代码,全套网游加速器系统解决方案
  7. [转转转]面试常见逻辑推理题目及答案整理
  8. 何凯明:Single Image Haze Removal Using Dark Channel Prior[CVPR 2009]
  9. 计算机ir领域,IR领域的相关等级会议和期刊
  10. Linux系统的时间管理及优化
  11. 如何利用番茄工作法提高学习和工作的效率
  12. one to one
  13. redis5大数据结构
  14. (附源码)APP+springboot垃圾自动分类管理系统 毕业设计 160846
  15. 惠民工程(最小生成树裸题)
  16. stm32h743 FDCAN驱动踩坑记录
  17. 我的世界服务器卡屏无响应,我的世界卡屏死机不流畅解决方法_蚕豆网攻略
  18. 交互式系统中的调度:轮转调度,优先级调度,多级队列,最短进程优先,保证调度,彩票调度。批处理系统中的调度:先进先出,最短作业优先,最短剩余时间优先。陈向群书上的概念
  19. 深度学习+心脏医学图像分割——自动心脏诊断挑战赛(ACDC)项目的代码学习记录
  20. 牛客oj---喆神装书

热门文章

  1. 卖萌屋福利场:《机器阅读理解》免费送送送!
  2. 深度解析LSTM神经网络的设计原理
  3. 论文浅尝 | Interaction Embeddings for Prediction and Explanation
  4. Android官方开发文档Training系列课程中文版:打印内容之图像打印
  5. 如何使用ListView实现一个带有网络请求,解析,分页,缓存的公共的List页面来大大的提高工作效率
  6. js 简单弹框toast
  7. [笔记]cin、cout与scanf、printf的效率差异对比分析
  8. 每天进步一点点:andriod学习从零开始
  9. 分享-利用VPC防止病毒软件的进入你的windows电脑
  10. 计算机网络(二十)-广域网-PPP协议和HDLC协议