使用模拟器下载好友QQ空间说说
使用selenium库模拟浏览器登陆,由于selenium不支持phantomJS,所以本文使用google浏览器。首先用anaconda安装好selenium库,然后下载chromedriver复制到python路径中。打开一个有空间访问权限的好友空间,找到其说说页,使用webdrive请求网页。
driver = webdriver.Chrome()
driver.get('https://user.qzone.qq.com/qq号码/311')#qq号码为自己的qq号
运行后网页会跳到一个认证页面,需要输入账号和密码
driver.switch_to_frame('login_frame') driver.find_element_by_id('switcher_plogin').click() driver.find_element_by_id('u').clear() driver.find_element_by_id('u').send_keys('账号') driver.find_element_by_id('p').clear() driver.find_element_by_id('p').send_keys('密码') driver.find_element_by_id('login_button').click() time.sleep(3)
之后页面会跳转到好友的qq空间说说页面,使用select选择器提取说说内容,在结尾加入$符号,方便之后的分词,并保存在shuoshuo.txt文件中
while next_page:try:contents = driver.find_elements_by_css_selector('.content')for content in contents:print(content.text)with open('shuoshuo.txt','a+') as f:f.write(content.text)f.write('$')next_page = driver.find_element_by_link_text(u'下一页')page = page + 1 print(u'正在抓取第{}页面内容······',format(page))next_page.click()time.sleep(3)
之后使用jieba库对好友说说进行分词,首先打开文件,然后提取每行数据
file = open('shuoshuo.txt','r')content = file.readlines() word_dict = {} s = '' for ct in content:list1 = ct.split('$')for cont in list1:s=s+cont+','
然后jieba进行关键词提取,并统计权重,然后保存下来
cut1 = jieba.analyse.extract_tags(s,topK = 2000,withWeight=True)
with open('shuoshuo_keyword.txt','a+') as f1:for item in cut1:f1.write(item[0]+' '+str(item[1])+ '\n')
之后使用wordcloud进行关键词的可视化处理
file = open('e:\project\pachong\shuoshuo_keyword.txt','r') for line in file.readlines():lis1.append(line.split()[0])lis2.append(float(line.split()[1]))text = dict(zip(lis1,lis2))
back_coloring = imread(r'背景图片.png') wc = WordCloud( font_path=r'c:\Windows\Fonts\STZHONGS.TTF',#设置字体 background_color="gray", #背景颜色 max_words=300,# 词云显示的最大词数 mask=back_coloring,#设置背景图片 max_font_size=100, # min_font_size=10, random_state=50, scale=3 ) wc.fit_words(text) image_colors = ImageColorGenerator(back_coloring)plt.figure() plt.imshow(wc.recolor(color_func=image_colors)) plt.axis("off") plt.show() wc.to_file("词云.png")
使用模拟器下载好友QQ空间说说相关推荐
- selenium+python模拟浏览器进入好友QQ空间留言
我们要模拟浏览器登陆qq空间并进入好友空间留言,首先要安装自动化测试工具selenium,它支持多种浏览器,我这里使用的是谷歌浏览器.使用谷歌浏览器需要下载chromedriver.exe,驱动版本要 ...
- web端网页qq好友 qq空间 微信 微博分享
1.分享给qq好友 window.open("http://connect.qq.com/widget/shareqq/index.html?url=" +encodeURICom ...
- 在线python爬取好友qq空间_Python3.6获取QQ空间全部好友列表
首先要处理的是gtk算法:从上次分析以来代码并没有变 登录QQ空间后搜索gtk字符串,在三个js中出现了 /* |xGv00|e5808eb94a2bdffe3aae60cd22c5efe2 */ d ...
- 一.selenium爬取好友QQ空间日志说说
#coding:utf-8from selenium import webdriver import time,os import xlrd,xlwt from xlutils.copy import ...
- 在好友QQ空间留言板上留图片
若您需要在好友空间留言板上发表图片,是需要您去设置个性签名的.自空间留言板改版后,已不再支持将图片直接放到空间留言中,只能将图片设置为个性签名,之后再进入好友空间留言.(注:签名更改后,之前留言过的留 ...
- python爬取好友qq空间_python + selenium +chrome爬取qq空间好友说说并存入mongodb数据库...
title: python + selenium +chrome爬取qq空间好友说说并存入mongodb数据库 准备阶段 在正式开始在前需要先准备好做爬虫的工具,本例使用chrome无头浏览器进行爬取 ...
- python空间点赞_用Python登录好友QQ空间点赞的示例代码
记得之前跟我女票说过,说要帮她空间点赞,点到999就不点了.刚开始还能天天记得,但是后来事情一多,就难免会忘记,前两天点赞的时候忽然觉得这样好枯燥啊,正好也在学Python,就在想能不能有什么方法能自 ...
- python空间点赞_用Python登录好友QQ空间点赞
记得之前跟我女票说过,说要帮她空间点赞,点到999就不点了.刚开始还能天天记得,但是后来事情一多,就难免会忘记,前两天点赞的时候忽然觉得这样好枯燥啊,正好也在学Python,就在想能不能有什么方法能自 ...
- python 给qq点赞_用Python登录好友QQ空间点赞的示例代码
记得之前跟我女票说过,说要帮她空间点赞,点到999就不点了.刚开始还能天天记得,但是后来事情一多,就难免会忘记,前两天点赞的时候忽然觉得这样好枯燥啊,正好也在学Python,就在想能不能有什么方法能自 ...
最新文章
- 太赞!Python和Excel终于可以互通了
- php wamp 环境好吗,phpstudy和wamp哪个好
- make的自动变量和预定义变量
- Xamarin开发IOS笔记:切换输入法时输入框被遮住
- centos中 npm install 被kill的解决方案
- 力扣剑指 Offer 05. 替换空格(JavaScript)
- 2019秋季学习计划
- 2021年南菁高中高考成绩查询,2021年无锡高考各高中成绩及本科升学率数据排名及分析...
- html 图片旋转插件,jQuery插件expander实现图片翻转特效
- VB之不能“VB6EXT.OLB”注册
- 在知乎上被100万人推荐的黑科技网站,究竟有何神奇之处?
- Java房地产销售管理系统_Java学员作品-房地产销售管理系统
- Quartus II 使用详解
- Excel中VBA合并工作表
- 程序员眼中的中国传统文化-王阳明《传习录》22
- 简体-繁体互转换的一个JS
- 抖音V1.7.9调研报告
- 原 C语言实现万年历程序,C语言实现万年历源码
- 【JVM】Object obj = new Object()
- 常见的引脚功能介绍(基于ADSP-SC589芯片)
热门文章
- 华为AI计算框架昇思MindSpore零基础快速入门 (上)
- 开发转测试没人要_我做软件测试六年的一些感悟
- Error:Execution failed for task ':app:mergeDebugResources'错误
- RHEL/CentOS Linux 安装VLC播放器
- win7天翼live
- Preferences入门
- 对以“孵化器”模式推进气象大数据应用的思考
- 和iPhone14一样高的像素?全网首测OAK-1-MAX人工智能相机
- C语言实现植物大战僵尸自动收集阳光(二) C语言控制台程序的实现
- TCGA甲基化数据(.idat)champ.load文件导入Sample Sheet构建