使用selenium库模拟浏览器登陆,由于selenium不支持phantomJS,所以本文使用google浏览器。首先用anaconda安装好selenium库,然后下载chromedriver复制到python路径中。打开一个有空间访问权限的好友空间,找到其说说页,使用webdrive请求网页。

driver = webdriver.Chrome()

driver.get('https://user.qzone.qq.com/qq号码/311')#qq号码为自己的qq号

运行后网页会跳到一个认证页面,需要输入账号和密码

driver.switch_to_frame('login_frame')
driver.find_element_by_id('switcher_plogin').click()
driver.find_element_by_id('u').clear()
driver.find_element_by_id('u').send_keys('账号')
driver.find_element_by_id('p').clear()
driver.find_element_by_id('p').send_keys('密码')
driver.find_element_by_id('login_button').click()
time.sleep(3)

之后页面会跳转到好友的qq空间说说页面,使用select选择器提取说说内容,在结尾加入$符号,方便之后的分词,并保存在shuoshuo.txt文件中

while next_page:try:contents = driver.find_elements_by_css_selector('.content')for content in contents:print(content.text)with open('shuoshuo.txt','a+') as f:f.write(content.text)f.write('$')next_page = driver.find_element_by_link_text(u'下一页')page = page + 1
        print(u'正在抓取第{}页面内容······',format(page))next_page.click()time.sleep(3)

之后使用jieba库对好友说说进行分词,首先打开文件,然后提取每行数据

file = open('shuoshuo.txt','r')content = file.readlines()
word_dict = {}
s = ''

for ct in content:list1 = ct.split('$')for cont in list1:s=s+cont+','

然后jieba进行关键词提取,并统计权重,然后保存下来

cut1 = jieba.analyse.extract_tags(s,topK = 2000,withWeight=True)
with open('shuoshuo_keyword.txt','a+') as f1:for item in cut1:f1.write(item[0]+' '+str(item[1])+ '\n')

之后使用wordcloud进行关键词的可视化处理

file = open('e:\project\pachong\shuoshuo_keyword.txt','r')
for line in file.readlines():lis1.append(line.split()[0])lis2.append(float(line.split()[1]))text = dict(zip(lis1,lis2))
back_coloring = imread(r'背景图片.png')
wc = WordCloud( font_path=r'c:\Windows\Fonts\STZHONGS.TTF',#设置字体
                background_color="gray", #背景颜色
                max_words=300,# 词云显示的最大词数
                mask=back_coloring,#设置背景图片
                max_font_size=100,
                # min_font_size=10,
                random_state=50,
                scale=3
                )
wc.fit_words(text)
image_colors = ImageColorGenerator(back_coloring)plt.figure()
plt.imshow(wc.recolor(color_func=image_colors))
plt.axis("off")
plt.show()
wc.to_file("词云.png")
最后为生成的结果展示:

使用模拟器下载好友QQ空间说说相关推荐

  1. selenium+python模拟浏览器进入好友QQ空间留言

    我们要模拟浏览器登陆qq空间并进入好友空间留言,首先要安装自动化测试工具selenium,它支持多种浏览器,我这里使用的是谷歌浏览器.使用谷歌浏览器需要下载chromedriver.exe,驱动版本要 ...

  2. web端网页qq好友 qq空间 微信 微博分享

    1.分享给qq好友 window.open("http://connect.qq.com/widget/shareqq/index.html?url=" +encodeURICom ...

  3. 在线python爬取好友qq空间_Python3.6获取QQ空间全部好友列表

    首先要处理的是gtk算法:从上次分析以来代码并没有变 登录QQ空间后搜索gtk字符串,在三个js中出现了 /* |xGv00|e5808eb94a2bdffe3aae60cd22c5efe2 */ d ...

  4. 一.selenium爬取好友QQ空间日志说说

    #coding:utf-8from selenium import webdriver import time,os import xlrd,xlwt from xlutils.copy import ...

  5. 在好友QQ空间留言板上留图片

    若您需要在好友空间留言板上发表图片,是需要您去设置个性签名的.自空间留言板改版后,已不再支持将图片直接放到空间留言中,只能将图片设置为个性签名,之后再进入好友空间留言.(注:签名更改后,之前留言过的留 ...

  6. python爬取好友qq空间_python + selenium +chrome爬取qq空间好友说说并存入mongodb数据库...

    title: python + selenium +chrome爬取qq空间好友说说并存入mongodb数据库 准备阶段 在正式开始在前需要先准备好做爬虫的工具,本例使用chrome无头浏览器进行爬取 ...

  7. python空间点赞_用Python登录好友QQ空间点赞的示例代码

    记得之前跟我女票说过,说要帮她空间点赞,点到999就不点了.刚开始还能天天记得,但是后来事情一多,就难免会忘记,前两天点赞的时候忽然觉得这样好枯燥啊,正好也在学Python,就在想能不能有什么方法能自 ...

  8. python空间点赞_用Python登录好友QQ空间点赞

    记得之前跟我女票说过,说要帮她空间点赞,点到999就不点了.刚开始还能天天记得,但是后来事情一多,就难免会忘记,前两天点赞的时候忽然觉得这样好枯燥啊,正好也在学Python,就在想能不能有什么方法能自 ...

  9. python 给qq点赞_用Python登录好友QQ空间点赞的示例代码

    记得之前跟我女票说过,说要帮她空间点赞,点到999就不点了.刚开始还能天天记得,但是后来事情一多,就难免会忘记,前两天点赞的时候忽然觉得这样好枯燥啊,正好也在学Python,就在想能不能有什么方法能自 ...

最新文章

  1. 太赞!Python和Excel终于可以互通了
  2. php wamp 环境好吗,phpstudy和wamp哪个好
  3. make的自动变量和预定义变量
  4. Xamarin开发IOS笔记:切换输入法时输入框被遮住
  5. centos中 npm install 被kill的解决方案
  6. 力扣剑指 Offer 05. 替换空格(JavaScript)
  7. 2019秋季学习计划
  8. 2021年南菁高中高考成绩查询,2021年无锡高考各高中成绩及本科升学率数据排名及分析...
  9. html 图片旋转插件,jQuery插件expander实现图片翻转特效
  10. VB之不能“VB6EXT.OLB”注册
  11. 在知乎上被100万人推荐的黑科技网站,究竟有何神奇之处?
  12. Java房地产销售管理系统_Java学员作品-房地产销售管理系统
  13. Quartus II 使用详解
  14. Excel中VBA合并工作表
  15. 程序员眼中的中国传统文化-王阳明《传习录》22
  16. 简体-繁体互转换的一个JS
  17. 抖音V1.7.9调研报告
  18. 原 C语言实现万年历程序,C语言实现万年历源码
  19. 【JVM】Object obj = new Object()
  20. 常见的引脚功能介绍(基于ADSP-SC589芯片)

热门文章

  1. 华为AI计算框架昇思MindSpore零基础快速入门 (上)
  2. 开发转测试没人要_我做软件测试六年的一些感悟
  3. Error:Execution failed for task ':app:mergeDebugResources'错误
  4. RHEL/CentOS Linux 安装VLC播放器
  5. win7天翼live
  6. Preferences入门
  7. 对以“孵化器”模式推进气象大数据应用的思考
  8. 和iPhone14一样高的像素?全网首测OAK-1-MAX人工智能相机
  9. C语言实现植物大战僵尸自动收集阳光(二) C语言控制台程序的实现
  10. TCGA甲基化数据(.idat)champ.load文件导入Sample Sheet构建