因为新浪微博网页版爬虫比较困难,故采取用手机网页端爬取的方式

操作步骤如下:

1. 网页版登陆新浪微博

2.打开m.weibo.cn

3.查找自己感兴趣的话题,获取对应的数据接口链接

4.获取cookies和headers

# -*- coding: utf-8 -*-

import requests

import csv

import os

base_url = 'https://m.weibo.cn/api/comments/show?id=4131150395559419&page={page}'

cookies = {'Cookie':'xxx'}

headers = {'User-Agent':'xxx'}

path = os.getcwd()+"/weibo.csv"

csvfile = open(path, 'a+', encoding='utf-8',newline='')

writer = csv.writer(csvfile)

writer.writerow(('username','source','comment'))

for i in range(0,83):

try:

url = base_url.format(page=i)

resp = requests.get(url, headers=headers, cookies=cookies)

jsondata = resp.json()

data = jsondata.get('data')

for d in data:

created_at = d.get("created_at")

source = d.get("source")

username = d.get("user").get("screen_name")

comment = d.get("text")

print((username,source,comment))

writer.writerow((username, source, comment))

except:

print('*'*1000)

pass

csvfile.close()

至于爬出来的数据有非中文的数据,要提取中文请参考:筛选出一段文字中的中文

未完待续。。。。

Python:将爬取的网页数据写入Excel文件中

Python:将爬取的网页数据写入Excel文件中 通过网络爬虫爬取信息后,我们一般是将内容存入txt文件或者数据库中,也可以写入Excel文件中,这里介绍关于使用Excel文件保存爬取到的网页数据的 ...

Python学习笔记之将数据写入到文件中

10-3 访客:编写一个程序,提示用户输入其名字:用户作出响应后,将其名字写入到文件guest.txt 中. 编写Python代码: username = input("Please ent ...

利用Python爬取朋友圈数据,爬到你开始怀疑人生

人生最难的事是自我认知,用Python爬取朋友圈数据,让我们重新审视自己,审视我们周围的圈子. 文:朱元禄(@数据分析-jacky) 哲学的两大问题:1.我是谁?2.我们从哪里来? 本文 jacky试 ...

C# 将List中的数据导入csv文件中

//http://www.cnblogs.com/mingmingruyuedlut/archive/2013/01/20/2849906.html C# 将List中的数据导入csv文件中   将数 ...

PHP将数据写入指定文件中

首先创建一个空的txt文件,这里我们创建了一个1.txt的空文件. 第一种方法:fwrite函数 <?php $file=fopen('1.txt','rb+'); var_dump(fwrit ...

票房和口碑称霸国庆档,用 Python 爬取猫眼评论区看看电影《我和我的家乡》到底有多牛

今年的国庆档电影市场的表现还是比较强势的,两名主力和起到了很好的带头作用. 首日破 2 亿,一举刷新由

Python爬取招聘网站数据,给学习、求职一点参考

1.项目背景 随着科技的飞速发展,数据呈现爆发式的增长,任何人都摆脱不了与数据打交道,社会对于“数据”方面的人才需求也在不断增大.因此了解当下企业究竟需要招聘什么样的人才?需要什么样的技能?不管是对于 ...

python 将json格式的数据写入csv格式的文件中

# coding=utf-8 import json import csv # 重新进行配置读写数据时的默认编码 import sys reload(sys) sys.setdefaultencodi ...

一个简易的Python爬虫,将爬取到的数据写入txt文档中

代码如下: import requests import re import os #url url = "http://wiki.akbfun48.com/index.php?title= ...

随机推荐

从外部浏览开启app

先描述一下需求:从浏览器中点击某个按钮,如果手机上装有相应的app,则直接开启app,并且到相对的页面.如果没有装该app,则会到相应的下载app的界面. 我这里主要用的是第三方的东西,就是魔窗中的m ...

Android动画学习&lpar;二&rpar;——Tween Animation

前两天写过一篇Android动画学习的概述,大致的划分了下Android Animation的主要分类,没有看过的同学请移步:Android动画学习(一)——Android动画系统框架简介.今天接着来 ...

Oracle11g 配置 ST&lowbar;GEOMETRY

安装环境:ArcGIS Desktop10.2.1 .ArcSDE10.2.134940. Oracle11.2.0.1 操作系统:Windows Server 2012R2 DataCenter 安 ...

des &lpar;C语言&rpar;

/** * \file des.h * * \brief DES block cipher * * Copyright (C) 2006-2010, Brainspark B.V. * * This ...

【DP】POJ 2385

题意:又是Bessie 这头牛在折腾,这回他喜欢吃苹果,于是在两棵苹果树下等着接苹果,但苹果不能落地后再接,吃的时间不算,假设他能拿得下所有苹果,但是这头牛太懒了[POJ另一道题目说它是头勤奋的奶牛, ...

2016湖大校赛 L题 The Sequence likes Ladder

题意:S1=a,Sn=a*(Sn-1)^k%m,且有(a,m)=1,给出i,求Si. 思路:首先我们可以写出Sn的通项a^(1+k+k^2+...k^n-1);其次注意到m的范围是10000以内,所以 ...

UIKit&&num;160&semi;框架之UICollectionViewController

1.自定义单元格 #import @interface myCollectionViewCell : UICollectionViewCell @prope ...

php foreach 使用&amp&semi;&lpar;与运算符&rpar;引用赋值要注意的问题

首先了解一下“引用赋值”,看一个例子: <?php <?php $a=123; $a=123; $b=$a; $b=&$a; $a=321; $a=321; echo"$ ...

ubuntu14&period;04 制作U盘启动文件

1.制作U盘启动文件 网上搜索:U盘安装Ubuntu 12.10 图文教程(ultraiso) http://www.jb51.net/os/94398.html 2. 重启,按Del(或F2)进BI ...

view import symbols

nm -D [file]|grep -w U or objdump -T [file]|grep "*UND*"

python爬取微博数据存入数据库_Python爬取新浪微博评论数据,写入csv文件中相关推荐

  1. python爬取微博数据存入数据库_Python爬取微博数据并存入mysql,excel中

    寒假期间做微博数据统计,由于是部门要求,也没办法,自己又是一个懒人,直接用python实现吧.写的很粗糙,也很差,请大家别介意. 总的来说分成两个模块:一个爬取微博数据存入数据库,一个从数据库调取数据 ...

  2. python爬取微博数据存入数据库_python爬取微博并且存入数据库

    由于平时喜欢刷微博,追星,所以写了想要写一个爬取微博的爬虫,在老师的建议下选择从移动端爬取,因为移动端页面元素简洁,易于爬取.在看微博时发现有比移动端更加简单的一个版本....老年机版?就是分页式的. ...

  3. requests+BeautifulSoup入门——爬取2015-2020年中国大学排名并写入csv文件中

    requests作为python第三方库,为用户爬取网页内容省下很多力气 BeautifulSoup同样也是python第三方库,它可以将用requests获取到的网页内容美化,也就是做成一碗&quo ...

  4. python爬取新闻存入数据库_python爬取数据存入数据库

    昨天本来写了一篇关于python爬取的文章,结果没通过,正好今天一起吧.用python同时实现爬取,和存入数据库,算是复习一下前面操作数据库的知识. 1.准备工作 既然是爬取,那自然要连接到爬取的页面 ...

  5. 利用python将数据写入CSV文件中

    简单实现,代码如下: import csv# 1.创建文件对象 f = open('csv_file.csv', 'w', encoding='utf-8')# 2.基于文件对象构建csv写入对象 c ...

  6. python爬取新闻存入数据库_python 爬取古诗文存入mysql数据库的方法

    使用正则提取数据,请求库requests,看代码,在存入数据库时,报错ERROR 1054 (42S22): Unknown column 'title' in 'field list'.原来是我写s ...

  7. python爬取新闻存入数据库_Python爬取数据并写入MySQL数据库的实例

    按 F12 或 ctrl+u 审查元素,结果如下: 结构很清晰简单,我们就是要爬 tr 标签里面的 style 和 tr 下几个并列的 td 标签,下面是爬取的代码: #!/usr/bin/env p ...

  8. python爬取新闻并归数据库_Python爬取数据并写入MySQL数据库操作示例

    Python爬取数据并写入MySQL数据库的实例 首先我们来爬取 http://html-color-codes.info/color-names/ 的一些数据. 按 F12 或 ctrl+u 审查元 ...

  9. python网页数据存入数据库_python网络爬虫抓取动态网页并将数据存入数据库MySQL...

    简述 以下的代码是使用python实现的网络爬虫,抓取动态网页 http://hb.qq.com/baoliao/ .此网页中的最新.精华下面的内容是由JavaScript动态生成的.审查网页元素与网 ...

最新文章

  1. 斯坦福CS329S:机器学习系统设计,课程、笔记上线了!
  2. android 中 webview 怎么用 localStorage?
  3. 【pmcaff】2014年中国移动支付用户报告
  4. 国内外免费电子书(数学、算法、图像、深度学习、机器学习)
  5. 萨默尔机器人_第四届丝博会人工智能受热捧 机器人会送餐会协助办案
  6. BP神经网络python简单实现
  7. Javascript实现导出word - jquery jquery.wordexport.js 实现导出word
  8. sperling指标 matlab,sperling指标计算实验报告
  9. python argparse_Python 命令行之旅——初探 argparse
  10. Excel 数据批量生成SQL语句
  11. Jboss的下载和安装
  12. Android中JNI调用过程简述
  13. 405 Method Not Allowed 解决方案
  14. win 11 博通网卡解决蓝牙驱动问题 黑苹果在win11系统中
  15. 显著性水平 置信度 置信区间 实例讲解
  16. 乖乖地听我们三班的指挥
  17. eval函数和repr函数
  18. 威斯康星麦迪逊计算机专业排名,威斯康星大学麦迪逊分校计算机排名2020年
  19. 对SPU、SKU的一点理解
  20. 腾讯视频真实下载地址获取教程(一段代码即可搞定)

热门文章

  1. QUST第七届省赛选拔-盗墓空间
  2. 利用ajax验证用户名,3.6.2 利用Ajax验证注册用户名(1)
  3. Python---qq群聊天记录词云分析
  4. Java Bean 简介及其应用
  5. javascript/JS限制用户名只能输入 汉字字母和数字下划线
  6. LaTeX源文件的文件名最好不要带空格
  7. linux如何查看centos版本信息,怎么查看已安装的CentOS版本信息
  8. 前端项目jenkins自动化部署
  9. ingress-nginx 实现内部局域网的url转发配置
  10. 转载:歌词赏析《新鸳鸯蝴蝶梦》