在运行之前,先要把关键词按行分隔,保存成txt文件,并在运行参数中让脚本去读取它。每次运行之后,会在/home/rank/文件夹下,创建一个类似1970-01-01.csv这样文件名的文件,保存着当日的关键词排名情况。" s! Z) r* {! [3 v& l4 k- Y

c.setopt(FOLLOWLOCATION, True)" h# t' D! U4 g2 W1 Y

if pos!=-1:" l2 m5 t7 a& o% ?

keywords.append(line) #将读取到的文字加入到keywords列表中

( \7 a! K, L3 Y4 bfor line in open(file_keyword):# [6 S% E# J8 c, Z" F' z  a  j1 ?

#迭代文件,每次读取一行文字+ i( f7 ^3 h4 x' E5 x

这些代码需要以下运行环境:0 m: T, V4 R0 a2 H1 k. f. L+ _' k

2 e- t9 m: m4 v2 k; a) I; Gimport curl6 P/ l# A" d  q4 b! ~

import StringIO, time, random

# Y5 x2 n! u0 V! Z/ }; g/ G  a# v9 tnow = ()- m; W# r* M& Z/ T

'Opera/; U; en)',8 l/ [" k# Z; V2 q8 {

f.write('%s\t%d\t%s\n' % (keyword, pos, url))

9 b7 t" k5 g8 s6 ^: E8 ]% _'Mozilla/; Windows NT 5.1; en

( ^( [+ |/ A, Q8 R, h& ]0 M; N: M# T数据的储存方式上,此时一般建议选择csv。它和Excel表格(xls)在数据的储存方式上是一模一样的。* |2 C- M: H0 W( V3 L( x0 B

except:, g# ?$ @0 \- f% e9 }- x

* o* |3 O; K' X$ V& m0 u

因为最多几千个关键词,所以最好每天记录一次它们的排名数据(保证稳定的情况下,对于单IP,Google每天可以查询5000+词,baidu则可以查询数万的词)。而且数据本身,主要为关键词、排名、着陆页URL这几项,文件体积很小,所以每天都保存一份数据。8 f% O3 R& y0 ]/ n4 `

try:3 e2 X" t6 s8 z  k7 l+ F

while 1:

% F$ c) o; t0 N, |2 q7 p4 wwhile 1:$ {" q  d4 I3 N% s1 X

for date in data:

" l& r1 g! J4 i. R( b2 m'Mozilla/; Windows NT ',

. k. k. ?: y5 ~0 {4 E/ m学习的是内置函数的使用,和一些模块的使用方式,尤其是pycurl,re,threading这些需要慢慢熟悉起来。3 ]4 l3 e) k+ t% q3 G

S' M. H! G0 A0 ~0 ^0 Lf.write('%s\t%d\t%s\n' % (keyword, -1, '-'))- j# n  e% Y  Z, z

except:

9 u  X* \4 |& |if ‘REFERER’ not in kwargs:

0 r4 a2 x- H( B1 Cexcept:

' D' r% R  s3 i9 L. f1. 除非数据量大到会对硬盘带来压力(比如每日数G的日志的分析等),不然把能想到的尽多的数据都记录下来。因为蕴岢觯绻锌栈峋×Π锩獯稹|||analyse.py,看到分析结果。但是光这样的分析往往是不够的,因为数字不是很形象,一般生成图表会好得多。( S8 z1 d1 _4 d" l+ ]* M- N

上一页1234

) Y/ B- |& W0 Z1 Y* T) m可以再写一个分析脚本,使用类似Google Analytics的高级细分的方式,做URL的筛选功能。目前监控的是整个网页的访问量趋势,但在加入了筛选功能以后,可以统计诸如/article/和/photo/栏目不同的访问量趋势;也可对于同类栏目进行划分,作为对于AB测试的效果追踪。

- d! O) C5 o. L  c此文出处 紫外线杀菌器 http://url.alibaba.com/r/aHR0cDovL3d3dy5sYW5saW5nZ3ouY29t yitong 康明斯发电机 http://url.alibaba.com/r/aHR0cDovL3d3dy5ma3gxNjMuY29t yitong, ~; L, K5 t/ w+ n( ?1 o. O

如果排名趋势追踪的需求非常重要的话,可以考虑做邮件每日报告及邮件预警之类功能。PythLinux里面很多东西只能靠它编辑。6 B0 V. ^+ c; T4 m3 f

Python程序语言快速上手经验2 G# j* X) e; v5 i' j' _) n- X# \) [5 }

可以再大幅改进收集脚本,将SERP上面所有出现的网页的排名都进行统计,则可以完全把握竞争对手的动态。结合一些其它方面的监控以后,可以观察到竞争对手绝大多数站内对seo有意义的修改,并及时跟进。(此时数据的储存方式最好用数据库来代替CSV,如使用MongoDB). N$ `" h! k% c1 B

虽然文章中未提到,但采集数据中经常会遇到文字编码问题。UTF-8, GB2312等之间大致有什么区别、Unicode又代表什么、Python里面怎么转换它们等,这些都需参考相关资料。1 \  w1 \* E) ^' J) S) l

& _% \/ d/ i/ r; B; |8 @文中涉及到了一些Python模块路径及Linux环境变量的问题,虽然一般情况下把文件都放在~文件夹下面是可以的,但毕竟这样子文件多了会很乱,可以去补充相关方面的知识。

( U- _; A( _, z5 y8 w3 y2 y$ W最简单的扩展,将收集脚本从面向baidu的改为可用于Google的。5 Y+ I, C1 b/ c3 i# ]

这条命令结合了Linux里面的重定向》,此时程序不会再输出内容到屏幕上,而是写入到data.csv文件中。之后即可使用如LibreOffice Calc(Linux下类似Excel的软件)打开它,生成Line Chart来以图形化的方式观察分析数据。3 ~+ ~' h6 {: A4 L# q: {7 J

技术扩展$ E4 g, E; \- U

尽管结合Google Chart Tools等API,可以自动生成图表,但多数情况下不推荐这么做,因为比较麻烦。除非这些数据需要面向他人,或是需要每天都去分析排名趋势数据。: J7 Y6 B, b0 K8 H( {  t0 Z  n; ~

7 m% x; X' u7 Q( E5 o7 @

pycurl模块的使用,除了程序范畴之外,它还考验对于Web的基础知识。比如REFERER等是什么含义一定要理解,参见HTTP头信息有关的知识点。) o% s* G# D3 X/ u* ?

可以再改进收集脚本,辅以关键词的百度量与对于特定排名位置的大致点击率,去估算网页所获得的seo访问量的话,可以更全面的了解其情况。

+ \3 O/ {8 N. d6 u) |2 B8 i& Q6 s一般来说需求决定技术做法,但这里还是推荐初学者选下面的任意一个需求并实现它,不管目前是否有用。因为熟悉一门程序语言最好的方法是多写:s! v$ J7 i- q

思路扩展

; O4 v  Y# Z9 ~4 Y  R0 Q文中提到了几个模块,比如os和date

6 _3 k8 ]* S0 W一般来说可以这么做:python) \6 m1 t. }7 H% f8 r: A

上一页1234下一页

python阿里巴巴排名_全自动监控网页关键词排名(Python实现)相关推荐

  1. python关键词排名_全自动监控网站关键词排名(Python实现)

    从这篇文章开始不打算再花费大量精力去写程序本身的知识,毕竟是各类书籍上有的内容.其余主要需要学习的是内置函数的使用,和一些模块的使用方式,尤其是pycurl, re, threading这些需要慢慢熟 ...

  2. Python灰帽子_黑客与逆向工程师的Python编程之道

    收藏自用 链接:Python灰帽子_黑客与逆向工程师的Python编程之道

  3. 今日头条关键词排名怎么搜索_公众号搜索关键词排名、公众号怎么排名靠前

    真正的互联网老鸟其实都知道,不管在线上推广什么产品都好,其实都没有所谓的难度,获取流量方式其实就是简单的一批,哪里有怎么玄乎,不管以后遇到什么问题,除了首先需要知道的核心关键词,无非就是做排名优化! ...

  4. 百度关键词排名查询源码_百度移动搜索关键词排名优化

    移动数字时代已经到来,没有给人们太多的思考时间,而越来越多的用户通过手机进行社交.查看新闻.移动办公及浏览网页等,随着数字营销被推上风口浪尖,众多企业开始转向移动SEO,纷纷试水移动搜索引擎优化. 移 ...

  5. 亚马逊asin关键词排名追踪_亚马逊关键词排名的原理?如何提高亚马逊关键词排名?...

    了解关键词的搜集方法以及写关键词时的一些注意事项,但卖家们可不要以为选好了亚马逊关键词就能拍拍屁股不管了,关键词在亚马逊运营中的重要性不言而喻,那么还有比关键词更重要的吗? JS网页版关键词搜索和AS ...

  6. python网页版本_利用jupyter网页版本进行python函数查询方式

    我就废话不多说了,还是直接看代码吧! import numpy world_alchol=numpy.genfromtxt("world_alcohol.txt",delimter ...

  7. python 面试问题_值得阅读的30个Python面试问题

    python 面试问题 Interview questions are quite tricky to predict. In most cases, even peoples with great ...

  8. python老师武_跟着廖雪峰老师学python (5)

    若想技术精进,当然得把基础知识打得牢牢的. 廖雪峰的官方网站  python3教程,该网站提供的教程浅显易懂,还附带了讲学视频,非常适合初学者正规入门. 以下是通过廖雪峰python官方网站学习的个人 ...

  9. 怎么学python知乎_你们都是怎么学 Python 的?

    自学确实是比较难得,没有一个好的规划,好的学习路线图,你不会知道自己下一步该怎么办. 今天我就帮你来解决,分享2020年黑马程序员Python学习路线图,包含学习路线图,学习视频,学习工具,你都可以找 ...

最新文章

  1. linux_域名映射
  2. 剥开比原看代码17:比原是如何显示交易的详细信息的?
  3. 从脸部识别到火星机器人,正在改变世界的计算机视觉
  4. 数学之美 系列八-- 贾里尼克的故事和现代语言处理
  5. boost::math::chebyshev_transform用法的测试程序
  6. 控制用户输入字符的个数
  7. 记录请求的耗时(拦截器、过滤器、aspect)
  8. CCF201909-2 小明种苹果(续)(100分)【序列处理】
  9. Linux 常见命令操作(杀死全部screen)
  10. GitLab 内置了 CI/CD 工具,强大啊!!
  11. 【职场攻略】比你的工资更重要的十件事
  12. MySQL 5.7(windows 64位)下载安装
  13. oracle多个参数查询,Oracle 多参数查询语句
  14. 数论之指标介绍及其应用(基于阶与原根的应用)
  15. csgo服务器正在维护中,csgo社区服务器进不去解决方法
  16. 国内外RTI产品调查情况
  17. oracle环境变量NLS值,设置NLS_LANG环境变量
  18. HDU2063-过山车[Hopcroft-Carp]二分图匹配
  19. P1719 最大加权矩形(二维前缀和Java)
  20. Qt编程12:QSignalMapper多对一信号影射简单使用

热门文章

  1. 交通安全管理毕业论文范文
  2. 我和王争学设计模式|建造者模式
  3. Ubuntu18.04更新驱动最完美的方法
  4. DBCC CHECKDB用法 手工修复数据库
  5. ‘\0’ ,‘0’, “0” ,0之间的区别
  6. 电子墨水屏标签:低功耗处理器技术
  7. Python list 列表方法
  8. css背景图像属性_如何将CSS3转换应用于背景图像
  9. 国外邮箱安全性排名,国外邮箱哪个安全好用?
  10. 基于LMS算法的DFE判决反馈均衡器