随着前两年云计算和大数据的到来,python 已经火了一遍,目前更是火的一塌糊涂。IEEE Spectrum 研究报告显示,python语言目前已经排名第一,它被成为全能语言,web站开发,爬虫数据采集,大数据分析,机器学习以及未来发展大方向的人工智能,python无所不能。而它在seo中的应用貌似seoer们却了解不多,其实它更多的是作为seo辅助工具,开发一些seo常用的工具,来实现工作上的高效率。

有人认为python应用在seo中主要是内容采集,当然也有工具能实现,如(火车头采集器),但是如果这样认为那就太片面了,下面举几个例子,我们看下python在seo工作中的都可以怎么用。

定期更新采集

#coding:utf-8

import urllib2,re,pycurl,StringIO,sys,lxml,requests,time

from bs4 import BeautifulSoup

str_time=time.strftime('%Y-%m-%d',time.localtime())

op_txt=open('url.txt','a')

url = 'http://www.****.com/sitemap/group1.htm'

html=requests.get(url).content

soup = BeautifulSoup(html,"lxml")

zidian={}

c=0

with open('url.txt') as f:

for i in f.readlines():

i=i.strip()

zidian['%s'%(i)]=c

c+=1

for urllist in re.findall(re.compile(r'

.*?href="(.*?)" target="_blank">(.*?)'),str(soup)):

url_data=urllist[0].strip()

title=urllist[1]

if '2017' in title:

print title,url_data

if zidian.has_key(url_data):

print u'没有更新'+str_time

continue

else:

print u'成功更新'+str_time

op_txt.writelines('%s\n'%url_data)

# url="http://www.k***n.com/k-news/"

# html=urllib2.urlopen(url).read()

# #print html

# for urllist in re.findall('

(.*?)',html):

# #print urllist[0],urllist[1]

# if '春节' in urllist[1]:

# print urllist[1],urllist[0]

重命名一个目录下所有文件夹下的文件名

#encoding=utf-8

import os,sys

reload(sys)

sys.setdefaultencoding('utf-8')

# path = 'C:\Users\Administrator\Desktop\image\\'

for i in os.listdir('C:\Users\Administrator\Desktop\image'):

f=1

img_dir='C:\Users\Administrator\Desktop\image\%s\\'%i

# print img_dir

for n in os.listdir(img_dir):

pic_name=n.decode('gbk') # .decode('gbk')

new_name=img_dir+i+'(%s).jpg'%f

path=img_dir+pic_name

print path

os.rename(path, new_name)

f+=1

print u"重命名成功"

关键词去重

wen1_dict={}

c=0

for wen1_line in open('wen1.txt'):

wen1=wen1_line.strip()

wen1_dict['%s'%(wen1)]=c

c+=1

for i in range(1,10):

i=str(i)

if wen1_dict.has_key(i):

continue

else:

print i

其实python还能实现更多的操作,这写操作虽然有些小工具也能做到,但是如果我们会一门语言的话,短短几行代码就可以实现,根据自己的需求去写,不用翻来覆去找软件测试,何乐而不为呢。都说SEO干的活又累又杂,行业走下滑趋势,其实是需要seo人员懂的越来越多,学的越来越多,提升自身素质,才能跟上互联网发展的脚步,否则就容易被淘汰了。所以seo还是基于技术基础之上的,要不断学习新东西,如果只懂得外链,写文章,那seo工作确实是枯燥无味了。文章出自 秦皇岛seo?

Stephen 2017.11.2

喜欢 (4)or分享 (0)

python文件内容去重优化_关于python在seo中的运用相关推荐

  1. python修改文件内容最后一行_关于python:如何修改文件的最后一行?

    我文件的最后一行是: 29-dez,40, 号 如何修改该行,使其显示: 29-Dez,40,90,100,50 号 注意:我不想写新行.我想在29-Dez,40,后面加一行新值. 我是Python的 ...

  2. python 文件编码的识别_【python】python编码方式,chardet编码识别库

    环境: python3.6 需求: 针对于打开一个文件,可以读取到文本的编码方式,根据默认的文件编码方式来获取文件,就不会出现乱码. 针对这种需求,python中有这个方式可以很好的解决: 解决策略: ...

  3. python 文件批量转换格式_使用python批量化音乐文件格式转换的实例

    使用python批量化音乐文件格式转换的实例 最近在做声音文件数据处理,写了一个自动将m4a文件转化为wav的脚本. import os m4a_path = "/Users/Downloa ...

  4. python 多分类模型优化_【Python与机器学习】:利用Keras进行多类分类

    多类分类问题本质上可以分解为多个二分类问题,而解决二分类问题的方法有很多.这里我们利用Keras机器学习框架中的ANN(artificial neural network)来解决多分类问题.这里我们采 ...

  5. python 文件相似度分析_使用Python做人群相似度分析

    在各个行业,尤其是电商行业当中,经常需要做各个人群之间的相似度分析,以便于找到品牌的核心用户,在拉新过程中,我们也需要用现有数据来挖掘潜在客户.下面为大家提供一个做人群相似度的思路. 1.数据准备 需 ...

  6. python 按需加载_基于python的opcode优化和模块按需加载机制研究(学习与个人思路)(原创)...

    基于python的opcode优化和模块按需加载机制研究(学习与思考) 姓名:XXX 学校信息:XXX 主用编程语言:python3.5 文档转换为PDF有些图片无法完全显示,请移步我的博客查看 完成 ...

  7. python读文件每一行-Python文件内容按行读取到列表中

    Python文件内容按行读取到列表中 示例文件内容如下: Hello World Python 通常来讲,我们如果只是迭代文件对象每一行,并做一些处理,是不需要将文件对象转成列表的,因为文件对象本身可 ...

  8. python文件内容 替换,Python对指定文件内容进行全局替换

    关于对指定文件内容进行全局替换的Python实现具体解释都附在代码里了 代码如下: import os import sys cs = sys.argv old_cs = cs[1] # 将要替换掉的 ...

  9. Python文件内容读取成绩单,计算出平均分并且写入原文件存储

    python文件内容读取成绩单,计算出平均分并且写入原文件存储 文件内容如下:( 格式参考下表, 内容自己定义) 姓名 语文 数学 英语 aaa 80 70 65 bbb 85 88 90 ccc 7 ...

最新文章

  1. nio selector
  2. 美团某程序员爆料:绩效背c的都要签pip!网友:pip就是变相劝退!
  3. 字节跳动内部学习资料泄露!mysql的安装与配置
  4. Windows 通过 SecureCRT 8.x 上传文件到Linux服务器
  5. CSS3及JS媒体查询教程
  6. Leetcode--102. 二叉树的层次遍历
  7. scala和java的关键字对比
  8. 程序员最想要十八般武艺俱全的“保姆型”项目经理!
  9. 【Linux 中国】尝试 Nitrux 系统的六大理由
  10. 计算机拼图形 比创意教案,图形联想与创意教案
  11. 淘宝上的零食能买吃吗?网上进口食品的秘密。
  12. 600,000,002,200,300,400等开头的股票都是什么意思
  13. (八) 爬虫教程 |Scrapy框架的使用
  14. js如何获取非行间样式
  15. 利用snowfall.jquery.js实现爱心满屏飞
  16. 2022云计算真题:日志分析服务
  17. 华东师大计算机专业非全日制,华东师范大学非全日制研究生遇冷?
  18. 关于QT源代码文件的归类
  19. DataX系列8-HdfsWriter介绍
  20. 时间序列——滑动窗口

热门文章

  1. 【SQL】 196.删除重复的电子邮箱
  2. 谷歌眼镜GDK开发指南之快速开始
  3. 尚学堂Oracle 课堂笔记(收藏)
  4. 实现类的顺序实例化(@DependOn)
  5. 协力发展,共创未来丨热烈欢迎中电互联赴云恒调研指导
  6. Reabble.com - Kindle RSS新闻杂志订阅
  7. Python散点图绘制:汽车速度与制动距离的关系
  8. 对人工智能有着一定憧憬的计算机专业学生可以阅读什么材料或书籍真正开始入门人工智能的思路和研究?
  9. word中打出希腊字母
  10. Android 实现加载动画