jishigou  / thinksns

每天自动化批量获取weibo食堂----美食菜谱图片

下载固定微博页面文件index.php?mod=yugao008准备调试脚本,并展示文件名
[root@localhost ~]# wget http://weibo.cns*****.com/index.php?mod=yugao008 | ls -l index.php\?mod\=yugao008
-rw-r--r-- 1 root root 135540 04-23 11:37 index.php?mod=yugao008
搜索图片文件含o.jpg关键词的行,并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | more

    <li><a href="http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/9/39/75512_s.jpg" rev="1444907_lLhRjs"><img  src="http://wei *.com/images/topic/9/39/75512_s.jpg" /></a></li> <li><a href="http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/3/27/75505_s.jpg" rev="1444805_LiCXAH"><img  src="http://wei *.com/images/topic/3/27/75505_s.jpg" /></a></li> <li><a href="http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/e/19/75506_s.jpg" rev="1444805_LiCXAH"><img  src="http://wei *.com/images/topic/e/19/75506_s.jpg" /></a></li>  

搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | ls -l $(hostname)*.txt
-rw-r--r-- 1 root root 1286 04-23 12:59 lindows_20130423125938.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144952.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144957.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145111.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145149.txt
-rw-r--r-- 1 root root 1286 04-23 14:53 lindows_20130423145307.txt
、、、
搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件名及其内容
[root@localhost ~]# ls -l $(hostname)*.txt
[root@localhost ~]# more lindows_20130423125938.txt
http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg
http://weibo.cns*****.com/images/topic/d/82/75500_o.jpg
http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行并展示各文件名和内容
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | more
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/c/99/75459_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/b/28/75454_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more
http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
http://weibo.cns*****.com/images/topic/0/20/75450_o.jpg
http://weibo.cns*****.com/images/topic/3/25/75423_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/3/82/75455_o.jpg
http://weibo.cns*****.com/images/topic/4/27/75302_o.jpg
http://weibo.cns*****.com/images/topic/5/27/75276_o.jpg
http://weibo.cns*****.com/images/topic/6/0/75351_o.jpg
http://weibo.cns*****.com/images/topic/6/3/75390_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示,并批量下载所有jpg到指定目录/home/lindows/
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more | xargs -I {} wget -P /home/lindows/ {}

加载Redhat Linux Crontab 列表 / 每天中午11点定时下载美食图片
[root@locahost ~]# crontab -e
# 每天10:30下载新文件index.php?mod=yugao008
30 10 * * * wget http://weibo.cnsu****.com/index.php?mod=yugao008
# 每天11:00根据新文件index.php?mod=yugao008匹配一定规则自动下载指定美食菜谱图片
0 11 * * * grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more | xargs -I {} wget -P /home/lindows/ {}

ok

  • A餐厅套餐

  • 绍兴酱鸭
  • 全家福
  • 青椒炒蛋
  • 地瓜炒猪肝
  • 蒜泥生菜
  • 白菜面筋包
  • 笋瓜蛋汤
  • A餐厅特色菜肴

  • 湘味鲫鱼
  • 干切牛肉
  • 毛豆烧鸡
  • 骨肉相连
  • 银鱼蒸蛋
  • 白菜面筋包
  • 青椒炒蛋
  • 莴笋鸡柳
  • 青椒酱干丝
  • 青菜粉丝
  • 韭菜绿豆芽
  • 姜米包菜
  • 酸菜鱼
  • 黄焖鸡
  • 香锅鱼头
  • 牛肉砂锅
  • 红油大虾
  • 平桥豆腐羹
  • 鸭血粉丝
  • 鸡蛋炒饭
  • 三鲜炒面
  • 鲜肉馄饨
  • 鲜肉锅贴
  • 经理餐厅套餐

  • 年糕炒小排
  • 蒜柱青龙鱼
  • 口味酸菜鸡
  • 胡萝卜烧羊肉
  • 江南捞百叶
  • 淮扬小炒
  • 花菜肉片
  • 油面筋白菜
  • 蒜泥苋菜
  • 萝卜小排饭
  • 三鲜炒面
  • 酒粮小元宵
  • 经理餐厅冷盘点心

  • 盐水鸭
  • 心里美拌海蜇
  • 麻油肚丝
  • 麻辣翅尖
  • 蜜汁芋艿
  • 盐水花生
  • 韩国泡菜
  • 台湾豆腐
  • B餐厅套餐

  • 牛肉汉堡
  • 红烧鸡腿
  • 鱼香肉丝
  • 清蒸鸡蛋
  • 油渣大白菜
  • 韭菜豆芽
  • 笋瓜蛋汤
  • B餐厅零点和小吃

  • 泉水鱼
  • 金陵烤鸭
  • 荠菜香干
  • 西红柿炒蛋
  • 干锅鸭
  • 罗汉观斋
  • 咕噜素肉
  • 浇汁臭豆腐
  • 酱炒牛蛙
  • 香辣羊肉卷
  • 三鲜砂锅
  • 辣子大虾
  • 扬州狮子头
  • 剁椒黄鱼
  • 金陵烤鸡
  • 莲藕鸡片
  • 柠檬厅

  • 套餐茨菰烧肉
  • 青豆香菇鸡上腿
  • 杂烩
  • 麻辣豆腐
  • 包菜炒蛋
  • 蒜泥菠菜
  • 青椒土豆丝
  • 大白菜蛋汤
  • 特色菜酸菜牛蛙
  • 青椒姬菇炒肉片
  • 肉沫蒸鸡蛋
  • 腌菜牛肉锅
  • 大碗菜毛血旺
  • 酸菜鱼
  • 鲫鱼蒸鸡蛋
  • 水煮牛肉片
  • 盖浇饭小排盖浇饭
  • 萝卜烧肉
  • 姬菇鸡蛋肉片
  • 烤鸭盖浇饭
  • 面条小排面
  • 香肠面
  • 大肠面
  • 中西明档类

  • 碳烤蒜茸虾
  • 碳烤全家福
  • 碳烤剁椒鱼头
  • 干锅牛蛙
  • 金陵烤鸭
  • 川香口水鸡
  • 莴笋拌鸭肫
  • 香辣鸭脖
  • 腐竹拌花生
  • 四喜烤麸
  • 香菜拌香干
  • 朝鲜泡菜
  • 明档类

  • 碳烤香辣翅
  • 川香牛杂
  • 港式煲仔饭
  • 牛肉砂锅
  • 菌菇砂锅
  • 羊肉锅仔
  • 小六碳烤鱼
  • 小六杂鱼锅
  • 小六碳烤江支鱼
  • 萝卜乌贼锅仔
  • 牛筋牛腩锅仔
  • 咸肉河蚌锅仔
  • 大脸鸡排
  • 秘制烤全翅
  • 鱼籽鱼泡锅仔
  • 鲶鱼豆腐盆菜
  • 秦川臊子面
  • 炸酱面
  • 香菇仔鸡面
  • 特色瓦罐面
  • 红烧排骨面
  • 红汤馄饨
  • 西餐类

  • 咖喱鸡配饭
  • 韩式腊味炒饭
  • 韩式烤肉配饭
  • 三鲜乌冬面
  • 黑森林
  • 抹茶水果
  • 奶油水果
  • 大理石
  • 椰蓉软包
  • 原味黄油蛋糕
  • 竹炭面包
  • 原味玛芬
  • 中餐类

  • 青菜肉圆盖浇饭
  • 红烧排骨盖浇饭
  • 青椒香干炒肉丝
  • 毛豆烧仔鸡
  • 红烧鲫鱼
  • 小炒肉
  • 红椒莴笋炒肉片
  • 黄瓜鸡蛋
  • 干锅包菜
  • 干椒绿豆芽
  • 蒜泥菜秧
  • 大碗菜类

  • 黄焖鸡米饭
  • 羊肉汤
  • 牛肉汤
  • 酸菜鱼面
  • 红烧排骨面
  • 香菇仔鸡面
  • 酸菜鱼瓦罐面
  • 红烧排骨瓦罐面
  • 香菇仔鸡瓦罐面
  • 川味小炒肉石锅饭
  • 酸菜鸡块石锅饭
  • 腌菜烧肉石锅饭

http://book.js165.com/iread/wml/p/help.jsp;jsessionid=36DF9F47C606A8ACA5D00AEB14255A0E

Apache Tomcat/5.5.27

首页 | 分类 | 排行榜 | 书架

【e悦读介绍】

e悦读是江苏新华传媒与江苏联通合作推出的手机阅读服务。e悦读注重寻求特色化的阅读资源,致力于为江苏联通用户提供具有地区特色的和更具吸引力的阅读服务。e悦读业务自2012年1月1日起试运营。

【资费说明】

好消息,新年送大礼!e悦读全站图书大开放,免费看!在e悦读试运营期间,江苏联通用户在省内访问e悦读站点将不收取流量费和信息费。试运营期结束之后,e悦读将按标准资费收费。e悦读试运营期的截止日期以站内公告为准。e悦读自此将会矢志不渝地更好的完善平台服务,以回馈您的支持和厚爱,感谢您的关注。

常规的手机阅读产品资费包括三个部分:点播信息费、包月信息费和流量费。

1.点播资费:主要包括按章、按本收费两种资费。按章标准资费每章0.10元-0.12元不等;具体资费以用户点播提醒为准。按本标准资费为2-3元/本。

2.包月产品按价格分为二类:2元优惠包和4元优惠包。2元优惠包可选择2本单本图书;4元优惠包可选择6本单本图书。退订包月后可享受所有包月特权至当月底;连载中小说不参与优惠包。

【分类介绍】

目前e悦读图书共有15个杂类,主要包括:全本频道、名家推荐、言情小说、玄幻穿越、武侠仙侠、历史军事、幽默短篇、灵异悬疑、影视文学、教育教辅等类型图书。

【排行榜介绍】

排行榜根据读者对每一本书的在当周内、当月内及历史累计点击数的多少分周榜、月榜和总榜由高到低依次排列。

【搜索介绍】

手机阅读的搜索功能具有模糊搜索的能力,无论输入书名,作者名或者关键字、词均可以进行搜索。

【书架介绍】

书架里可以查询用户自己最近阅读过的书籍、自己的消费记录、自己的包月书包以及自己的书籍收藏目录。

【听书帮助】

e悦读用户如果遇到听书功能无法正常使用的情况,请参看以下使用帮助:

a.目前e悦读手机听书功能支持苹果和安卓系统,其他系统暂不支持;b.安装最新版的flash插件。下载地址:http://dl.pconline.com.cn/download/77813.html;c.请优先使用手机自带浏览器,其他的如UC、QQ浏览器也可备选。

附:下载插件会产生流量费,请尽量使用Wi-Fi下载,以节约您的套餐流量。

【字数设置介绍】

字数设置分500字、1000字、2000字三种模式。设置方法:阅读页→页面下方字数设置。

备注:由于手机性能所限,每页显示1000或以上字数可能会因为容量太大导致页面无法打开。如果你使用的是型号和款式比较旧的手机,建议采用500字/页阅读。

首页 | 分类 | 排行榜 | 书架 | 意见反馈 | 帮助

end

project weibo相关推荐

  1. 第50讲:Scrapy 部署不用愁,Scrapyd 的原理和使用

    上节课我们的分布式爬虫部署完成并可以成功运行了,但是有个环节非常烦琐,那就是代码部署. 我们设想下面的几个场景: 如果采用上传文件的方式部署代码,我们首先需要将代码压缩,然后采用 SFTP 或 FTP ...

  2. scrapyd 接口部分

    前言 scrapyd接口一共有10个 一.daemonstatus.json 检查节点服务的状态,支持GET方式 curl http://localhost:6800/daemonstatus.jso ...

  3. python爬虫系列(二)—— weibo用户粉丝爬取

    1. 前言 想爬取weibo的数据,首先想到的应该是微博开放平台,然后就开始创建一个移动应用,选择网页应用即可: 最后不需要提交审核,点击进入该应用: 然后,我们在接口管理中可以看见我们可以使用的接口 ...

  4. ideal如何创建dynamic web project

    步骤如下 ① file -> new -> project ② 选择 Java Enterprise -> next ③ create project from template - ...

  5. This version of Android Studio cannot open this project, please retry with Android Studio 3.5 or new

    今天github 下载一个库 导入 as 提示 This version of Android Studio cannot open this project, please retry with A ...

  6. Error:The SDK Build Tools revision (23.0.3) is too low for project ':app'. Minimum required is 25.0.

    导入github上项目的时候出现 Error:The SDK Build Tools revision (23.0.3) is too low for project ':app'. Minimum ...

  7. Error:(49, 1) A problem occurred evaluating project ':guideview'. Could not read script 'https://r

    出现问题如下: Error:(49, 1) A problem occurred evaluating project ':guideview'. > Could not read script ...

  8. IntelliJ IDEA 的Project structure说明

    IntelliJ IDEA 的Project structure可以在File->Project structure中打开,同时,在新建项目是IDE一般用向导的方式让你填写Project str ...

  9. 将Project的内容导出成单独的XPO文件

    AX跟VSS整合的版本管理可以通过创建知识库将当前层的代码全部签入到VSS中,但是如果不是一个团队开发solution,而是针对客户的需求随时做得一些小改动,一般都希望以Project的形式组织代码和 ...

最新文章

  1. unix oracle控制台,Linux平台下启动oracle11gEM控制台
  2. Docker基本使用命令
  3. mft按钮设计_奥林巴斯M4/3系统新品激情再燃 以轻量化设计铸就微单极致体验
  4. sql中如何统计各种零件的总数量_如何应用GOF设计模式中的构建者模式创建复合对象实例...
  5. 基于事件驱动架构构建微服务第7部分:在仓储上实现事件溯源
  6. .NET Core2使用Azure云上的Iot-Hub服务
  7. Sublime介绍安装和使用(转载)
  8. 操作系统页面置换算法(opt,lru,fifo,clock)实现
  9. LDAPimplementation
  10. ORA-28002 the password will expire
  11. python pyfile py_Python中py文件引用另一个py文件变量的方法
  12. Java速成课程建议
  13. Bresenham直线插补算法
  14. ubuntu linux ftp命令的使用
  15. 使用smbd实现windows和liunx的共享交互
  16. proc文件系统介绍
  17. 计算机表格设置宽度,word表格大小调整固定单元格大小设置——想象力电脑应用...
  18. Python Set 与 dict
  19. hp服务器的网络显示红叉,惠普笔记本白屏后重启后显示红叉网络信号联不上网的原因?...
  20. K-空间 在图像变换及重建

热门文章

  1. 学java,报班还是自学?
  2. Citrix Receiver for Linux安装和cert证书添加解决SSL错误
  3. mysql定时任务每天凌晨三点钟醒来_linux cron 下的定时执行工具使用技巧
  4. 我的理想高中作文理想是计算机,我的理想高中优秀作文范文
  5. 纸鸢|物联网云平台倒闭的原因和案例
  6. 阿里巴巴在知乎上又出事了
  7. python实现千牛客服自动回复语_淘宝客服自动回复语录(客服自动回复大全)
  8. 音视频+5G,远程医疗实时音视频解决方案
  9. dva的用法_dva.js初探
  10. 我的世界热力膨胀JAVA_我的世界1.12-1.6.4热力膨胀 Thermal Expansion Mod下载