jishigou  / thinksns

每天自动化批量获取weibo食堂----美食菜谱图片

下载固定微博页面文件index.php?mod=yugao008准备调试脚本,并展示文件名
[root@localhost ~]# wget http://weibo.cns*****.com/index.php?mod=yugao008 | ls -l index.php\?mod\=yugao008
-rw-r--r-- 1 root root 135540 04-23 11:37 index.php?mod=yugao008
搜索图片文件含o.jpg关键词的行,并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | more

    <li><a href="http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/9/39/75512_s.jpg" rev="1444907_lLhRjs"><img  src="http://wei *.com/images/topic/9/39/75512_s.jpg" /></a></li> <li><a href="http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/3/27/75505_s.jpg" rev="1444805_LiCXAH"><img  src="http://wei *.com/images/topic/3/27/75505_s.jpg" /></a></li> <li><a href="http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/e/19/75506_s.jpg" rev="1444805_LiCXAH"><img  src="http://wei *.com/images/topic/e/19/75506_s.jpg" /></a></li>  

搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | ls -l $(hostname)*.txt
-rw-r--r-- 1 root root 1286 04-23 12:59 lindows_20130423125938.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144952.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144957.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145111.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145149.txt
-rw-r--r-- 1 root root 1286 04-23 14:53 lindows_20130423145307.txt
、、、
搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件名及其内容
[root@localhost ~]# ls -l $(hostname)*.txt
[root@localhost ~]# more lindows_20130423125938.txt
http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg
http://weibo.cns*****.com/images/topic/d/82/75500_o.jpg
http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行并展示各文件名和内容
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | more
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/c/99/75459_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/b/28/75454_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more
http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
http://weibo.cns*****.com/images/topic/0/20/75450_o.jpg
http://weibo.cns*****.com/images/topic/3/25/75423_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/3/82/75455_o.jpg
http://weibo.cns*****.com/images/topic/4/27/75302_o.jpg
http://weibo.cns*****.com/images/topic/5/27/75276_o.jpg
http://weibo.cns*****.com/images/topic/6/0/75351_o.jpg
http://weibo.cns*****.com/images/topic/6/3/75390_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示,并批量下载所有jpg到指定目录/home/lindows/
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more | xargs -I {} wget -P /home/lindows/ {}

加载Redhat Linux Crontab 列表 / 每天中午11点定时下载美食图片
[root@locahost ~]# crontab -e
# 每天10:30下载新文件index.php?mod=yugao008
30 10 * * * wget http://weibo.cnsu****.com/index.php?mod=yugao008
# 每天11:00根据新文件index.php?mod=yugao008匹配一定规则自动下载指定美食菜谱图片
0 11 * * * grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more | xargs -I {} wget -P /home/lindows/ {}

ok

  • A餐厅套餐

  • 绍兴酱鸭
  • 全家福
  • 青椒炒蛋
  • 地瓜炒猪肝
  • 蒜泥生菜
  • 白菜面筋包
  • 笋瓜蛋汤
  • A餐厅特色菜肴

  • 湘味鲫鱼
  • 干切牛肉
  • 毛豆烧鸡
  • 骨肉相连
  • 银鱼蒸蛋
  • 白菜面筋包
  • 青椒炒蛋
  • 莴笋鸡柳
  • 青椒酱干丝
  • 青菜粉丝
  • 韭菜绿豆芽
  • 姜米包菜
  • 酸菜鱼
  • 黄焖鸡
  • 香锅鱼头
  • 牛肉砂锅
  • 红油大虾
  • 平桥豆腐羹
  • 鸭血粉丝
  • 鸡蛋炒饭
  • 三鲜炒面
  • 鲜肉馄饨
  • 鲜肉锅贴
  • 经理餐厅套餐

  • 年糕炒小排
  • 蒜柱青龙鱼
  • 口味酸菜鸡
  • 胡萝卜烧羊肉
  • 江南捞百叶
  • 淮扬小炒
  • 花菜肉片
  • 油面筋白菜
  • 蒜泥苋菜
  • 萝卜小排饭
  • 三鲜炒面
  • 酒粮小元宵
  • 经理餐厅冷盘点心

  • 盐水鸭
  • 心里美拌海蜇
  • 麻油肚丝
  • 麻辣翅尖
  • 蜜汁芋艿
  • 盐水花生
  • 韩国泡菜
  • 台湾豆腐
  • B餐厅套餐

  • 牛肉汉堡
  • 红烧鸡腿
  • 鱼香肉丝
  • 清蒸鸡蛋
  • 油渣大白菜
  • 韭菜豆芽
  • 笋瓜蛋汤
  • B餐厅零点和小吃

  • 泉水鱼
  • 金陵烤鸭
  • 荠菜香干
  • 西红柿炒蛋
  • 干锅鸭
  • 罗汉观斋
  • 咕噜素肉
  • 浇汁臭豆腐
  • 酱炒牛蛙
  • 香辣羊肉卷
  • 三鲜砂锅
  • 辣子大虾
  • 扬州狮子头
  • 剁椒黄鱼
  • 金陵烤鸡
  • 莲藕鸡片
  • 柠檬厅

  • 套餐茨菰烧肉
  • 青豆香菇鸡上腿
  • 杂烩
  • 麻辣豆腐
  • 包菜炒蛋
  • 蒜泥菠菜
  • 青椒土豆丝
  • 大白菜蛋汤
  • 特色菜酸菜牛蛙
  • 青椒姬菇炒肉片
  • 肉沫蒸鸡蛋
  • 腌菜牛肉锅
  • 大碗菜毛血旺
  • 酸菜鱼
  • 鲫鱼蒸鸡蛋
  • 水煮牛肉片
  • 盖浇饭小排盖浇饭
  • 萝卜烧肉
  • 姬菇鸡蛋肉片
  • 烤鸭盖浇饭
  • 面条小排面
  • 香肠面
  • 大肠面
  • 中西明档类

  • 碳烤蒜茸虾
  • 碳烤全家福
  • 碳烤剁椒鱼头
  • 干锅牛蛙
  • 金陵烤鸭
  • 川香口水鸡
  • 莴笋拌鸭肫
  • 香辣鸭脖
  • 腐竹拌花生
  • 四喜烤麸
  • 香菜拌香干
  • 朝鲜泡菜
  • 明档类

  • 碳烤香辣翅
  • 川香牛杂
  • 港式煲仔饭
  • 牛肉砂锅
  • 菌菇砂锅
  • 羊肉锅仔
  • 小六碳烤鱼
  • 小六杂鱼锅
  • 小六碳烤江支鱼
  • 萝卜乌贼锅仔
  • 牛筋牛腩锅仔
  • 咸肉河蚌锅仔
  • 大脸鸡排
  • 秘制烤全翅
  • 鱼籽鱼泡锅仔
  • 鲶鱼豆腐盆菜
  • 秦川臊子面
  • 炸酱面
  • 香菇仔鸡面
  • 特色瓦罐面
  • 红烧排骨面
  • 红汤馄饨
  • 西餐类

  • 咖喱鸡配饭
  • 韩式腊味炒饭
  • 韩式烤肉配饭
  • 三鲜乌冬面
  • 黑森林
  • 抹茶水果
  • 奶油水果
  • 大理石
  • 椰蓉软包
  • 原味黄油蛋糕
  • 竹炭面包
  • 原味玛芬
  • 中餐类

  • 青菜肉圆盖浇饭
  • 红烧排骨盖浇饭
  • 青椒香干炒肉丝
  • 毛豆烧仔鸡
  • 红烧鲫鱼
  • 小炒肉
  • 红椒莴笋炒肉片
  • 黄瓜鸡蛋
  • 干锅包菜
  • 干椒绿豆芽
  • 蒜泥菜秧
  • 大碗菜类

  • 黄焖鸡米饭
  • 羊肉汤
  • 牛肉汤
  • 酸菜鱼面
  • 红烧排骨面
  • 香菇仔鸡面
  • 酸菜鱼瓦罐面
  • 红烧排骨瓦罐面
  • 香菇仔鸡瓦罐面
  • 川味小炒肉石锅饭
  • 酸菜鸡块石锅饭
  • 腌菜烧肉石锅饭

http://book.js165.com/iread/wml/p/help.jsp;jsessionid=36DF9F47C606A8ACA5D00AEB14255A0E

Apache Tomcat/5.5.27

首页 | 分类 | 排行榜 | 书架

【e悦读介绍】

e悦读是江苏新华传媒与江苏联通合作推出的手机阅读服务。e悦读注重寻求特色化的阅读资源,致力于为江苏联通用户提供具有地区特色的和更具吸引力的阅读服务。e悦读业务自2012年1月1日起试运营。

【资费说明】

好消息,新年送大礼!e悦读全站图书大开放,免费看!在e悦读试运营期间,江苏联通用户在省内访问e悦读站点将不收取流量费和信息费。试运营期结束之后,e悦读将按标准资费收费。e悦读试运营期的截止日期以站内公告为准。e悦读自此将会矢志不渝地更好的完善平台服务,以回馈您的支持和厚爱,感谢您的关注。

常规的手机阅读产品资费包括三个部分:点播信息费、包月信息费和流量费。

1.点播资费:主要包括按章、按本收费两种资费。按章标准资费每章0.10元-0.12元不等;具体资费以用户点播提醒为准。按本标准资费为2-3元/本。

2.包月产品按价格分为二类:2元优惠包和4元优惠包。2元优惠包可选择2本单本图书;4元优惠包可选择6本单本图书。退订包月后可享受所有包月特权至当月底;连载中小说不参与优惠包。

【分类介绍】

目前e悦读图书共有15个杂类,主要包括:全本频道、名家推荐、言情小说、玄幻穿越、武侠仙侠、历史军事、幽默短篇、灵异悬疑、影视文学、教育教辅等类型图书。

【排行榜介绍】

排行榜根据读者对每一本书的在当周内、当月内及历史累计点击数的多少分周榜、月榜和总榜由高到低依次排列。

【搜索介绍】

手机阅读的搜索功能具有模糊搜索的能力,无论输入书名,作者名或者关键字、词均可以进行搜索。

【书架介绍】

书架里可以查询用户自己最近阅读过的书籍、自己的消费记录、自己的包月书包以及自己的书籍收藏目录。

【听书帮助】

e悦读用户如果遇到听书功能无法正常使用的情况,请参看以下使用帮助:

a.目前e悦读手机听书功能支持苹果和安卓系统,其他系统暂不支持;b.安装最新版的flash插件。下载地址:http://dl.pconline.com.cn/download/77813.html;c.请优先使用手机自带浏览器,其他的如UC、QQ浏览器也可备选。

附:下载插件会产生流量费,请尽量使用Wi-Fi下载,以节约您的套餐流量。

【字数设置介绍】

字数设置分500字、1000字、2000字三种模式。设置方法:阅读页→页面下方字数设置。

备注:由于手机性能所限,每页显示1000或以上字数可能会因为容量太大导致页面无法打开。如果你使用的是型号和款式比较旧的手机,建议采用500字/页阅读。

首页 | 分类 | 排行榜 | 书架 | 意见反馈 | 帮助

end

project weibo相关推荐

  1. 第50讲:Scrapy 部署不用愁,Scrapyd 的原理和使用

    上节课我们的分布式爬虫部署完成并可以成功运行了,但是有个环节非常烦琐,那就是代码部署. 我们设想下面的几个场景: 如果采用上传文件的方式部署代码,我们首先需要将代码压缩,然后采用 SFTP 或 FTP ...

  2. scrapyd 接口部分

    前言 scrapyd接口一共有10个 一.daemonstatus.json 检查节点服务的状态,支持GET方式 curl http://localhost:6800/daemonstatus.jso ...

  3. python爬虫系列(二)—— weibo用户粉丝爬取

    1. 前言 想爬取weibo的数据,首先想到的应该是微博开放平台,然后就开始创建一个移动应用,选择网页应用即可: 最后不需要提交审核,点击进入该应用: 然后,我们在接口管理中可以看见我们可以使用的接口 ...

  4. ideal如何创建dynamic web project

    步骤如下 ① file -> new -> project ② 选择 Java Enterprise -> next ③ create project from template - ...

  5. This version of Android Studio cannot open this project, please retry with Android Studio 3.5 or new

    今天github 下载一个库 导入 as 提示 This version of Android Studio cannot open this project, please retry with A ...

  6. Error:The SDK Build Tools revision (23.0.3) is too low for project ':app'. Minimum required is 25.0.

    导入github上项目的时候出现 Error:The SDK Build Tools revision (23.0.3) is too low for project ':app'. Minimum ...

  7. Error:(49, 1) A problem occurred evaluating project ':guideview'. Could not read script 'https://r

    出现问题如下: Error:(49, 1) A problem occurred evaluating project ':guideview'. > Could not read script ...

  8. IntelliJ IDEA 的Project structure说明

    IntelliJ IDEA 的Project structure可以在File->Project structure中打开,同时,在新建项目是IDE一般用向导的方式让你填写Project str ...

  9. 将Project的内容导出成单独的XPO文件

    AX跟VSS整合的版本管理可以通过创建知识库将当前层的代码全部签入到VSS中,但是如果不是一个团队开发solution,而是针对客户的需求随时做得一些小改动,一般都希望以Project的形式组织代码和 ...

最新文章

  1. 微服务基础架构的5个关键问题
  2. 结合泛型与模板的STL.NET
  3. 人工智能技术结合制造业,是学术研究还是落地方案?!
  4. jQuery入口函数的四种写法【1分钟掌握】
  5. PHP中的SESSION机制应用
  6. Nacos 开源、自研、商业化三位一体战略解读
  7. php 递归创建目录、递归删除非空目录、迭代创建目录
  8. mysql重新安装后之前表_关于重装mysql数据库之后.新的数据库引入旧数据的表结构和数据问题...
  9. 你真的懂语音特征吗?
  10. JAVA学习-JAVA实现1-100的累加
  11. git回滚到之前代码
  12. C# 判断程序是否已经在运行
  13. Github | 标星 1W+ 清华大学计算机系课程攻略!
  14. Unity中录制VR全景视频(可录制UGUI)
  15. P11 - 数据流图 之 DFD进行数据流建模
  16. mac pro 2015 升级1T固态硬盘极简版本(三星970 evo plus)
  17. 多目标进化算法(MOEAs)概述
  18. Unity UGUI DoTween 学习笔记
  19. Kinect与TOF、双目、结构光相机比较相机国产、非国产统计参数对比分析
  20. D - National Railway (DP)

热门文章

  1. java.time.DateTimeException: Unable to extract ZoneId from temporal
  2. LTE-5G学习笔记8---PRACH参数规划
  3. 使用docker 搭建 ceph 开发环境,使用aws sdk 存储数据
  4. 中小企业数据防泄密怎么做,墨门云数据防泄密指南
  5. 胡润研究院发布《2018胡润区块链富豪榜》
  6. 这学期她选修了英语计算机和驾驶三门课程,选出最合适的翻译这个学期她选修了英语、计算机和驾驶三门课程...
  7. INTERCEPTOR DISCONNECTED 的问题
  8. SAP中货物移动库位权限管理测试
  9. ThingsBoard CE添加数据导出excel功能
  10. 计算机的软硬件发展进程,计算机的发展史