下载VOA英语网站的相关内容,脚本如下

要用到 Nokogiri 库。此库相关使用介绍

#!/usr/bin/ruby
require 'open-uri'
require 'nokogiri'
www = 'http://www.51voa.com'
pagelist = []
doc = Nokogiri::HTML(open(www + '/Learn_A_Word_1.html'))
doc.css('div#pagelist a').each{|x| pagelist << x['href']}
def get_child_page(address)list = []doc = Nokogiri::HTML(open(address))doc.css('div#list a').each{|x| list << x['href']}list
end
def download(mp3,file)
File.open(file + ".mp3",'wb'){ |f| f.write(open(mp3).read) }
end
def writefile(txt,file)aFile = File.new(file + ".txt","w")aFile.puts txtaFile.close
end
pagelist.each do |address|
txt, mp3, name = ''list = get_child_page(www + "/" + address)list.each do |result|doc = Nokogiri::HTML(open(www + result))txt = doc.css('div#content').text #file txtname = doc.css('div#title').text.strip.gsub(' ','_')#name = doc.css('div#title').text.encode("GBK") 如果想保存中文名,就用String#encode方法beginmp3 = doc.css('div#menubar a')[0]['href'] #mp3download(mp3,name)writefile(txt,name)rescueendend
end

转载于:https://blog.51cto.com/abian/1364636

Ruby批量下载音乐相关推荐

  1. 【爬虫实战项目】Python爬虫批量下载音乐飙升榜并保存本地(附源码)

    前言 今天给大家介绍的是Python爬虫批量下载音乐飙升榜并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是 ...

  2. ruby 批量下载王者荣耀皮肤

    主要采用ruby Parallel库提供的多线程方式: require 'unirest' require 'open-uri' require 'parallel' require 'json'ur ...

  3. 批量下载baidu音乐主页的歌曲

    [代码] 华语 package com;import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileNo ...

  4. python爬取qq音乐周杰伦_Python爬取QQ音乐url及批量下载

    QQ音乐还是有不少的好音乐,有些时候想要下载好听的音乐,如果在网页下载都是还需要登录什么的.于是,来了个QQmusic的爬虫.至少我觉得for循环爬虫,最核心的应该就是找到待爬元素所在url吧. 参考 ...

  5. iTunes音乐导入过程记录(专辑图片、歌手修改,iTunes使用,网易云歌单批量下载)

    所需工具 1.iTunes 2.音乐标签修改器. 3.下载好的音乐 网易云歌单在线下载. 4.一点耐心 详细步骤 1.先调整一下iTunes中的音乐存储位置 菜单栏选编辑-偏好设置-高级 更改iTun ...

  6. GUI 界面的免费音乐下载 支持批量下载

    GUI 界面的免费音乐下载 支持批量下载 导包 import urllib import requests import wx import urllib import requests import ...

  7. 利用Python批量下载自己喜欢听得音乐

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 音乐是生活的调剂品,目前很多的音乐只能播放不能下载.生为技术员的我们,怎么甘 ...

  8. HtmlAgilityPack.dll爬虫获取百度音乐批量下载地址(C#源码)

    关于分析的过程和思路参考原来的一篇文章 <HtmlAgilityPack 爬虫批量获取百度音乐下载地址一> http://blog.csdn.net/witch_soya/article/ ...

  9. python怎么下载网络歌曲_教你如何用Python批量下载自己喜欢听得音乐

    文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 音乐是生活的调剂品,目前很多的音乐只能播放不能下载.生为技术员的我们,怎么甘心呢? ...

最新文章

  1. 基于UDP的socket客户服务器编程
  2. 浅谈hashcode
  3. Mysql 提示:Communication link failure
  4. 大二暑假工作三个月后辞职,总体感悟
  5. 【渝粤教育】电大中专新媒体营销实务 (13)作业 题库
  6. 职业学校计算机主要学什么条件,职业学校计算机教学计划
  7. 不等式解集怎么取_七年级下学期《8.2不等式及不等式组的解集》2020年高频易错题集...
  8. sublime test3 php语法错误高亮
  9. 三层结构对多语言的支持
  10. 开启Accessibility的快捷方式-3次home键或者侧边键
  11. 微信小程序原生自定义组件布局问题
  12. js实现批量打印工资条,后台采用java开发(项目总结篇)
  13. 《大象 Thinking in UML》学习笔记(三)——UML核心元素之参与者、用例
  14. css3boder-image属性使用
  15. 手机双摄像头原理及产业解析
  16. springboot返回404错误页面
  17. uniapp开发app 调用支付宝人脸实名认证
  18. 三国杀服务器改名 插图修改,三国杀7年前老版灵雎焚心到底多恶心?换身份让官方被迫修改...
  19. Dijkstra 与 Floyd算法
  20. Python 打印阿姆斯特朗数

热门文章

  1. 如何在 Flutter 中使 Expanded 中的文本可滚动
  2. 官宣:神策数据证券行业解决方案,全新上线官网!
  3. 视频 + PPT | 突破“十面埋伏”,银行业玩转数字化运营
  4. 【spring boot】spring boot @ConditionalOnxxx相关注解总结
  5. Java多线程系列 JUC线程池05 线程池原理解析(四)
  6. Android项目导出jar包的小技巧
  7. Python学习系列(一)(基础入门)
  8. c#快捷键(成为高手必备)
  9. 项目中除了需求外还需要知道的问题
  10. 有用就存档,没用就删除,当日清理当日的email