获取优酷、土豆、酷6、6间房等视频
通过JAVA获取优酷、土豆、酷6、6间房、56视频,现在很多社会网站都有这个功能,用户输入优酷、土豆、酷6、6间房、56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长。
比如:新浪微博就有这个功能,当用户输入优酷、土豆、酷6、6间房、56视频网址后,就能获取到相应的视频地址及视频的缩略图。
其中要用到一个JAR包,链接地址如下:
http://jsoup.org/packages/jsoup-1.5.2.jar
原文地址:http://www.juziku.com/wiki/906.htm
核心代码:
- importorg.jsoup.Jsoup;
- importorg.jsoup.nodes.Document;
- importorg.jsoup.nodes.Element;
- importorg.jsoup.select.Elements;
- /**
- * 视频工具类
- * http://hi.juziku.com/sunlightcs/
- */
- publicclassVideoUtil {
- /**
- * 获取视频信息
- * @param url
- * @return
- */
- publicstaticVideo getVideoInfo(String url){
- Video video = newVideo();
- if(url.indexOf("v.youku.com")!=-1){
- try{
- video = getYouKuVideo(url);
- } catch(Exception e) {
- video = null;
- }
- }elseif(url.indexOf("tudou.com")!=-1){
- try{
- video = getTudouVideo(url);
- } catch(Exception e) {
- video = null;
- }
- }elseif(url.indexOf("v.ku6.com")!=-1){
- try{
- video = getKu6Video(url);
- } catch(Exception e) {
- video = null;
- }
- }elseif(url.indexOf("6.cn")!=-1){
- try{
- video = get6Video(url);
- } catch(Exception e) {
- video = null;
- }
- }elseif(url.indexOf("56.com")!=-1){
- try{
- video = get56Video(url);
- } catch(Exception e) {
- video = null;
- }
- }
- returnvideo;
- }
- /**
- * 获取优酷视频
- * @param url 视频URL
- */
- publicstaticVideo getYouKuVideo(String url)throwsException{
- Document doc = getURLContent(url);
- /**
- *获取视频缩略图
- */
- String pic = getElementAttrById(doc, "s_sina","href");
- intlocal = pic.indexOf("pic=");
- pic = pic.substring(local+4);
- /**
- * 获取视频地址
- */
- String flash = getElementAttrById(doc, "link2","value");
- /**
- * 获取视频时间
- */
- String time = getElementAttrById(doc, "download","href");
- String []arrays = time.split("\\|");
- time = arrays[4];
- Video video = newVideo();
- video.setPic(pic);
- video.setFlash(flash);
- video.setTime(time);
- returnvideo;
- }
- /**
- * 获取土豆视频
- * @param url 视频URL
- */
- publicstaticVideo getTudouVideo(String url)throwsException{
- Document doc = getURLContent(url);
- String content = doc.html();
- intbeginLocal = content.indexOf("<script>document.domain");
- intendLocal = content.indexOf("</script>");
- content = content.substring(beginLocal, endLocal);
- /**
- * 获取视频地址
- */
- String flash = getScriptVarByName("iid_code", content);
- flash = "http://www.tudou.com/v/"+ flash +"/v.swf";
- /**
- *获取视频缩略图
- */
- String pic = getScriptVarByName("thumbnail", content);
- /**
- * 获取视频时间
- */
- String time = getScriptVarByName("time", content);
- Video video = newVideo();
- video.setPic(pic);
- video.setFlash(flash);
- video.setTime(time);
- returnvideo;
- }
- /**
- * 获取酷6视频
- * @param url 视频URL
- */
- publicstaticVideo getKu6Video(String url)throwsException{
- Document doc = getURLContent(url);
- /**
- * 获取视频地址
- */
- Element flashEt = doc.getElementById("outSideSwfCode");
- String flash = flashEt.attr("value");
- /**
- * 获取视频缩略图
- */
- Element picEt = doc.getElementById("plVideosList");
- String time = null;
- String pic = null;
- if(picEt!=null){
- Elements pics = picEt.getElementsByTag("img");
- pic = pics.get(0).attr("src");
- /**
- * 获取视频时长
- */
- Element timeEt = picEt.select("span.review>cite").first();
- time = timeEt.text();
- }else{
- pic = doc.getElementsByClass("s_pic").first().text();
- }
- Video video = newVideo();
- video.setPic(pic);
- video.setFlash(flash);
- video.setTime(time);
- returnvideo;
- }
- /**
- * 获取6间房视频
- * @param url 视频URL
- */
- publicstaticVideo get6Video(String url)throwsException{
- Document doc = getURLContent(url);
- /**
- * 获取视频缩略图
- */
- Element picEt = doc.getElementsByClass("summary").first();
- String pic = picEt.getElementsByTag("img").first().attr("src");
- /**
- * 获取视频时长
- */
- String time = getVideoTime(doc, url, "watchUserVideo");
- if(time==null){
- time = getVideoTime(doc, url, "watchRelVideo");
- }
- /**
- * 获取视频地址
- */
- Element flashEt = doc.getElementById("video-share-code");
- doc = Jsoup.parse(flashEt.attr("value"));
- String flash = doc.select("embed").attr("src");
- Video video = newVideo();
- video.setPic(pic);
- video.setFlash(flash);
- video.setTime(time);
- returnvideo;
- }
- /**
- * 获取56视频
- * @param url 视频URL
- */
- publicstaticVideo get56Video(String url)throwsException{
- Document doc = getURLContent(url);
- String content = doc.html();
- /**
- * 获取视频缩略图
- */
- intbegin = content.indexOf("\"img\":\"");
- content = content.substring(begin+7, begin+200);
- intend = content.indexOf("\"};");
- String pic = content.substring(0, end).trim();
- pic = pic.replaceAll("\\\\", "");
- /**
- * 获取视频地址
- */
- String flash = "http://player.56.com"+ url.substring(url.lastIndexOf("/"), url.lastIndexOf(".html")) +".swf";
- Video video = newVideo();
- video.setPic(pic);
- video.setFlash(flash);
- returnvideo;
- }
- /**
- * 获取6间房视频时长
- */
- privatestaticString getVideoTime(Document doc, String url, String id) {
- String time = null;
- Element timeEt = doc.getElementById(id);
- Elements links = timeEt.select("dt > a");
- for(Element link : links) {
- String linkHref = link.attr("href");
- if(linkHref.equalsIgnoreCase(url)){
- time = link.parent().getElementsByTag("em").first().text();
- break;
- }
- }
- returntime;
- }
- /**
- * 获取script某个变量的值
- * @param name 变量名称
- * @return 返回获取的值
- */
- privatestaticString getScriptVarByName(String name, String content){
- String script = content;
- intbegin = script.indexOf(name);
- script = script.substring(begin+name.length()+2);
- intend = script.indexOf(",");
- script = script.substring(0,end);
- String result=script.replaceAll("'","");
- result = result.trim();
- returnresult;
- }
- /**
- * 根据HTML的ID键及属于名,获取属于值
- * @param id HTML的ID键
- * @param attrName 属于名
- * @return 返回属性值
- */
- privatestaticString getElementAttrById(Document doc, String id, String attrName)throwsException{
- Element et = doc.getElementById(id);
- String attrValue = et.attr(attrName);
- returnattrValue;
- }
- /**
- * 获取网页的内容
- */
- privatestaticDocument getURLContent(String url)throwsException{
- Document doc = Jsoup.connect(url)
- .data("query","Java")
- .userAgent("Mozilla")
- .cookie("auth","token")
- .timeout(6000)
- .post();
- returndoc;
- }
- publicstaticvoidmain(String[] args) {
- //String url = "http://v.youku.com/v_show/id_XMjU0MjI2NzY0.html";
- //String url = "http://www.tudou.com/programs/view/pVploWOtCQM/";
- //String url = "http://v.ku6.com/special/show_4024167/9t7p64bisV2A31Hz.html";
- //String url = "http://v.ku6.com/show/BpP5LeyVwvikbT1F.html";
- //String url = "http://6.cn/watch/14757577.html";
- String url = "http://www.56.com/u64/v_NTkzMDEzMTc.html";
- Video video = getVideoInfo(url);
- System.out.println("视频缩略图:"+video.getPic());
- System.out.println("视频地址:"+video.getFlash());
- System.out.println("视频时长:"+video.getTime());
- }
- }
视频封装类:
- /**
- * 视频封装
- * http://hi.juziku.com/sunlightcs/
- */
- publicclassVideo {
- privateString flash;
- privateString pic;
- privateString time;
- publicString getFlash() {
- returnflash;
- }
- publicvoidsetFlash(String flash) {
- this.flash = flash;
- }
- publicString getPic() {
- returnpic;
- }
- publicvoidsetPic(String pic) {
- this.pic = pic;
- }
- publicString getTime() {
- returntime;
- }
- publicvoidsetTime(String time) {
- this.time = time;
- }
- }
获取优酷、土豆、酷6、6间房等视频相关推荐
- 分享:通过JAVA获取优酷、土豆、酷6、6间房等视频
分享:通过JAVA获取优酷.土豆.酷6.6间房等视频 2011年12月27日 通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视 ...
- php 读取优酷视频缩略图,PHP优酷土豆酷6采集入库函数(获取视频缩略图,视频swf地址,视频标题)...
/** * 采集入库函数 * 优酷,土豆,酷6 采集 (自动获取视频缩略图,视频swf地址,视频标题) * by hkshadow * QQ 2765237 * dete: 2011-06-25 AM ...
- 仿微博抓取视频网站,支持优酷/土豆/酷6/六间房/56网/音悦台/搜狐/奇艺的视频发布的java实现 ...
视频分享效果为在站点内输入一视频网站某一视频链接,分享后即可类似微博或qq空间中那样直接点击播放,此代码赞只支持上述视频网站,6间房的视频有点问题,后面将继续扩展抓取其他视频网站. 分享后效果图: 实 ...
- 爬虫项目实战九:爬取6间房小视频
爬取6间房小视频 目标 项目准备 网站分析 页码分析 反爬分析 代码实现 效果显示 目标 爬取6间房小视频,批量保存到本地文件夹. 项目准备 软件:Pycharm 第三方库:requests,fake ...
- 通过JAVA获取优酷、土豆、酷6、6间房等视频
为什么80%的码农都做不了架构师?>>> 通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视频地址后,能 ...
- JAVA获取优酷、土豆、酷6、6间房等视频
通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长. ...
- 【转】通过JAVA获取优酷、土豆、酷6、6间房等视频
通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长. ...
- php获取视频信息,支持优酷土豆新浪腾讯等多家网站
video.php类 <?php /** * 解析 视频信息 类 * * 支持 优酷, 土豆 酷6 56 新浪 qq播客 乐视 乐视 **/class class_video{// 超时时间va ...
- 如何下载优酷土豆、新浪等视频网站视频
今天第一次写博客,没啥为大家共享的,就介绍一款下载优酷土豆.新浪等视频网站的软件. 大家都知道,下载优酷土豆.新浪上的一些视频,通常都要求你注册账号,还要下载个专门的视频下载软件,显得非常繁琐.并且有 ...
最新文章
- Perforce使用之创建DEPOT流程
- C# 用文本框输入的时间段查询SQL数据库
- 对于java反射的理解
- HDU多校2 - 6767 New Equipments(最小费用最大流)
- 如何在管理员页面查看知识星球活跃度和更多明细
- leetcode - 467. 环绕字符串中唯一的子字符串
- python能画k线图吗_,求教使用python绘制K线图
- java 存储输入_java将用户输入信息保存至txt文件
- matlab多图形相交,用MATLAB作出柱面x^2+y^2=4 和柱面x^2+z^2=4 相交的图形.
- Vue 常用前端UI框架
- 基于ArcGIS软件的打开教程
- 你会如何选型电容?关于电容的ESR?如何理解电容的阻抗-频率曲线?
- 中国工科研究生200多篇英文论文中最常见的习惯(The Most Common Habits from more than 200 English Papers written by Gradua)
- 审车按月还是日期_车辆年检年审时间,看月份还是看日期
- 嵌入式 Linux平台 C程序 交叉编译技术
- 科研伦理与学术规范(笔记)
- 独家发布!java总结与心得,下载量瞬秒百万
- 系统渗透与防护——信息收集与暴力破解
- 图神经网络的图网络学习(上)
- 技术学院技能发展网络在线技能培训在线技能Rtaj比赛进行到一乔
热门文章
- php友情链接大于3换行,交换友情链接需要了解的一些常识和原则
- linux内核看门狗关闭方法,linux内核中断之看门狗
- 邮箱大师发送邮件服务器连接失败,网易邮箱大师退信的解决方法分享 网易邮箱大师发不了邮件的解决方法介绍...
- english-phoneme
- 通过Jlink和PyLink读取蓝牙mac地址--Nordicsilicon labs
- 学校管理系统(Python)
- 提高数据科学工作效率的 8 个Python库!
- 深圳MES系统如何助力注塑企业实现数字化发展
- 阿里取消周报,打击低效加班!HR透露6大原因!
- FAST FW54R V6.1拆解照片