分享:通过JAVA获取优酷、土豆、酷6、6间房等视频
2011年12月27日
  通过JAVA获取优酷、土豆、酷6、6间房、56视频,现在很多社会网站都有这个功能,用户输入优酷、土豆、酷6、6间房、56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长。
  比如:新浪微博就有这个功能,当用户输入优酷、土豆、酷6、6间房、56视频网址后,就能获取到相应的视频地址及视频的缩略图。
  其中要用到一个JAR包,链接地址如下:
  http://jsoup.org/packages/jsoup-1.5.2.jar
  import org.jsoup.Jsoup;
  import org.jsoup.nodes.Document;
  import org.jsoup.nodes.Element;
  import org.jsoup.select.Elements;
  /**
  * 视频工具类
  */
  public class VideoUtil {
  /**
  * 获取视频信息
  * @param url
  * @return
  */
  public static Video getVideoInfo(String url){
  Video video = new Video();
  if(url.indexOf("v.youku.com")!=-1){
  try {
  video = getYouKuVideo(url);
  } catch (Exception e) {
  video = null;
  }
  }else if(url.indexOf("tudou.com")!=-1){
  try {
  video = getTudouVideo(url);
  } catch (Exception e) {
  video = null;
  }
  }else if(url.indexOf("v.ku6.com")!=-1){
  try {
  video = getKu6Video(url);
  } catch (Exception e) {
  video = null;
  }
  }else if(url.indexOf("6.cn")!=-1){
  try {
  video = get6Video(url);
  } catch (Exception e) {
  video = null;
  }
  }else if(url.indexOf("56.com")!=-1){
  try {
  video = get56Video(url);
  } catch (Exception e) {
  video = null;
  }
  }
  return video;
  }
  /**
  * 获取优酷视频
  * @param url 视频URL
  */
  public static Video getYouKuVideo(String url) throws Exception{
  Document doc = getURLContent(url);
  /**
  *获取视频缩略图
  */
  String pic = getElementAttrById(doc, "s_sina", "href");
  int local = pic.indexOf("pic=");
  pic = pic.substring(local+4);
  /**
  * 获取视频地址
  */
  String flash = getElementAttrById(doc, "link2", "value");
  /**
  * 获取视频时间
  */
  String time = getElementAttrById(doc, "download", "href");
  String []arrays = time.split("\\|");
  time = arrays[4];
  Video video = new Video();
  video.setPic(pic);
  video.setFlash(flash);
  video.setTime(time);
  return video;
  }
  /**
  * 获取土豆视频
  * @param url 视频URL
  */
  public static Video getTudouVideo(String url) throws Exception{
  Document doc = getURLContent(url);
  String content = doc.html();
  int beginLocal = content.indexOf("document.domain");
  int endLocal = content.indexOf("");
  content = content.substring(beginLocal, endLocal);
  /**
  * 获取视频地址
  */
  String flash = getScriptVarByName("iid_code", content);
  flash = "http://www.tudou.com/v/" + flash + "/v.swf";
  /**
  *获取视频缩略图
  */
  String pic = getScriptVarByName("thumbnail", content);
  /**
  * 获取视频时间
  */
  String time = getScriptVarByName("time", content);
  Video video = new Video();
  video.setPic(pic);
  video.setFlash(flash);
  video.setTime(time);
  return video;
  }
  /**
  * 获取酷6视频
  * @param url 视频URL
  */
  public static Video getKu6Video(String url) throws Exception{
  Document doc = getURLContent(url);
  /**
  * 获取视频地址
  */
  Element flashEt = doc.getElementById("outSideSwfCode");
  String flash = flashEt.attr("value");
  /**
  * 获取视频缩略图
  */
  Element picEt = doc.getElementById("plVideosList");
  String time = null;
  String pic = null;
  if(picEt!=null){
  Elements pics = picEt.getElementsByTag("img");
  pic = pics.get(0).attr("src");
  /**
  * 获取视频时长
  */
  Element timeEt = picEt.select("span.review>cite").first();
  time = timeEt.text();
  }else{
  pic = doc.getElementsByClass("s_pic").first().text();
  }
  Video video = new Video();
  video.setPic(pic);
  video.setFlash(flash);
  video.setTime(time);
  return video;
  }
  /**
  * 获取6间房视频
  * @param url 视频URL
  */
  public static Video get6Video(String url) throws Exception{
  Document doc = getURLContent(url);
  /**
  * 获取视频缩略图
  */
  Element picEt = doc.getElementsByClass("summary").first();
  String pic = picEt.getElementsByTag("img").first().attr("src");
  /**
  * 获取视频时长
  */
  String time = getVideoTime(doc, url, "watchUserVideo");
  if(time==null){
  time = getVideoTime(doc, url, "watchRelVideo");
  }
  /**
  * 获取视频地址
  */
  Element flashEt = doc.getElementById("video-share-code");
  doc = Jsoup.parse(flashEt.attr("value"));
  String flash = doc.select("embed").attr("src");
  Video video = new Video();
  video.setPic(pic);
  video.setFlash(flash);
  video.setTime(time);
  return video;
  }
  /**
  * 获取56视频
  * @param url 视频URL
  */
  public static Video get56Video(String url) throws Exception{
  Document doc = getURLContent(url);
  String content = doc.html();
  /**
  * 获取视频缩略图
  */
  int begin = content.indexOf("\"img\":\"");
  content = content.substring(begin+7, begin+200);
  int end = content.indexOf("\"};");
  String pic = content.substring(0, end).trim();
  pic = pic.replaceAll("\\\\", "");
  /**
  * 获取视频地址
  */
  String flash = "http://player.56.com" + url.substring(url.lastIndexOf("/"), url.lastIndexOf(".html")) + ".swf";
  Video video = new Video();
  video.setPic(pic);
  video.setFlash(flash);
  return video;
  }
  /**
  * 获取6间房视频时长
  */
  private static String getVideoTime(Document doc, String url, String id) {
  String time = null;
  Element timeEt = doc.getElementById(id);
  Elements links = timeEt.select("dt > a");
  for (Element link : links) {
  String linkHref = link.attr("href");
  if(linkHref.equalsIgnoreCase(url)){
  time = link.parent().getElementsByTag("em").first().text();
  break;
  }
  }
  return time;
  }
  /**
  * 获取script某个变量的值
  * @param name 变量名称
  * @return 返回获取的值
  */
  private static String getScriptVarByName(String name, String content){
  String script = content;
  int begin = script.indexOf(name);
  script = script.substring(begin+name.length()+2);
  int end = script.indexOf(",");
  script = script.substring(0,end);
  String result=script.replaceAll("'", "");
  result = result.trim();
  return result;
  }
  /**
  * 根据HTML的ID键及属于名,获取属于值
  * @param id HTML的ID键
  * @param attrName 属于名
  * @return 返回属性值
  */
  private static String getElementAttrById(Document doc, String id, String attrName)throws Exception{
  Element et = doc.getElementById(id);
  String attrValue = et.attr(attrName);
  return attrValue;
  }
  /**
  * 获取网页的内容
  */
  private static Document getURLContent(String url) throws Exception{
  Document doc = Jsoup.connect(url)
  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(6000)
  .post();
  return doc;
  }
  public static void main(String[] args) {
  String url ="http://www.56.com/u64/v_NTkzMDEzMTc.html";
  Video video = getVideoInfo(url);
  System.out.println("视频缩略图:"+video.getPic());
  System.out.println("视频地址:"+video.getFlash());
  System.out.println("视频时长:"+video.getTime());
  }
  }

分享:通过JAVA获取优酷、土豆、酷6、6间房等视频相关推荐

  1. 通过JAVA获取优酷、土豆、酷6、6间房等视频

    为什么80%的码农都做不了架构师?>>>    通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视频地址后,能 ...

  2. JAVA获取优酷、土豆、酷6等视频实例

    通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长. ...

  3. JAVA获取优酷、土豆、酷6、6间房等视频

    通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长. ...

  4. 【转】通过JAVA获取优酷、土豆、酷6、6间房等视频

    通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长. ...

  5. 仿微博抓取视频网站,支持优酷/土豆/酷6/六间房/56网/音悦台/搜狐/奇艺的视频发布的java实现 ...

    视频分享效果为在站点内输入一视频网站某一视频链接,分享后即可类似微博或qq空间中那样直接点击播放,此代码赞只支持上述视频网站,6间房的视频有点问题,后面将继续扩展抓取其他视频网站. 分享后效果图: 实 ...

  6. 获取优酷、土豆、酷6、6间房等视频

    通过JAVA获取优酷.土豆.酷6.6间房.56视频,现在很多社会网站都有这个功能,用户输入优酷.土豆.酷6.6间房.56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长. ...

  7. 通过JAVA获取优酷视频

    通过JAVA获取优酷视频,现在很多社会网站都有这个功能,用户输入优酷视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长. 比如:新浪微博就有这个功能,当用户输入视频网址后,就 ...

  8. java 截取优酷视频_通过JAVA获取优酷视频

    通过JAVA获取优酷视频,现在很多社会网站都有这个功能,用户输入优酷视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长. 比如:新浪微博就有这个功能,当用户输入视频网址后,就 ...

  9. php 读取优酷视频缩略图,PHP优酷土豆酷6采集入库函数(获取视频缩略图,视频swf地址,视频标题)...

    /** * 采集入库函数 * 优酷,土豆,酷6 采集 (自动获取视频缩略图,视频swf地址,视频标题) * by hkshadow * QQ 2765237 * dete: 2011-06-25 AM ...

最新文章

  1. Linux中断(interrupt)子系统之一:中断系统基本原理【转】
  2. 深度丨建立合资公司,深度参与运营:详解景驰的无人驾驶生意经
  3. [云炬ThinkPython阅读笔记]1.4 算术运算符
  4. <scope>test</scope>的作用
  5. .NetCore 3.1 安装本地化中文智能提示
  6. 查询在具有最小内存容量的所有PC中具有最快处理器的PC制造商 (20 分)(两种思路+详解)
  7. win7 64位安装vs2013后连接远程数据库无法链接,并且导致vs崩溃。
  8. Linux shell编程中read参数说明
  9. js 编写一道程序题输入长和宽之后点击按钮可弹出长方形面积。
  10. win7电脑怎么设置桌面便签
  11. 关于LaTex输入大写罗马字母的命令——\expandafter的理解与\MakeUppercase的使用
  12. 蓝桥杯练习------python字符串逆序
  13. 一点接入全网互通,企业上云就用它!
  14. 称重管理系统服务器不通,称重管理系统使用方法(二)
  15. 从技术小白到收获BAT研发offer,分享我的学习经验和感悟(赠送相关学习资料)
  16. Mysql主从复制和Redis主从复制
  17. 程序员放弃阿里60w年薪,选到手5k的公务员,网友评论:后悔去吧
  18. JSD2204-java基础复习
  19. 计算机网络协议(五)——DNS、HTTPDNS
  20. Arduino UNO驱动合宙1.8‘TFT SPI屏幕示例演示(含资料包)

热门文章

  1. 从今天开始,做一个有心人吧
  2. 宇哥拆机-ASUS华硕F556U拆机清灰升级内存和固态硬盘
  3. 运营商掀窄带物联网投资热 智慧城市商机涌动
  4. 驳:中国人不配拥有精神生活!不配!
  5. 信创办公–基于WPS的EXCEL最佳实践系列 (创建表格)
  6. vue中父子组件及 watch用法
  7. es6对象转为对象数组(map;reduce)【用Object.entries打散】
  8. 男子被闪电击中瞬间用手机拍下照片 电流粗大宛如“上帝之剑
  9. Qt UDP和TCP对比
  10. 不加速的“抢票加速包”,你还在用吗?