开篇我们谈过如何采集豆瓣的影片信息,并把影片信息以豆瓣ID为主键存储,存储方式多种多样,可以用数据库,文件,还有最方便的redis。今天就讲讲如何把电影网站的影片与豆瓣信息关联,并把豆瓣评分、评分人数等信息补充到影片里。

虽然现在的很多的电影网站程序都支持根据豆瓣ID关联豆瓣信息,但前提需要知道对应影片的豆瓣ID,然后在后台视频管理里一个个的手工采集,而且官方的采集都是通用的,使用的人很多,经常无法更新到豆瓣信息。

那怎样避免手工更新,实现采集的影片信息自动更新匹配到豆瓣评分、豆瓣评分人数等信息呢?其实方法很简单,现在电影网站程序,如苹果cms、飞飞影视、马克思等,都支持api调用资源网站采集。

原本我们只需要填写资源采集网的地址,那要自动关联豆瓣评分等内容,那就写一个封装的重组api资源的页面,比如取名为doubanapi.php。为了处理方便,我们使用json格式api资源,doubanapi.php先通过curl获取资源信息,我们将获取的json数据使用json_decode函数转为一个数组。通过foreach获取数组中的影片名称、主演、编剧、导演、年份等信息,然后根据影片名称去豆瓣上模糊查询影片信息(主要查询豆瓣ID)。豆瓣ID对应的豆瓣信息如果redis里面有,直接从redis里获取,如果没有就直接去豆瓣采集,同时存入redis缓存里。

有了影片信息,同时也有了豆瓣信息,下面要做的就是自动完成影片信息和豆瓣信息的匹配,根据本人的经验,主要要匹配影片名称、导演、主演、年份等信息,正确率可以达到90%左右,具体效果可以查看博士影院和片优网。


下图是具体都匹配代码代码逻辑,数组voddata是影片数据,voddata是影片数据,voddata是影片数据,douban是豆瓣采集到的影片信息。

通过以上方式,即可快速的实现影片自动关联到豆瓣信息,确保自己的电影网站上的电影,都有豆瓣评分及评价人数,有效的提供了网站的体验。本篇主要还是讲了实现的整体思路,如果大家有兴趣,欢迎交流。

IT漫话第三篇:电影网站关联豆瓣评分相关推荐

  1. 爬取80s电影列表和豆瓣评分

    使用多线程抓取80s的电影列表和电影的豆瓣评分 # -*- coding: utf-8 -*- # File : 用resquests爬取80s电影列表.py # Author: HuXianyong ...

  2. IT漫话第四篇:电影网站自动化采集

    现在大部分的影视系统都支持自动化采集,只需要在后台配置即可.但是如果需要个性化采集,比如我们对采集资源关联了豆瓣评分信息,而这种关联一般是一条条的电影信息去和豆瓣信息匹配的,此时采用自动化采集就有问题 ...

  3. 三步建立自己的电影网站 2 (使用Cpolar发布电影网站)

    系列文章 三步建立自己的电影网站 1 (安装MacCMS10) 三步建立自己的电影网站 2 (使用Cpolar发布电影网站) 三步建立自己的电影网站 番外篇 (排除MacCMS10登录故障) 上一篇 ...

  4. 【数字智能三篇】之二: 一页纸说清楚“什么是推荐系统?”

    按:[数字智能三篇] 目前"大数据"."推荐系统"."深度学习"是数字智能领域的热点研究方向,相关的书籍也很火热,比如"大数据&q ...

  5. 我的MVC之旅(3)--------MVC Music Store 第三篇 Views and ViewModels [翻译]

    前言 有网友说不要浪费时间了赶紧干点正事,也有人觉得还不错:我个人觉得看懂是一回事,但是能够写出来分享是另一回事,这样记忆深刻有助于加深自己的理解,而且可以帮助有些和我一样的初学者,遇到的问题,怎么解 ...

  6. 第三篇 :微信公众平台开发实战Java版之请求消息,响应消息以及事件消息类的封装...

    微信服务器和第三方服务器之间究竟是通过什么方式进行对话的? 下面,我们先看下图: 其实我们可以简单的理解: (1)首先,用户向微信服务器发送消息: (2)微信服务器接收到用户的消息处理之后,通过开发者 ...

  7. python自动爬取更新电影网站_Python爬虫之—微信实时爬取电影咨询

    本文将介绍如何使用爬虫在微信对话中实现实时的电影咨询爬取功能,希望和大家一起来分享" 1. 撩妹起源 俗话说的好:少壮不撩妹,长大徒伤悲啊! 说的很对,但是在这个撩妹的时代,要想成功把到妹, ...

  8. HTML5期末大作业:在线电影网站设计——电影速递网(12页面)含登录注册HTML+CSS+JavaScript

    HTML5期末大作业:在线电影网站设计--电影速递网(12页面)含登录注册HTML+CSS+JavaScript 临近期末, 你还在为HTML网页设计结课作业,老师的作业要求感到头大?HTML网页作业 ...

  9. HTML5期末大作业:电影网站设计——电影资讯博客(5页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 web学生网页设计作业源码

    HTML5期末大作业:电影网站设计--电影资讯博客(5页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 web学生网页设计作业源码 常见网页设计作业 ...

  10. HTML5期末大作业:电影网站设计——漫威电影(2页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 web学生网页设计作业源码...

    HTML5期末大作业:电影网站设计--漫威电影(2页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 web学生网页设计作业源码 常见网页设计作业题材 ...

最新文章

  1. delphi获取当前计算机所有盘符
  2. 翻新版三星Note7发售消息曝光:原价7折,6月发售
  3. java求最优解库,IPOPT在第二次求解时找到最优解
  4. AD服务器不愿意处理该请求
  5. 摩根士丹利 Morgan Stanley 2008校园招聘已经正式开
  6. 云图说|Git云上仓库哪家好?一张图了解华为云代码托管服务
  7. hadoop连接远程mysql_MySQL设置远程连接
  8. Java:jar包和war包区别
  9. Linux 4.21优化Zen 2架构
  10. java分布式面试题之消息队列ActiveMQ部分,java反序列化原理
  11. wow模型修改器_《魔兽世界》魔兽世界模型修改器攻略
  12. vncview用法_vnc远程桌面怎么使用(最新vncviewer使用教程)
  13. 迷你游戏平台开发(二)
  14. 生命周期数据共享[父子-子父-兄弟]ref引用数组复习
  15. 12.11晚自习习题
  16. python栈是什么意思_Python实现的栈(Stack)
  17. 水深则流缓,人贵则语迟,有悟性的人请进
  18. 苹果切换输入法_iPhone输入法的正确打开方式,让你打字更痛快
  19. 钽电容,电解电容与普通电容的区别
  20. 笔记本插网线无法联网解决方法

热门文章

  1. Vulnhub靶机:GEMINI INC_ 1
  2. 用python算股票β系数_利用 Python 计算资产 beta 值和市场 beta 值
  3. 字段代码au_EBSCOhost数据库中,检索字段代码为TI、SO、AU分别表示的是:
  4. veu +Apipost下拉框选项绑定数据库
  5. Geth私链的多节点运行
  6. 一个通过网络转换Ico到Png图片的小小程序(Ico2Png)
  7. fgui的ui管理框架_GitHub - zyswx/DCET: Unity3D客户端和.Net Core服务器双端框架,支持FGUI和双端行为树,支持代码全热更(包括FGUI和行为树)...
  8. 使用Excel批量生成sql,包括日期格式
  9. 计算机学院品牌活动总结,计算机学院研究生会工作总结
  10. Arcgis用矢量文件裁剪栅格图像