摘 要

现在电影资源是网络资源的重要组成部分,随着网络上电影资源的数量越来越庞大,设计电影个性化推荐系统迫在眉睫。所以本文旨在为每一个用户推荐与其兴趣爱好契合度较高的电影。

本系统包含电影前端展示界面、电影评分板块、推荐算法的实现以及后端数据库的设计。其中实现推荐算法是整个电影推荐系统的核心,系统采用爬虫技术和协同过滤算法,是推荐领域最出名也是应用最广泛的推荐算法。所以系统拟采用两种协同过滤算法给出两种不同的推荐结果,一种是基于用户的协同过滤算法,另一种是基于物品的协同过滤算法,用户可以根据两种推荐结果更加合理的选择合适的电影。系统采用了改进之后的ItemCF-IUF和UserCF-IIF算法,对计算用户相似度和物品相似度的计算都做出了改进。最后通过计算两种算法的准确率(Precision)、召回率(Recall)和流行度从而对系统进行评测、并比较了两种算法各自的优势和劣势。实验证明,改进后的算法比原始的协同过滤算法推荐效果要好,准确率更高。整个系统涉及到的编程语言包含Python、Html5、JQuery、CSS3以及MySQL数据库编程。用到的框架是Django重量级web框架,通过该框架连接系统的前、后端.用户首先需要 填写用户名、密码以及邮箱注册系统,然后才能登陆推荐系统。

论文首先阐述推荐系统的研究现状以及意义,随后介绍了相关的推荐算法,重点介绍协同过滤算法,并对系统实现所需技术进行了研究,接着介绍了整个推荐系统的实现,最后对整个项目进行了回顾与总结。

关键词:爬虫技术;电影推荐系统;协同过滤;基于邻域推荐;个性化服务

Abstract

Now film resources are an important part of network resources. With the increasing number of film resources on the network, it is urgent to design a personalized recommendation system for movies. So the purpose of this article is to recommend movies with high fit with each user's interests.

The system includes the film front-end display interface, film scoring board, recommendation algorithm implementation and back-end database design. The implementation of recommendation algorithm is the core of the whole film recommendation system, the system uses crawler technology and collaborative filtering algorithm, is the most famous and widely used recommendation algorithm in the field of recommendation. So the system uses two kinds of collaborative filtering algorithm to give two different recommendation results, one is based on the user's collaborative filtering algorithm, the other is based on the object's collaborative filtering algorithm, the user can choose the appropriate film more reasonably according to the two recommended results. An improved ItemCF-IU was used in the system F and UserCF-IIF algorithms, the calculation of user similarity and object similarity is improved. The system is evaluated by calculating the accuracy (Precision), recall (Recall) and popularity of the two algorithms, and the advantages and disadvantages of the two algorithms are compared. Experiments show that the improved algorithm is more effective and accurate than the original collaborative filtering algorithm. The programming languages involved in the whole system include Python、Html5、JQuery、CSS3 and MySQL database programming. Dj is the framework used ango heavyweight web framework through which the front and back ends of the system are connected. Users first need to fill in the user name, password and mailbox registration system before landing the recommendation system.

This paper first describes the research status and significance of the recommendation system, then introduces the relevant recommendation algorithm, focuses on the collaborative filtering algorithm, and studies the technology needed to implement the system, then introduces the implementation of the whole recommendation system, and finally reviews and summarizes the whole project.

Keywords:crawler technology;movie recommendation system;collaborative filtering; neighborhood-based recommendation; personalized service

目 录

python爬虫项目毕业设计_基于python爬虫的电影推荐网站的设计与实现毕业论文+初稿+项目源码+安装说明+使用说明...相关推荐

  1. 计算机毕业设计ssm基于web的暗香小店系统的设计与实现80041系统+程序+源码+lw+远程部署

    计算机毕业设计ssm基于web的暗香小店系统的设计与实现80041系统+程序+源码+lw+远程部署 计算机毕业设计ssm基于web的暗香小店系统的设计与实现80041系统+程序+源码+lw+远程部署 ...

  2. 基于java的千千影评网站的设计与实现(论文+程序设计源码+数据库文件)

    摘要:信息技术高度发达的今天,新闻业已经在互联网行业中占越发主导地位.而我们的生活也跟新闻息息相关,尤其是在高度发达的精神文化社会,人们对于电影的喜爱也越来越热衷,但想挑到自己喜爱的片子,就需要影评网 ...

  3. Java毕业设计_基于SSM的美食食谱分享网站的设计与实现

    基于SSM的美食食谱分享网站的设计与实现 基于SSM的美食食谱分享网站的设计与实现mysql数据库创建语句 基于SSM的美食食谱分享网站的设计与实现oracle数据库创建语句 基于SSM的美食食谱分享 ...

  4. 计算机毕业设计ssm基于JAVA毕业生发展去向查询平台及数据统计系统6263k系统+程序+源码+lw+远程部署

    计算机毕业设计ssm基于JAVA毕业生发展去向查询平台及数据统计系统6263k系统+程序+源码+lw+远程部署 计算机毕业设计ssm基于JAVA毕业生发展去向查询平台及数据统计系统6263k系统+程序 ...

  5. 计算机毕业设计ssm基于J2EE的山西旅游网站的设计与实现iiqmx系统+程序+源码+lw+远程部署

    计算机毕业设计ssm基于J2EE的山西旅游网站的设计与实现iiqmx系统+程序+源码+lw+远程部署 计算机毕业设计ssm基于J2EE的山西旅游网站的设计与实现iiqmx系统+程序+源码+lw+远程部 ...

  6. Java毕业设计_基于javaweb的网上预约实验室管理系统的设计与实现

    基于javaweb的网上预约实验室管理系统的设计与实现 基于javaweb的网上预约实验室管理系统的设计与实现mysql数据库创建语句 基于javaweb的网上预约实验室管理系统的设计与实现oracl ...

  7. Java毕业设计_基于SSM框架的图片素材管理系统的设计与实现

    基于SSM框架的图片素材管理系统的设计与实现 基于SSM框架的图片素材管理系统的设计与实现mysql数据库创建语句 基于SSM框架的图片素材管理系统的设计与实现oracle数据库创建语句 基于SSM框 ...

  8. Java毕业设计_基于WEB的多媒体素材管理库的设计与开发

    基于WEB的多媒体素材管理库的设计与开发 基于WEB的多媒体素材管理库的设计与开发mysql数据库创建语句 基于WEB的多媒体素材管理库的设计与开发oracle数据库创建语句 基于WEB的多媒体素材管 ...

  9. java毕业设计_基于J2EE的小学生老师家长互动平台设计与实现

    基于J2EE的小学生老师家长互动平台设计与实现 基于J2EE的小学生老师家长互动平台设计与实现mysql数据库创建语句 基于J2EE的小学生老师家长互动平台设计与实现oracle数据库创建语句 基于J ...

最新文章

  1. unity shader入门精要_shader入门数学基础矩阵篇
  2. 皮一皮:大家族的悲哀。。。
  3. 【C++ 语言】类型转换 ( 转换操作符 | const_cast | static_cast | dynamic_cast | reinterpret_cast | 字符串转换 )
  4. Android—常用组件练习
  5. WinJS实用开发技巧(4):Appbar中使用自定义图片
  6. 毕业论文计算机附录模板,毕业论文格式是什么,附录又是什么?
  7. 【jQuery笔记Part4】03-事件详解
  8. 华为机试HJ57:高精度整数加法
  9. unity如何实现图片透视_unity 中是如何实现游戏人物换装的
  10. 文字识别总结(OCR)
  11. 框架-Laraver
  12. 机器学习算法(七): 基于LightGBM的分类预测(基于英雄联盟10分钟数据判断红蓝方胜负)
  13. 新版同城婚恋交友网源码
  14. oppo A3怎么刷机 oppo A3的刷机教程 oppo A3完美解除账号锁
  15. u9系统的使用方法仓库_晋江正版用友u9系统使用方法-好不好用
  16. Linux 权限管理_sudo授权 学习总结(三)
  17. Office 2007 SP1 V12.0.6207.1000 简/繁/英文版 迅雷高速下载
  18. arcgis10.6安装失败
  19. 数据挖掘学习思维导图
  20. windows 设置exe文件开机自启动

热门文章

  1. 六大设计模式原则-迪米特法则
  2. 能力是由短板决定的 交朋友的一个原则就是自己够朋友 from 纸牌屋2
  3. 新版 Win 10 来了。网友:要被丑哭了……
  4. linx 静态库与动态库
  5. Matlab工具箱标定
  6. 高并发服务器的限制有哪些,如何提高并发量
  7. 虚拟化基础-华为云计算虚拟化
  8. C#中使用OpenGL:(三)将.lib文件编译为.dll文件
  9. VS报错:无法打开lib文件
  10. 深度学习 卷积神经网络原理