(转载)书蕴——基于书评的人工智能推荐系统
书蕴——基于书评的智能推荐系统
前言
计算机设计大赛在即,和冬瑜、承意组队参加人工智能组,报的题目的:书蕴——基于书评的智能书籍推荐系统。
主体上是去做一个web系统,系统的核心功能是书籍收藏与书籍推荐。根据用户收藏书籍的书评(划重点了),来为用户推荐书籍
创新点
- 基于书籍标签协同过滤算法
- 基于word2vec方法的自然语言处理
- 标签抽取(这个名词还没想好)
思路
- 数据获取
- 数据文本预处理
- 训练word2vec模型
- 使用word2vec模型迭代获取标签
- 协同过滤算法对标签处理,实现推荐
- web系统
数据获取篇
主要是冬瑜写的python爬虫,来源是豆瓣读书,目前效率较为低下,正在尽力找到有效的方案
数据文本预处理
- 去除html标签与换行
- 去除停用词
- 分词
- 保存为文本
具体内容记录在另一篇博客:[书蕴笔记-0]文本预处理
训练word2vec模型
主要使用python的gensim包下的word2vec训练模型,模型以每本书的所有书评为主体。
之后可能考虑用一类书的书评整体训练模型。
基于 Gensim 的 Word2Vec 实践
Deep learning with word2vec
以下参数解释来自博客:word2vec词向量训练及gensim的使用
参数解释:
- sg=1是skip-gram算法,对低频词敏感;默认sg=0为CBOW算法。
- size是输出词向量的维数,值太小会导致词映射因为冲突而影响结果,值太大则会耗内存并使算法计算变慢,一般值取为100到200之间。
- window是句子中当前词与目标词之间的最大距离,3表示在目标词前看3-b个词,后面看b个词(b在0-3之间随机)。
- min_count是对词进行过滤,频率小于min-count的单词则会被忽视,默认值为5。
- negative和sample可根据训练结果进行微调,sample表示更高频率的词被随机下采样到所设置的阈值,默认值为1e-3。
- hs=1表示层级softmax将会被使用,默认hs=0且negative不为0,则负采样将会被选择使用。
- workers控制训练的并行,此参数只有在安装了Cpython后才有效,否则只能使用单核。
具体内容记录在另一篇博客:(占坑,等下写) [书蕴笔记-1]word2vec模型训练
使用word2vec模型迭代获取标签
通过模型vocabulary词频最高的5个词查询其距离最近的5个词,迭代100词,得到标签集(数字仅实验参考,具体会重新调整)
具体内容记录在另一篇博客:(占坑,等下写) [书蕴笔记-2]使用word2vec模型迭代获取标签
协同过滤算法对标签处理,实现推荐
还没看,开会之后具体制定
web系统
写个从前端到后台的web
(转载)书蕴——基于书评的人工智能推荐系统相关推荐
- 书蕴——基于书评的人工智能推荐系统
书蕴--基于书评的智能推荐系统 前言 计算机设计大赛在即,和冬瑜.承意组队参加人工智能组,报的题目的:书蕴--基于书评的智能书籍推荐系统. 主体上是去做一个web系统,系统的核心功能是书籍收藏与书籍推 ...
- 电影推荐系统 python简书_基于Spark的电影推荐系统(实战简介)
## 写在前面 一直不知道这个专栏该如何开始写,思来想去,还是暂时把自己对这个项目的一些想法 和大家分享 的形式来展现.有什么问题,欢迎大家一起留言讨论. 这个项目的源代码是在https://gith ...
- [书蕴笔记-2]使用word2vec模型迭代获取标签
使用word2vec模型迭代获取标签 前言 整体索引在此 :书蕴--基于书评的人工智能推荐系统 之前把书评预处理并将每本书训练出了word2vec模型,本篇博客针对如何提取书籍的标签具体展开描述. 思 ...
- [书蕴笔记-1]word2vec模型训练
word2vec模型训练 前言 整体索引在此 书蕴--基于书评的人工智能推荐系统 上次把文本进行了预处理,主要是使用正则去除标签以及对文本去除停用词以及结巴分词. 后续还会加入tf-idf来动态选取停 ...
- [书蕴笔记-0]文本预处理
文本预处理 前言 整体索引在此 书蕴--基于书评的人工智能推荐系统 思路 因为数据是爬虫爬下来的,具体内容被写入到了excel表里,所以文本预处理分为2块.一个是从excel中获取数据,然后去掉文本中 ...
- 基于深度学习方法的推荐系统(转载)
原文:Deep Learning based Recommender System: A Survey and New Perspectives 作者:张帅, 新南威尔士大学 翻译:沈春旭,清华大学 ...
- 观察者模式之四:基于知识库的信息推荐系统(本科毕业论文,学术道德问题,严禁抄袭)...
基于知识库的信息推荐系统 Knowledge lib based information recommendation system 姓 名:谢 松 学 院:数学科学学院 专 ...
- 当推荐系统遇上图学习:基于图学习的推荐系统最新综述
©作者|Shoujin Wang 单位|麦考瑞大学博士后 研究方向|数据挖掘,机器学习,推荐系统 论文简介 本文给大家介绍一篇被今年国际人工智能联合会议 IJCAI 2021 接收的从图机器学习的视角 ...
- 基于Spark的电影推荐系统(电影网站)
第一部分-电影网站: 软件架构: SpringBoot+Mybatis+JSP 项目描述:主要实现电影网站的展现 和 用户的所有动作的地方 技术选型: 技术 名称 官网 Spring Boot 容器 ...
最新文章
- 直接上手!不容错过的Visual Studio Code十大扩展组件
- TREK1000 评估套件的软件技术分析
- Android 截屏监听(截图分享功能实现)
- 145. 二叉树的后序遍历
- 最近公共祖先_leetcode No.236 二叉树的最近公共祖先
- 滤镜怎么调_手机、电脑怎么剪辑视频?真心求推荐实用工具
- 穷举法求最大公共子序列C语言,算法--最长公共子序列(LongestCommon Subsequence, LCS)...
- vue非父子组件间传参问题
- 厚积薄发 - 关于runtime的几个问题
- Cramer_rule克莱姆法则讲解
- VUE table下载XLSX文件
- NXOPEN/UG二次开发C#---获取NX的版本
- Nginx不解析PHP,无法打开PHP文件
- xp 计算机配置,怎么查看WindowsXP系统电脑配置?
- 关于移动视频直播技术,关键干货都在这里(一)采集
- iOS 自建应用内测分发平台
- UNL系列图——交互图
- 福州大学866信号与系统初试经验分享
- mos管的rc吸收电路计算_一种反激式开关电源中MOS管的RC吸收电路的制作方法
- Linux 指令学习之ping