论文(设计)题目 基于python爬虫的影评情感分析研究开题报告

选题的背景、意义及研究现状:

研究现状:

文本情感分析又称倾向性分析、情感挖掘,主观分析或评论挖掘,是对带有情感色彩的评论文本内容进行分析、处理、归纳和推理的过程,从而发现评论者对研究对象的态度和意见。评论文本信息表达了用户的各种感情色彩与情感倾向,比如喜、怒、哀、乐、赞成、反对、表扬、批评等。情感分析可应用于市场预测、舆情监测、竞争情报获取等多种研究。

情感分析的方法包括基于情感词典的方法,有监督的机器学习方法和无监督的机器学习方法。基于情感词典的情感分析方法就是通过构建一个包含各类情绪的情感词典,制定评价规则,对文本进行拆句、分析及匹配词典,通过分析文本中的正向情感词和负向情感词数目来计算情感值,从而得到每部电影正向、负向和中立情绪的比例,最后以情感值来作为文本评论数据情感倾向判断的依据。机器学习的方法需要的是大量人工标注的语料作为训练集,运用机器学习或算法等方式训练模型,得出模型后再用来分类判断新本文的情感倾向。

研究内容、研究方法与思路:

研究内容:

利用Python爬虫来爬取豆瓣的影评,经过数据分词和词性标注,其中的词性标注要是弱标注。以HowNet和NTDSP为基础,PMI为技术来制作电影领域的情感词典,根据情感词典来找到情感词并标注它的位置,再向前查找否定词和程度副词,在计算情感值。通过支持向量机SVM来进行分类,以Accuracy来评价最终的分类效果。

【本文来自doc163.com QQ:869918441】

研究方法:

观察法:研究者根据一定的研究目的,研究提纲和观察表,用自己的感官和辅助工具去观察被研究对象,从而获得资料。

项目实验法:通过自主实验,完成对研究从理论到操作的转变,验证是否达到实验要求。

研究思路:

设计通过python爬虫与和自己构建的电影类的情感字典来分析影评。数据分析中要使用弱标注进行标注和结巴分词进行分词。其中情感词典的构建需知网的HowNet和台湾的NTDSP为基础,选取20个核心词汇用PMI来计算新词的情感倾向在求PMI值的和来确定是否为正面词汇,以此来构建情感词典。利用情感词典和找到情感词,否定词,程度副词计算出情感值。利用SVM进行分类计算出最优参数,再利用准确率召的形式回率来表现影评的情感,再用词云图和分析表来呈现所计算各种结果。

主要创新点:

1. 毕设中应用的情感词典是经过改进的电影类的情感词典,计算的结果更精确。

2.分析情感前标注时时词典与弱标注相结合。

具体各个环节进度安排如下:

2018年11月1日至11月21日:完成毕业设计选题;

2018年11月22日至12月12日:查阅搜集分析材料并完成毕业设计开题报告;

2018年12月13日至2019年3月15日:完成毕业设计以及毕业论文初稿;

【www.doc163.com】

2019年3月16日至4月11日:完善毕业设计,完成论文修改稿;

2019年4月12日至4月19日:提交毕业设计、论文定稿和答辩相关资料;

2019年4月20日至4月26日:答辩。

准备情况(查阅文献资料及调研情况、实验仪器设备准备情况等):

1.开题所搜集和查阅的相关资料

[1] 马松岳,许鑫. .基于评论情感分析的用户在线评价研究——以豆瓣网电影为例 [J].图书情报研究.2016,5.

[2] 朱琳琳,徐建. 网络评论情感分析关键技术及应用研究[J].情报理论与实 践.2017,1.

[3] 李慧,柴亚青. 基于属性特征的评论文本情感极性量化分析[J].数据分析与知识发现.2017,1.

[4] 韦文娟,韩家新,夏海洋. 基于Python自然语言处理文本分类研究[J].2016,4.

[5] 郝媛媛,叶强,李一军. 基于影评数据在线评论有用性影响因素研究[J].管理科学学报,2010,13(08)

[6] 夏火松,李保国. 基于Python的动态网页评价爬虫算法[J].软件工程,2016,19(02) 内容来自WWW.doC163.COM

python毕业设计开题报告-基于python爬虫的影评情感分析研究开题报告相关推荐

  1. 基于双向LSTM的影评情感分析算法设计学习记录

    引言 需求分析,技术可行性(目前的研究进度),主流怎么做?我要如何做? 随着互联网技术的飞速发展及联网的便捷,越来越多的人在网上表达自己的意见.其中,电影评论受到广泛关注.很多人选择在闲暇时间观看电影 ...

  2. 计算机专业毕业论文python毕业设计题目推荐基于Python实现的数据分析系统[包运行成功]

  3. python毕业设计题目推荐基于Python实现的大学校园短视频社交软件系统-微信小程序[包运行成功]计算机毕业设计

  4. Titantic乘客生还预测数据分析报告—基于python实现

    Titantic乘客生还预测数据分析报告-基于python实现 1. 问题提出 2. 数据描述 3. 特征独立分析 4. 数据处理 5. 模型评估 1. 问题提出 Titantic数据集是Kaggle ...

  5. 某策略游戏公测期运营情况分析报告-基于python

    某策略游戏测试阶段运营情况分析报告-基于python 背景 了解数据 字段含义 加载必要的库 读取数据 查看数据类型和数据结构 统计缺失值 删除重复数据 游戏总体情况 注册人数变化 活跃用户数变化 活 ...

  6. Python数据分析初探项目 基于Python数据可视化的网易云音乐歌单分析系统 大学编程作业(TUST 天津科技大学 2022年)

    Python 数据分析初探项目 基于 Python 数据可视化的网易云音乐歌单分析系统 大学编程作业(TUST 天津科技大学 2022 年) Python 数据分析初探项目 基于 Python 数据可 ...

  7. Python语言学习:基于python五种方法实现使用某函数名【func_01】的字符串格式('func_01')来调用该函数【func_01】执行功能

    Python语言学习:基于python五种方法实现使用某函数名[func_01]的字符串格式('func_01')来调用该函数[func_01]执行功能 目录 问题提出 代码五种设计思路 T1方法:e ...

  8. Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)

    Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习.深度学习.大数据.云计算等)推荐系统(包括语音生成.识别等前沿黑科技) 导读 基于Python的GUI界面设计的一套 ...

  9. Python人脸识别教程 - 基于Python的开源人脸识别库:离线识别率高达99.38%

    Python人脸识别教程 - 基于Python的开源人脸识别库:离线识别率高达99.38% 仅用 Python 和命令行就可以实现人脸识别的库开源了.该库使用 dlib 顶尖的深度学习人脸识别技术构建 ...

最新文章

  1. 一天搞定CSS: 浮动(float)及文档流--10
  2. 剑指offer-week1
  3. 常用jar包_发布Maven包的正确姿势
  4. .NET Core 2.0 特性介绍和使用指南
  5. 重读经典:《ImageNet Classification with Deep Convolutional Neural Networks》
  6. Python编程从入门到实践~文件读取
  7. [转]形态学操作:膨胀与腐蚀
  8. 卷积神经网络的卷积核大小、个数,卷积层数如何确定呢?
  9. java 使用Sql数据库代码
  10. 小程序手写板电子签名
  11. LeetCode-21. 合并两个有序链表_JavaScript
  12. 全球及中国粮食加工行业产量需求规模与投资产值预测报告2022版
  13. 电信系统服务器地址,电信高速dns服务器地址谁知道?
  14. JAVA后台,对上传资源限定大小
  15. js 中try catch用法
  16. EasyNVS摄像机公网全终端无插件网页摄像机直播管理服务之网页无插件直播服务搭建流程
  17. #822. 徐老师球球世界(数学题)
  18. 企业采购季选好开发板平台 迅为4418开发板
  19. IOS设置微信URL Schemes
  20. java游戏越狱_透露越狱第三季里可以帮助Michael越狱的java程序(转载)

热门文章

  1. noip2019集训测试赛(五)
  2. 深度剖析Kubernetes API Server三部曲 - part 1
  3. Interesting Array
  4. linux中sort命令
  5. WebAssembly 浏览器中运行c/c++模块
  6. 比较严谨的java验证18位身份证号码
  7. BZOJ 4407: 于神之怒加强版
  8. Debian下配置SSH服务器的方法
  9. python编程语言是什么-Python是一种什么样的编程语言?解释?编译?汇编?机械?...
  10. python画图程序-无所不能的python编程是怎么快速画图的呢?5分钟学会!