一、课程项目

Scuinfo文本分类分析

二、项目类容

爬取川大匿名社区SCUinfo在一段时间内的帖子,对其进行情感分类分析,包括情绪分类(积极,消极),帖子内容关联分析等。

三、个人工作完成报告

3.1 工作概述

负责数据收集、预处理以及简单的情感分析

3.2 爬虫方案

scuinfo为动态加载网页,并且有移动端验证,尝试使用scrapy爬取数据失败,需要对爬虫进行大量定制优化,为了提高开发效率,最终使用了之前爬取QQ空间采用的方式:使用selenium库调用firefox浏览器驱动,该再通过代码模拟人为操作浏览器。获取到对应页面数据后,使用etree和xpath选取相应的目标节点数据。

优点:轻松解决网页动态加载,登录验证,移动端验证等问题

缺点:该方式需要一直保持浏览器前台运行,并且只能为单线程模式,爬取效率相对较低

源码下载的地址:https://www.write-bug.com/article/1272.html

基于Python实现的论坛帖子情感分析相关推荐

  1. [源码和文档分享]基于Python实现的论坛帖子情感分析

    一.课程项目 Scuinfo文本分类分析 二.项目类容 爬取川大匿名社区SCUinfo在一段时间内的帖子,对其进行情感分类分析,包括情绪分类(积极,消极),帖子内容关联分析等. 三.个人工作完成报告 ...

  2. 【人工智能毕设之基于Python+flask+bilstm的评论情感分析系统-哔哩哔哩】 https://b23.tv/QU56eTl

    [人工智能毕设之基于Python+flask+bilstm的评论情感分析系统-哔哩哔哩] https://b23.tv/QU56eTl https://b23.tv/QU56eTl

  3. 基于Python实现的论坛帖子文本情感分析完整代码+数据 可直接运行 毕业设计

    完整代码:https://download.csdn.net/download/qq_38735017/87425721 一.课程项目 文本分类分析 二.项目类容 爬取川大匿名社区SCUinfo在一段 ...

  4. 基于Python的对网络评论情感分析:主题与情感词抽取

    资源下载地址:https://download.csdn.net/download/sheziqiong/85661888 问题描述 针对评论网站上的用户评论进行细粒度的情感分析,区别于传统的粗粒度的 ...

  5. 基于Python的微博大数据舆情分析,舆论情感分析可视化系统

    运行效果图 基于Python的微博大数据舆情分析,舆论情感分析可视化系统 系统介绍 微博舆情分析系统,项目后端分爬虫模块.数据分析模块.数据存储模块.业务逻辑模块组成. 先后进行了数据获取和筛选存储, ...

  6. 【自然语言处理(NLP)】基于FNN网络的电影评论情感分析

    [自然语言处理(NLP)]基于FNN网络的电影评论情感分析 作者简介:在校大学生一枚,华为云享专家,阿里云专家博主,腾云先锋(TDP)成员,云曦智划项目总负责人,全国高等学校计算机教学与产业实践资源建 ...

  7. 基于LSTM三分类的文本情感分析,采用LSTM模型,训练一个能够识别文本postive, neutral, negative三种

    基于LSTM三分类的文本情感分析,采用LSTM模型,训练一个能够识别文本postive, neutral, negative三种 ,含数据集可直接运行 完整代码下载地址:基于LSTM三分类的文本情感分 ...

  8. 基于SnowNLP的商品评论文本情感分析

           摘要:情感文本电商情感标注分析研究是当前电商数据情感挖掘学术研究的重要热点,具有极高的国际应用价值.对当前电商手机在线商品评论词典进行情感文本电商情感标注分析与词典数据情感挖掘研究具有很 ...

  9. 基于电商产品评论数据情感分析

    #!/usr/bin/env python # coding: utf-8# # -- 基于电商产品评论数据情感分析 --# ### 1.案例简介 # # 1.利用文本挖掘技术,对碎片化.非结构化的电 ...

最新文章

  1. 激光雷达的地面-非地面分割和pcl_ros实践
  2. 正则表达式在线自动生成器
  3. 不能解决,复选框在request对象获取的信息后显示在用户信息里面为中文的选项名...
  4. JQuery的摸索之路(二比较)
  5. 信息学奥赛一本通C++语言——1081:分苹果
  6. java多对多关系实例_【Java一对多关系实例公布,你的Java真的可以玩的这么好吗】- 环球网校...
  7. rabbitMQ消息队列 consume详解
  8. ashly理器4.8软件汉化版_工程造价专业 常用广联达CAD等软件 推荐什么笔记本电脑?...
  9. java 认证考试题,2017年Java认证考试试题
  10. 油猴脚本开发及发布流程
  11. 系统篇: fstab 文件详解
  12. arcgis注册数据源_将表注册到地理数据库
  13. Hbase 过滤器详解
  14. [免费专栏] 车联网基础理论之车联网安全常见术语科普
  15. 关于Web的欢迎页面的开发设置
  16. python参考手册 第一章
  17. 科大讯飞AI营销大赛 CTR预估总结
  18. 老毛桃装机版制作启动U盘图文教程
  19. 中基鸿业小故事投资理财大启示
  20. 红旗linux被收购,红旗Linux收购Ubuntu

热门文章

  1. 使用Spark Graphx 探索你不知道的金庸武侠世界
  2. JAVAEE 实训日志01_20200704 上
  3. 软件测试中Bug的分类(类型)
  4. Python练习——L1-051 打折 (5分)
  5. PostgreSQL密码重置方法
  6. Audition CS6 安装到2%出现安装失败
  7. Java实现本机IP的修改和获取
  8. hadoop(五)-hdfs命令行基本命令
  9. pyecharts将html转换图片,如何把pyecharts的炫酷延续到PPT里?
  10. 立创梁山派学习笔记——GPIO输出控制