一、前言

网络舆情是目前各类企业和机构研究的热点内容,舆情数据种类繁多衍生出各类舆情系统。舆情系统的数据来源可以通过数据网站进行购卖,更多的可以利用网络爬虫技术进行数据爬取。舆情系统整体上应具有数据采集、数据分析、信息预警等基本功能。利用python丰富的外部库可以快速进行系统的搭建及开发,笔者根据相关的项目经验设计了一套基于python的舆情通用框架,用于快速搭建舆情数据产品。

二、 系统总体框架


系统包括展示层、业务层、数据维护层、数据库四个模块。采用django作为web服务器框架,echarts作为数据的展示框架,mysql为数据库框架技术。
(一) 展示层
主要负责数和分析结果的展示及交付。展示层包含两个部分,第一部分是基于与平台的web页面数据展示模块。第二部分是邮寄预警模块。

(二) 业务层
业务层主要包括数据采集模块、数据清洗模块、分析建模模块、预警模块。
a) 数据采集模块是基于python/java的爬虫程序,涉及的主要技术包括:正则化表达式、Beautiful Soup 4包、Selenium、Xpath、网站破解、人工智能验证码识别、代理服务器地址库构建。数据采集模块负各大网站售票数据采集。
b) 清洗模块是基于python/java的数据处理程序,涉及的主要技术包括:pandas包、pymysql、numpy等。清洗模块负责数据格式规划化、统一化,以及部分数据的计算。
c) 分析建模模块是基于python/java算法模型,涉及的主要技术包括:神经网络、SVM、决策树、逻辑回归、Boosting、Bagging、HMM等算法。分析建模模块主要分析模型的建立。
d) 预警模块负责根据甲方提供的重大信息建模预警规则,将信息第一时间通过邮寄或其他即时通讯的形式实施交付。

(三) 数据维护层
层主要包括SQL模块、ETL模块、自动化模块。SQL模块主责数据库基本操作、查询、删改、索引等。ETL模块负责多个表的数据传输、整合。自动化模块负责系统的自动运营。

(四) 数据库
主要包括服务器的搭建,Mysql数据库的建立及维护。

基于python的网络舆情系统通用框架相关推荐

  1. python网络安全毕业设计_基于Python的网络爬虫系统的设计与实现

    2018 年第 12 期 信息与电脑 China Computer&Communication 软件开发与应用 基于 Python 的网络爬虫系统的设计与实现 刘 杰 葛晓玢 闻顺杰 (铜陵职 ...

  2. 基于python的网络爬虫系统_基于Python对网络爬虫系统的设计与实现.pdf

    基于Python对网络爬虫系统的设计与实现.pdf 日期: 2020-08-02 01:17:51 人气: - 基于Python对网络爬虫系统的设计与实现软件研发与应用SOFTWARE DEVELOP ...

  3. 基于python的网络爬虫系统论文_python网络爬虫毕业论文

    {"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],&q ...

  4. 基于python食品安全溯源管理系统django框架计算机毕业设计源码+系统+数据库+lw文档+调试部署

    基于python食品安全溯源管理系统django框架计算机毕业设计源码+系统+数据库+lw文档+调试部署 基于python食品安全溯源管理系统django框架计算机毕业设计源码+系统+数据库+lw文档 ...

  5. python毕业设计开题报告-基于Python的教学互动系统的设计与实现开题报告

    基于Python的教学互动系统的设计与实现开题报告 背景: 在各种信息技术与课堂的不断探索中,我们一直在寻找一个能提高教学效率的方式,同时可以发现要提高教学效率,在课堂教学中必不可少的就是师生间的互动 ...

  6. 爬虫技术python流程图_基于Python的网络爬虫技术研究

    基于 Python 的网络爬虫技术研究 王碧瑶 [摘 要] 摘要:专用型的网络爬虫能够得到想要的返回结果 , 本文就以拉勾网作 为例子 , 对基于 Python 的网络爬虫技术进行研究和分析. [期刊 ...

  7. 基于python的网络爬虫编程_基于Python的网络爬虫程序设计

    程序设计 ●Program Design 基于 Python的网络爬虫程序设计 网络 信 息量 的迅 猛 增 长,对 如何从海量的信息中准确的搜索 到用户需要的信息提 出了极大的 挑战.网络爬 虫具有 ...

  8. python网络爬虫技术-基于Python的网络爬虫技术综述

    汪洋 姜新通 [摘 要]人类社会已经进入大数据时代,这正在改变着我们的工作和生活.随着互联网的兴起和发展,同时也产生了各种对人类有价值的数据.快速搜索数据和充分利用数据信息已成为一个巨大挑战.这样的需 ...

  9. python网络爬虫课程设计题目_山东建筑大学计算机网络课程设计《基于Python的网络爬虫设计》...

    山东建筑大学计算机网络课程设计<基于Python的网络爬虫设计> 山东建筑大学 课 程 设 计 成 果 报 告 题 目: 基于Python的网络爬虫设计 课 程: 计算机网络A 院 (部) ...

最新文章

  1. html基础:定义 图片 表格
  2. Microbiome:所谓的“富集培养”获得的微生物真的都是被“富集”出来的吗?(一作解读)...
  3. opencv-python 使用掩模抠图
  4. Python [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed 解决方法
  5. Jenkins deploy to container部署war到tomcat(学习笔记十六)
  6. jvm内存溢出分析实践案例:javax.crypto.JceSecurity大量BouncyCastleProvider实例无法被回收
  7. mysql读书笔记---if语句
  8. 20151208_使用windows2012配置weblogic节点管理器
  9. 基于fitter库判断已知数据服从分布——python
  10. 使用RMAN迁移文件系统数据库到ASM
  11. linux蜂鸣器控制实验,【Linux公开课】蜂鸣器使用、LCD背光控制、触摸屏校准、GPIO操作...
  12. 牛腩新闻发布系统 (6) 在线浮动的客服功能
  13. Kisssoft软件在行星齿轮设计上的初试
  14. ARCore:从Android Studio开始
  15. Kiwi browser 手机谷歌浏览器如何同步谷歌扩展插件
  16. 手把手教你如何做一套utm广告投放
  17. 怎样为Windows7系统设置快速启动栏
  18. Idea设置全白色 背景
  19. 西安交通大学计算机学院保研面试,西安交通大学电子与信息工程学院(专业学位)计算机技术保研细则...
  20. 计算机学哪个编程好,达内机器人编程VS计算机编程,学哪个最好

热门文章

  1. vxwork任务切换分析
  2. DAT NAT SAN FCoE
  3. 计算机二级基础知识点全部讲解,计算机二级基础知识点整理
  4. Xadmin自定义开发 笔记(一)
  5. 天猫精灵 python 控制_(二 -3-1) 天猫精灵接入Home Assistant-自动发现Mqtt设备--灯系列 实战...
  6. 四,产品创建和开发板连接天猫精灵后台
  7. ffmpeg将gif转换成mp4
  8. 如何使用css实现三角形?
  9. 基于Springboot实现OA办公系统
  10. google/uuid