基于python的网络舆情系统通用框架
一、前言
网络舆情是目前各类企业和机构研究的热点内容,舆情数据种类繁多衍生出各类舆情系统。舆情系统的数据来源可以通过数据网站进行购卖,更多的可以利用网络爬虫技术进行数据爬取。舆情系统整体上应具有数据采集、数据分析、信息预警等基本功能。利用python丰富的外部库可以快速进行系统的搭建及开发,笔者根据相关的项目经验设计了一套基于python的舆情通用框架,用于快速搭建舆情数据产品。
二、 系统总体框架
系统包括展示层、业务层、数据维护层、数据库四个模块。采用django作为web服务器框架,echarts作为数据的展示框架,mysql为数据库框架技术。
(一) 展示层
主要负责数和分析结果的展示及交付。展示层包含两个部分,第一部分是基于与平台的web页面数据展示模块。第二部分是邮寄预警模块。
(二) 业务层
业务层主要包括数据采集模块、数据清洗模块、分析建模模块、预警模块。
a) 数据采集模块是基于python/java的爬虫程序,涉及的主要技术包括:正则化表达式、Beautiful Soup 4包、Selenium、Xpath、网站破解、人工智能验证码识别、代理服务器地址库构建。数据采集模块负各大网站售票数据采集。
b) 清洗模块是基于python/java的数据处理程序,涉及的主要技术包括:pandas包、pymysql、numpy等。清洗模块负责数据格式规划化、统一化,以及部分数据的计算。
c) 分析建模模块是基于python/java算法模型,涉及的主要技术包括:神经网络、SVM、决策树、逻辑回归、Boosting、Bagging、HMM等算法。分析建模模块主要分析模型的建立。
d) 预警模块负责根据甲方提供的重大信息建模预警规则,将信息第一时间通过邮寄或其他即时通讯的形式实施交付。
(三) 数据维护层
层主要包括SQL模块、ETL模块、自动化模块。SQL模块主责数据库基本操作、查询、删改、索引等。ETL模块负责多个表的数据传输、整合。自动化模块负责系统的自动运营。
(四) 数据库
主要包括服务器的搭建,Mysql数据库的建立及维护。
基于python的网络舆情系统通用框架相关推荐
- python网络安全毕业设计_基于Python的网络爬虫系统的设计与实现
2018 年第 12 期 信息与电脑 China Computer&Communication 软件开发与应用 基于 Python 的网络爬虫系统的设计与实现 刘 杰 葛晓玢 闻顺杰 (铜陵职 ...
- 基于python的网络爬虫系统_基于Python对网络爬虫系统的设计与实现.pdf
基于Python对网络爬虫系统的设计与实现.pdf 日期: 2020-08-02 01:17:51 人气: - 基于Python对网络爬虫系统的设计与实现软件研发与应用SOFTWARE DEVELOP ...
- 基于python的网络爬虫系统论文_python网络爬虫毕业论文
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],&q ...
- 基于python食品安全溯源管理系统django框架计算机毕业设计源码+系统+数据库+lw文档+调试部署
基于python食品安全溯源管理系统django框架计算机毕业设计源码+系统+数据库+lw文档+调试部署 基于python食品安全溯源管理系统django框架计算机毕业设计源码+系统+数据库+lw文档 ...
- python毕业设计开题报告-基于Python的教学互动系统的设计与实现开题报告
基于Python的教学互动系统的设计与实现开题报告 背景: 在各种信息技术与课堂的不断探索中,我们一直在寻找一个能提高教学效率的方式,同时可以发现要提高教学效率,在课堂教学中必不可少的就是师生间的互动 ...
- 爬虫技术python流程图_基于Python的网络爬虫技术研究
基于 Python 的网络爬虫技术研究 王碧瑶 [摘 要] 摘要:专用型的网络爬虫能够得到想要的返回结果 , 本文就以拉勾网作 为例子 , 对基于 Python 的网络爬虫技术进行研究和分析. [期刊 ...
- 基于python的网络爬虫编程_基于Python的网络爬虫程序设计
程序设计 ●Program Design 基于 Python的网络爬虫程序设计 网络 信 息量 的迅 猛 增 长,对 如何从海量的信息中准确的搜索 到用户需要的信息提 出了极大的 挑战.网络爬 虫具有 ...
- python网络爬虫技术-基于Python的网络爬虫技术综述
汪洋 姜新通 [摘 要]人类社会已经进入大数据时代,这正在改变着我们的工作和生活.随着互联网的兴起和发展,同时也产生了各种对人类有价值的数据.快速搜索数据和充分利用数据信息已成为一个巨大挑战.这样的需 ...
- python网络爬虫课程设计题目_山东建筑大学计算机网络课程设计《基于Python的网络爬虫设计》...
山东建筑大学计算机网络课程设计<基于Python的网络爬虫设计> 山东建筑大学 课 程 设 计 成 果 报 告 题 目: 基于Python的网络爬虫设计 课 程: 计算机网络A 院 (部) ...
最新文章
- html基础:定义 图片 表格
- Microbiome:所谓的“富集培养”获得的微生物真的都是被“富集”出来的吗?(一作解读)...
- opencv-python 使用掩模抠图
- Python [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed 解决方法
- Jenkins deploy to container部署war到tomcat(学习笔记十六)
- jvm内存溢出分析实践案例:javax.crypto.JceSecurity大量BouncyCastleProvider实例无法被回收
- mysql读书笔记---if语句
- 20151208_使用windows2012配置weblogic节点管理器
- 基于fitter库判断已知数据服从分布——python
- 使用RMAN迁移文件系统数据库到ASM
- linux蜂鸣器控制实验,【Linux公开课】蜂鸣器使用、LCD背光控制、触摸屏校准、GPIO操作...
- 牛腩新闻发布系统 (6) 在线浮动的客服功能
- Kisssoft软件在行星齿轮设计上的初试
- ARCore:从Android Studio开始
- Kiwi browser 手机谷歌浏览器如何同步谷歌扩展插件
- 手把手教你如何做一套utm广告投放
- 怎样为Windows7系统设置快速启动栏
- Idea设置全白色 背景
- 西安交通大学计算机学院保研面试,西安交通大学电子与信息工程学院(专业学位)计算机技术保研细则...
- 计算机学哪个编程好,达内机器人编程VS计算机编程,学哪个最好