一# 2018级暑期项目实训开题总结


目录

  • 一、实训题目名称及导师信息
  • 二、项目背景
  • 三、项目要求
  • 四、实训目标
  • 五、系统功能
    • 1、系统架构模块图
    • 2、智能人物画像综合分析系统功能模块
      • (1)智能数据融合模块
      • (2)用户画像模块
      • (3)数据可视化模块
  • 六、技术方案
  • 七、系统认识
  • 八、任务
  • 总结


提示:以下是本篇文章正文内容,仅供参考,严禁抄袭

一、实训题目名称及导师信息

智能人物画像综合分析系统
导师:陶可猛、隋金雁、潘云
导师单位:浩睿智源(山东)人工智能有限公司

二、项目背景

用户画像是根据用户基本属性、社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。系统通过用户自行上传或埋点上报收集记录了用户大量信息,为便于各业务应用,将这些信息进行沉淀、加工和抽象,形成一个以用户标志为主key的标签树,用于全面刻画用户的属性和行为信息,构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过国内外指定网站数据获取,结合算法模型,综合分析用户行为画像,构建立体化的人物分析系统。

使用科学的算法构建知识图谱,知识图谱为系统中异构、动态的数据表达、组织、管理以及利用提供了一种更为有效的方式,使得系统的智能化水平更高,更加接近于人类的认知思维。利用数据挖掘、关联分析、知识图谱等技术,提取评估人员的行为模式、精神状态、情绪状态等变化规律,建立用户行为画像模型,用户画像实际上是围绕画像服务的目标群体的关键特征的集合,根据现实反馈不断迭代。

构建该系统需要解决的关键问题是:
一、信息采集:通过技术方法实现国内、国外指定网站进行数据获取。
二、构建人物画像,将收集到的用户基本属性、行为特征等收集到的数据通过行为建模,抽象出用户标签,实现数据采集、存储、在线浏览、多视图、多维度等基本功能。
三、构建知识图谱。通过知识抽取技术,可以从半结构化、非结构化的数据中提取出实体、关系、属性等知识要素,将其知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库,使用知识推理,在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。

三、项目要求

1.软件操作简便、快捷,能够将多源数据进行多维度、多角度、多视图形式的展示,并对其进行在线综合分析的可视化操作。
2.界面设计风格统一,便于操作员快速掌握系统操作方法;用户界面简单明了,符合业务流程,具有人性化特点。
3.软件设计结构模块化、程序结构化、数据格式标准化、代码统一化,各种文档资料规范化。

四、实训目标

强化学生的动手能力;让学生体验人物画像分析这一业务领域的数据处理流程及综合展示技术方法;提高学生对软件工程方法、技术、工具、过程和管理的整体化理解;加强学生的团队意识;提高学生自主解决问题、协作解决问题的能力。

五、系统功能

1、系统架构模块图

2、智能人物画像综合分析系统功能模块

智能人物画像综合分析系统分为三大部分:智能数据融合模块、用户画像模块、数据可视化模块。智能数据融合模块主要是对自定义数据采集的网站进行数据抓取、数据存储、数据处理;用户画像模块是对采集的用户信息进行沉淀、加工和抽象,标注特征标识;数据可视化模块主要是从多个维度、多角度进行数据综合展示。

(1)智能数据融合模块

该模块主要是通过系统设定的三个国内热门站点,如网易、新浪微博、雅虎,国外三个热门站点,如facebook、Twitter、YouTube,作为数据采集源,提取正文、关键词等信息,为后续的数据展示分析做好基础。采集的数据入库后,界面中可以导出成word格式文档,文档中的文本内容可以实现中文、英文智能化翻译。

(2)用户画像模块

该模块主要根据采集到的数据信息,通过模型算法进行特征提取,将用户标签化,可以借助聚类和分类等技术进行用户画像的构建。根据特定人物的信息数据得到个人画像,并为其智能化打标签,得到用户数据的整体统一综合视图。

(3)数据可视化模块

该模块主要是将影像数据有效的组织展示,进行用户的数据分布分析、用户行为分析、知识图谱构建及数据可视化等。

六、技术方案

系统架构:采用B/S架构,无需操作系统对其配置的要求,省去了繁琐的配置和安装过程,只需一个浏览器便可。用户通过浏览器对系统的进行访问、操作,浏览器将读取用户的操作和输入。

开发工具:IntelliJ IDEA、pycharm等
数据库:MySQL8.0
程序框架:SpringCloud分布式框架
前端:Vue前端技术
开发方式:前后端分离
数据可视化:可以采用百度Echarts,d3.js等来实现。
在线诊断:可以采用深度学习框架tensorflow,采用RNN、 LSTM、逻辑回归等模型对数据进行训练和预测。

七、系统认识


通过python爬虫技术将输入传入数据库并且向java部分提供接口,java部分实现从数据库或python提供的接口取出数据并渲染到页面。
java主要实现数据可视化,python负责爬取数据并利用模型或算法进行分析。

八、任务

1、学习前后端分离的开发方法,前端vue,后端springboot。
2、学习eCharts等数据可视化方法。
3、学习使用java调用接口,主要是调取python提供的接口。

总结

这次开发与以往所作的实验和课设均不相同,有规范的流程,项目进行所需要的各种文档,明确的分工,同学们相互之间的协作,以及没有学过的开发技术。
明确短期学习目标,先将前后端分离开发基础打好,以便于更好地完成项目。

山东大学暑期实训——智能人物画像综合分析系统相关推荐

  1. 智能人物画像综合分析系统——Day15

    今天终于将已做好的数据进行了汇总,并发现了许多问题. 因为YouTube的反爬策略过于严格,李想同学的进度受阻,我们在反复讨论并且尝试无果后,我将世界日报的爬取工作交给了他,来丰富我们的数据种类. 另 ...

  2. 山东大学暑期实训-饮食健康管理系统设计与实现(一)

    山东大学暑期实训-饮食健康管理系统设计与实现(一) 环境配置篇(一) python环境配置 环境配置篇(一) python环境配置 使用Anaconda配置python环境,Python环境选择3.8 ...

  3. 暑期实训21组第一周个人工作总结

    2022.6.21 参加暑期实训开题会议 下午13:30,参加由队长主持的队内的第一次全体线上会议,主要明确项目的内容.要点.技术.人员.分工等问题: 下午15:00,参加由英特尔的指导老师主持的答疑 ...

  4. 【百家稷学】深度学习计算机视觉生产实习(山西农业大学暑期实训)

    继续咱们百家稷学专题,本次是有三AI在山西农业大学开设的为期10天的正式暑期专业课程.百家稷学专题的目标,是走进100所高校和企业进行学习与分享. 本次主题 本次实训是在山西农业大学进行,主题是< ...

  5. 暑期实训总结_李小倩

    暑期实训总结 姓名:李小倩  学号:111307105 班级:CSDN-java班 年级:2011级 转眼间实训已经结束有些时间了,我想这个实训对于我们参与的每一个人来说都是一段美好快乐的记忆.记得距 ...

  6. 暑期实训心得及总结_史国旭

    暑期实训心得及总结                     姓名:史国旭  学号:111307168 班级:CSDN-java 年级:2011级 转眼间实训已经结束4天了,我想这个实训对于我们参与的每 ...

  7. 计算机暑期实训报告,计算机专业暑期实训报告总结范文

    <计算机专业暑期实训报告总结范文>由会员分享,可在线阅读,更多相关<计算机专业暑期实训报告总结范文(4页珍藏版)>请在人人文库网上搜索. 1.计算机专业暑期实训报告总结范文 计 ...

  8. 项目实训 - 智能车系统 - 第七周记录

    项目实训 - 智能车系统 - 第七周记录 日期:4.04 – 4.10 项目进度 本周工作进展: 更换了底层的通信框架(shm) 熟悉速腾雷达驱动,以及ros相关驱动,为二次开发驱动做准备 1.更换底 ...

  9. 单片机实训智能洗衣机

    单片机实训智能洗衣机 目录 单片机实训智能洗衣机 第一部分 内容介绍 第二部分 实训代码 第三部分 硬件仿真电路 第四部分 设计过程 1.安装软件 2.仿真图绘制 3.编写代码 4.装载hex文件 第 ...

  10. 单片机实训与毕业设计开放式训练系统QY-DPJ14

    一.系统概述: QY-DPJ14单片机实训与毕业设计开放式训练系统是根据机电工学中有关"数字电子"."模拟电子"."单片机应用技术".&qu ...

最新文章

  1. 史上最大规模 DDoS 攻击,每秒 1720 万次 HTTP 请求
  2. hadoop中MapReduce中压缩的使用及4种压缩格式的特征的比较
  3. Windows 曝漏洞 —— 影响所有版本
  4. Oracle Eneterprise Linux 5.8上安装Database 12c
  5. @Override的错误
  6. Swoole 自定义项目初始化事件处理的实现
  7. Solr4.7从数据库导数据
  8. BugkuCTF解题报告---WEB
  9. SAP Fiori Elements 概述
  10. es6 --- Promise.catch
  11. 迷宫问题(信息学奥赛一本通-T1255)
  12. 浅谈App对我们行业门户网站的作用
  13. 小数点进位 oracle,使用多个小数点(。)对Oracle中的记录进行排序
  14. 实战!手把手教你如何编写一个Linux驱动并写一个支持物联网的LED演示demo
  15. 如何在“家庭”应用中创建场景?
  16. visual studio运行时库MT、MTd、MD、MDd
  17. fh 幅频特性曲线怎么画fl_测量rc带通滤波器的幅频特性和相频特性-电子科技大学.ppt...
  18. Centos7安装maven
  19. I2C 挂死,SDA一直为低问题分析
  20. PHP之Smarty

热门文章

  1. 算法与数据结构学习资源大搜罗——良心推荐
  2. Word文档中对号以及对号外加方框的输入教程
  3. 人物传记:Kyle Tedford:耐心与思考是优秀交易者的必备素质
  4. 如何证明pi是无理数
  5. c语言编译器tc2.0,Wintc软件下载
  6. 芯邦主控芯片CBM2199E量产工具设置
  7. socket.io实现简易版群聊
  8. 博图SCL 选择排序
  9. win 11 无法打出中文句号问题(中/英文标点切换) 微软五笔输入法
  10. 零点存在定理与介值定理