文章目录

  • 前言
  • 题型
    • 名词解释
    • 简答题
    • 综合题
  • 第一章 绪论
    • 数据挖掘(Data Mining)定义★★
    • 机器学习(Machine Learning)定义★★
    • 人工神经网络(Artificial Neural Networks,ANNs)★★
    • 人工智能(Artificial Intelligence)
    • 大数据(Big Data)
      • 定义
      • 特征
    • 知识工程(Knowledge Engineering)
    • 广义知识(Generalization)
    • 关联知识(Association)
      • 定义
      • ⽬的
    • 爬虫★★
    • 传统数据仓库技术
    • OLTP(On-Line Transaction Processing)
    • OLAP(On-Line Analytic Processing)
    • 决策支持(Decision Support)
    • 事务数据库(Transaction Database)
    • 分布式数据库(Distributed Database)
  • 第二章 知识发现过程与应用结构
    • 知识发现★★
      • 定义★★
      • 知识发现的过程★
    • 阶梯处理过程模型
  • 第三章 关联规则挖掘理论和算法
    • 项目集格空间理论
      • 定义
    • Apriori算法★★
      • 定义
      • 主要步骤
      • 伪代码★★
        • 算法3-1 Apriori(发现频繁项目集)
        • 算法3-2 apriori-gen (Lk−1)(L_{k-1})(Lk−1​) 候选集产生
      • 例题
    • CLOSE算法★★
      • 原理
      • 闭合项目集
      • 算法步骤
      • 例题★
      • 闭合项集(Closed Itemset)及其支持度★★
  • 第四章 分类方法(监督学习)
    • 分类★★
      • 定义
      • 目的
    • KNN★★
      • 定义★
      • 伪代码★★
      • 例题
    • ID3★★
      • 信息熵★★
      • 信息增益
        • 定义
        • 公式★
      • 伪代码★★
      • 例题 4-5★
    • EM算法★★
      • 定义★★
      • 步骤★★
      • 举例(不考)
  • 第五章 聚类(无监督学习)
    • 聚类★★简答题
      • 定义
      • 目的
    • 基本概念
    • 评价准则
    • 距离函数★
      • 距离条件
      • 明可夫斯基距离
        • 欧氏距离★
        • 曼哈顿距离★
        • 切比雪夫距离
      • 余弦相似度★
        • 余弦距离(二维)
        • 余弦相似度(多维)
      • Jaccard距离
    • k-means(划分聚类)★★
      • 考点
      • 算法描述★★
      • 伪代码★★(AB卷有一个考了)
      • 优缺点★★(AB卷有一个考了)
        • 主要优点
        • 主要缺点
      • 例题
    • K 中心点算法(k-medoid)★★
      • 只考了简答题
      • 定义★★(简答题)
      • 例题
    • AGNES(凝聚的层次聚类)★★
      • 定义★★名词解释
      • 伪代码★★
      • 例题
    • DIANA(分裂的层次聚类)★★
      • 考察方式:大题★
      • 定义★★名词解释
      • 伪代码★★大题
      • 例题 5-4
    • DBSCAN★超级重点
      • 考查方式:简答题、综合题共20分
      • 噪声点
      • 边界点★
      • 定义★
      • 特点
      • 算法描述★★
      • 相关概念
      • 伪代码(算法描述)★★10分
      • 优缺点★★简答题
        • 优点
        • 缺点
      • 例题★
  • 第六章 时间序列和序列模式挖掘
    • 时间序列挖掘
      • 时间序列★★名词解释
      • 什么是时间序列挖掘★★简答题
        • 定义
        • 作用★★
  • 第七章 Web挖掘技术
    • Web挖掘的价值
    • Web挖掘的类型
    • Web挖掘的含义
    • Web挖掘的主要数据源★★
    • PageRank
      • 页面等级(评级)的评价方法★
      • PageRank的核⼼思想
      • 简单pagerank模型(不考)
        • 例题
        • 步骤
      • 基于随机冲浪的PageRank算法(考)
        • PPT例题
        • 书上例题 7-1
        • 定义★
        • 伪代码★★
    • HITS
      • 定义
      • 权威页面★★简答题
      • 中心页面★★简答题

前言

推荐lyf大佬的笔记

  1. 首先感谢提供过线索的所有人(lyf,lqx,ly,hcy,zyx,llz…),感谢负责任的老师

    hnust 数据挖掘原理与算法期中考试复习资料相关推荐

    1. hnust 湖南科技大学 2023 安卓 期中考试 复习资料

      前言 ★:录音中提到的 ✦:推测考点 致谢:hwl,lqx,ly,sw 重点来源:7-8班 PPT和录音 内容来源:PPT 知识点大多很抽象,需要联系实际代码来理解 多做1-9章课后习题,编程题可以不 ...

    2. [渝粤教育] 西南科技大学 电子商务原理及应用 在线考试复习资料

      电子商务原理及应用--在线考试复习资料 一.单选题 1.( )接受商家的送货要求,将商品送到消费者手中. A.邮局 B.快递公司 C.送货公司 D.物流中心 2.卓越属于( )类型的B2C电子商务企业 ...

    3. [渝粤教育] 西南科技大学 微机原理与应用 在线考试复习资料(1)

      微机原理与应用--在线考试复习资料 一.单选题 1.十六进制数0A95转换成二进制数是? A.1010 1001 0101 B.0000 1010 0101 C.1000 1010 1001 D.00 ...

    4. [渝粤教育] 西南科技大学 单片机原理与应用 在线考试复习资料(2)

      单片机原理与应用--在线考试复习资料 一.单选题 1.信息能够同时双向传送的是( ). A.并行通信 B.单工串行通信 C.半双工串行通信 D.全双工串行通信 2.T89S52单片机片内有( )个定时 ...

    5. [渝粤教育] 西南科技大学 编译原理与技术 在线考试复习资料2021版

      编译原理与技术--在线考试复习资料2021版 一.单选题 1.下列选项中,能由语义分析检查出的是( ). A.花括号不配对 B.变量未声明就使用 C.程序中有非法符号 D.表达式错误 答案:看左边查询 ...

    6. [渝粤教育] 西南科技大学 办公自动化原理及应用 在线考试复习资料(1)

      办公自动化原理及应用--在线考试复习资料 一.单选题 1.在文档窗口中,同时可编辑多个EXCEL工作簿,但在同一时刻工作簿窗口的标题栏颜色最深的是( ) A.活动 B.临时 C.正式 D.数据源 2. ...

    7. [渝粤教育] 西南科技大学 办公自动化原理及应用 在线考试复习资料

      办公自动化原理及应用--在线考试复习资料 一.单选题 1.在文档窗口中,同时可编辑多个EXCEL工作簿,但在同一时刻工作簿窗口的标题栏颜色最深的是( ) A.活动 B.临时 C.正式 D.数据源 2. ...

    8. [渝粤教育] 西南科技大学 电子商务原理及应用 在线考试复习资料(1)

      电子商务原理及应用--在线考试复习资料 一.单选题 1.( )接受商家的送货要求,将商品送到消费者手中. A.邮局 B.快递公司 C.送货公司 D.物流中心 2.卓越属于( )类型的B2C电子商务企业 ...

    9. 数据挖掘原理与算法:对森林火灾影响因素的分析

      数据挖掘原理与算法:对森林火灾影响因素的分析 一.介绍 Forest Fire Area Prediction of the burnt area by forest fires Overview T ...

    10. 数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}

      数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...

    最新文章

    1. 函数式编程语言python-写 Python 代码不可不知的函数式编程技术
    2. ubuntu安装ffmpeg_安装 Jellyfin 开始肥宅生活
    3. Linux下shel脚本之批量修改文件扩展名
    4. android studio scala插件,Scala 语言开发Andorid ,开发环境的搭建(一)
    5. 2021-01-16 英文写作中“因为”
    6. SQL基础【六、and与or】
    7. IE 7.0抛弃Win2000用户?(zz)
    8. 内核使用硬件ip的dma,dma_alloc_coherent 与 dma_alloc_writecombine (转)
    9. stm32的rxcallback再debug界面显示没有编译,uC/OS-III
    10. 07 SQL优化技术
    11. django 项目中使用项目环境制作脚本 通过终端命令运行脚本文件(management/commands)...
    12. 地理图例大全整理初中
    13. WPS 表格中单元格文字后插入公式
    14. 【Vue】以登录token为例,理解vuex状态管理使用
    15. linux的vps主机安装图形界面并远程访问
    16. 插空排序C语言(直接插入排序)
    17. 威尔·史密斯[Will Smith]
    18. 个人深度学习keras环境配置介绍
    19. 安卓动态调试七种武器之孔雀翎 – Ida Pro – 蒸米
    20. 27岁985土木工程研究生,半路出家进军Java,打拼三年后,现在月收入30k+

    热门文章

    1. 三足鼎立 – Mac 输入法横向对比
    2. sony android mp3播放器,劲能小钢炮!Sony ZX505 播放器动耳听:云音乐也HiFi
    3. 一键配置以太网IP脚本
    4. 蛋糕店选址该注意什么,如何了解客群画像和竞品情况
    5. python snownlp了解_[Python][snownlp]基于情感词典的情感分析
    6. Centos7安装WPS
    7. 165. 小猫爬山(状压dp)
    8. Mysql调优大全梳理(涵盖90%需要调优的场景)
    9. MyBatis源码阅读指南
    10. 几个轻巧好用的代码检查工具!代码不在坏味道