学习笔记,仅供参考,有错必纠

关键词:机器学习 , 分布变化 , 流数据 , 模型重用 , 集成学习 , 动态环境


基于决策树模型重用的分布变化流数据学习

摘要

在很多真实应用中 , 数据以流的形式不断被收集得到 . 由于数据收集环境往往发生动态变化 ,流数据的分布也会随时间不断变化 . 传统的机器学习技术依赖于数据独立同分布假设 , 因而在这类分布变化的流数据学习问题上难以奏效 .

本文提出一种基于决策树模型重用的算法进行分布变化的流数据学习 . 该算法是一种在线集成学习方法 : 算法将维护一个模型库 , 并通过决策树模型重用机制更新模型库 . 其核心思想是希望从历史数据中挖掘与当前学习相关的知识 , 从而抵御分布变化造成的影响 . 通过在合成数据集和真实数据集上进行实验 , 我们验证了本文提出方法的有效性.

引言

机器学习技术在诸多领域得到了广泛应用 , 包括图像、视频、语音、文本处理等 [1∼3] . 传统的机器学习技术假定数据分布是恒定的 , 但数据收集的环境通常是开放动态的 , 因而数据分布恒定这一假设往往难以满足 . 特别在诸如天气预测、股票价格预测、语音识别等真实应用场景中 , 数据以流的形式不断被在线得到 , 随着时间不断累积 , 数据分布往往会随着收集环境的动态变化而不断变化 . 传统的机器学习算法及理论依赖于数据同分布假设 , 难以适用于这类分布不断变化的流数据问题 . 因而 , 针对分布变化的流数据 , 如何设计性能良好且有理论保障的学习算法是非常重要的课题.

首先需要明确的是 ,

文献记录(part67)--基于决策树模型重用的分布变化流数据学习相关推荐

  1. 基于翻译模型(Trans系列)的知识表示学习

    翻译模型(Trans) 解决问题:知识表示与推理 将实体向量表示(Embedding)在低维稠密向量空间中,然后进行计算和推理. 主要应用:triplet classification, link p ...

  2. 文献记录(part82)--基于监督联合去噪模型的社交网络链接预测

    学习笔记,仅供参考,有错必纠 关键词:社交网络分析 , 预测 , 监督学习 , 社区网络 , 矩阵 " 去噪 ", 弱大数定律 基于监督联合去噪模型的社交网络链接预测 摘要 社交网 ...

  3. 文献记录(part52)--基于度相关性的病毒传播模型及其分析

    学习笔记,仅供参考,有错必纠 关键词:互联网拓扑:度相关性:病毒传播:DPR 算法:SIS-DVDI: 基于度相关性的病毒传播模型及其分析 摘要 近年来网络病毒传播已对网络安全构成严重威胁 . 研究表 ...

  4. 文献记录(part55)--基于分布式非负矩阵分解的大规模主题社区挖掘

    学习笔记,仅供参考,有错必究 关键词:复杂网络:主题社区挖掘:非负矩阵分解:MapReduce:梯度下降 基于分布式非负矩阵分解的大规模主题社区挖掘 摘要 复杂网络的主题社区挖掘具有重要的应用价值 , ...

  5. 文献记录(part80)--基于平均互信息的最优社区发现方法

    学习笔记,仅供参考,有错必纠 关键词:AMI-COPRA 算法 ;AMI-GN 算法 ;平均互信息 ;AMI 方法 ;社区发现; 基于平均互信息的最优社区发现方法 摘要 本文提出一种基于平均互信息的最 ...

  6. 文献记录(part75)--基于最大平均熵率的大数据关联聚类算法

    学习笔记,仅供参考,有错必纠 基于最大平均熵率的大数据关联聚类算法 摘要 聚类是数据挖掘和机器学习中的基本任务之一 . 传统聚类方法由于其设计中对簇结构假设的限制 , 导致算法在不符合其假设的数据集上 ...

  7. 文献记录(part73)--基于 PCA 的信息压缩 : 从一阶到高阶

    学习笔记,仅供参考,有错必究 关键词:主成分分析 , 信息压缩 , 高阶张量 , Tucker 分解 , 各向异性 文章目录 基于 PCA 的信息压缩 : 从一阶到高阶 摘要 引言 从一阶PCA到高阶 ...

  8. 文献记录(part65)--基于用户聚类的异构社交网络推荐算法

    学习笔记,仅供参考,有错必纠 关键词 :社交网络:推荐系统:聚类算法:图摘要:数据挖掘 文章目录 基于用户聚类的异构社交网络推荐算法 摘要 引言 GCCR总体框架 基于用户聚类的异构社交网络推荐算法 ...

  9. 文献记录(part61)--基于不完备数据聚类的缺失数据填补方法

    学习笔记,仅供参考,有错必纠 关键词: 数据填补:不完备数据:聚类:约束容差集合差异度 基于不完备数据聚类的缺失数据填补方法 摘要 缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失 ...

最新文章

  1. 慢慢学Linux驱动开发,第十章,GNU C的扩展
  2. python输出数据格式_这串数据有什么方法用python输出我想要的格式?
  3. java 合并流_使用流执行聚合
  4. gitlab 安装_Linux学习14CentOS安装gitlab环境
  5. 基于Python实现对各种数据文件的操作
  6. C++ Lambda表达式基本用法
  7. lsqnonlin函数_matlab非线性最小二乘函数
  8. Java成神之路——javaAgent(插桩,attach)
  9. 智能交通|智慧产业园区管理系统集成搭建
  10. 牛客多校训练AFJ(签到)
  11. WinForGIFSicle 1.0.0.1 免费开源版,基于GIFSicle的开源可视化批量GIF压缩工具
  12. Java-设计模式学习笔记-总结
  13. UI设计(用户界面设计)的好处
  14. Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering 论文阅读
  15. Python:向ndarray中插入一个元素
  16. Flyte简介:云原生机器学习和数据处理平台
  17. hdmiout 68411升级
  18. java timestamp 格式化_java日期处理(Timestamp)
  19. 浅谈备受开发者好评的.NET core敏捷开发工具,讲讲LEARUN工作流引擎
  20. Oracle11g字符集AL32UTF8修改为ZHS16GBK详解

热门文章

  1. spark 常用函数介绍(python)
  2. spring-boot使用spring-security进行身份认证(1)
  3. javascript生成器
  4. wkhtmltopd 下载安装以及php环境下的使用
  5. OpenCV与Qt:IplImage转换为QImage
  6. SSH框架整合遇到的错误——org.springframework.beans.NotWritablePropertyException:
  7. 短视频APP开发:短视频特效SDK功能火爆来袭!
  8. cocos2dx3.0五种屏幕适配模式,及FIXED_WIDTH、FIXED_HEIGHT使用
  9. Vue-router(二) 子路由(嵌套路由)
  10. 课后作业之字符串加密