深度特征合成

深度特征合成(Deep Feature Synthesis, DFS)是一种用于对关系和时间数据执行特征工程的自动化方法。

输入数据

DFS需要结构化的数据集才能执行特征工程。以下演示使用的是模拟客户交易数据集。

运行DFS

通常,没有自动化特征工程的情况下,数据科学家会编写代码以汇总客户的数据,并应用不同的统计功能,从而产生量化客户行为的功能。在此示例中,专家可能对一下特征感兴趣:sessions的总数/customer注册的月份。
将target_entity指定为customer并且将“count”和“month”指定为原语primitives时,DFS可以生成这些功能。

上例中,“count”是一个聚合原语(aggregation primitive),因为它基于与一个customer相关的许多sessions来计算单个值。“month”是一个转换原语(transform primitive),因为它将一个customer的一个值转换为另一个。

创建“深度特征”

DFS的名称源于该算法能够堆叠原语以生成更复杂特征的能力。每次堆叠原语时,都会增加特征的“深度”。max_depth参数控制DFS返回功能的最大深度。

选择其中一个深度为2的生成特征了解一下:

该特征为每一个customer:(1)计算每个session的所有交易金额,得到每个session的总金额;(2)然后将均值应用于多个sessions的总金额,以确定每个session花费的平均金额。
举例:为每个customer计算他们开始session时 最常见的时间

改变目标实体

DFE功能强大,可以为数据集中任何实体创建特征矩阵。将目标实体切换为session,那么可以为每个session综合功能。

上例中,DFS也可以对父实体构建深度特征。比如:计算session的customer的平均交易额。

参考官方链接:Deep Feature Synthesis

Featuretools 学习3 - 深度特征合成相关推荐

  1. 特征工程之自动特征生成(自动特征衍生)工具Featuretools——深度特征合成

    深度特征合成 深度特征合成(DFS)是一种用于对关系数据和时间数据执行特征工程的自动方法. 输入数据 深度特征合成需要结构化数据集才能执行特征工程.为了演示DFS的功能,我们将使用客户交易数据集. I ...

  2. 深度特征合成与遗传特征生成,两种自动特征生成策略的比较

    来源:Deephub Imba 本文约1800字,建议阅读8分钟 本文我们将通过一个示例介绍如何使用 ATOM 包来快速比较两种自动特征生成算法. 特征工程是从现有特征创建新特征的过程,通过特征工程可 ...

  3. 机器学习的未来——深度特征融合

    摘要: 深度特征融合是一项能够克服机器学习不足,为机器学习打开通往未来大门的新技术.新技术要不要了解一下? 即使是最敏锐的技术布道师也无法预测大数据对数字革命的影响.因为他们最初的关注点都聚焦在了扩大 ...

  4. 旷视提Circle Loss,统一优化视角,革新深度特征学习范式 | CVPR 2020

    作者 | 旷视研究院 本文是旷视 CVPR 2020的被收录论文解读第.它提出用于深度特征学习的Circle Loss,从相似性对优化角度正式统一了两种基本学习范式(分类学习和样本对学习)下的损失函数 ...

  5. CVPR 2020 Oral | 旷视提出Circle Loss,革新深度特征学习范式

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文系旷视研究院投稿 本文是旷视CVPR2020论文系列解读第4篇, ...

  6. CVPR 2020 Oral | 旷视研究院提出Circle Loss,革新深度特征学习范式

    IEEE 国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision and Pattern Recognition) 将于 6 月 14 ...

  7. CVPR 2020 Oral | 人脸识别Loss新突破: 旷视提出Circle Loss,革新深度特征学习范式...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 来源:旷视研究院@微信公众号 旷视研究院提出用于深度特征学习的Circle Los ...

  8. 直播 | Circle Loss:从对相似性优化的统一视角进行深度特征学习

    「PW Live」是 PaperWeekly 的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义, ...

  9. 旷视提出Circle Loss,革新深度特征学习范式 |CVPR 2020 Oral

    本文提出用于深度特征学习的Circle Loss,从相似性对优化角度正式统一了两种基本学习范式(分类学习和样本对学习)下的损失函数.通过进一步泛化,Circle Loss 获得了更灵活的优化途径及更明 ...

最新文章

  1. Prefix HDU - 5790 字典树 + 主席树
  2. 台式机计算机怎么分割,编辑手把手教程 如何给电脑硬盘分区
  3. Report Style
  4. js中图片获取src的正则
  5. 第六天 购车程序
  6. Jmeter中的几个重要测试指标释义
  7. Oracle_PL/SQL(3) 游标
  8. 射频百科 | 高速射频连接器
  9. ICEM CFD学习笔记(2)
  10. 医学超声成像—合成孔径法(Synthetic Aperture Methods)[1]
  11. 2020爬取美赛数学成绩
  12. 双向搜索(bfs,dfs)
  13. 巨人10Q4财报:营收3.6亿元环比增8.7%
  14. 基础SQL Server 操作问题——仅当使用了列表并且IDENTITY_INSERT为ON时,才能为表中的标识列制定显示值
  15. linux 终端 主题 配色方案,自定义 Windows Terminal 终端界面与配色方案
  16. 特斯拉音乐线圈周围的电场信号
  17. Contextual Word Representations and Pretraining
  18. linux命令红帽,红帽linux命令
  19. mini-batch_Spring Batch教程– ULTIMATE指南
  20. LuaPlus使用入门

热门文章

  1. c android显示gif动画,MFC显示GIF动画图片
  2. C语言练习-统计数字个数
  3. 薛兆丰经济学思维研究:权利在真实生活中的硬度
  4. Tasker实现的app界面实时翻译 - 界面翻译4.0
  5. git 删除本地仓库
  6. 基于机器视觉的表面缺陷检测方法研究进展(2022最新)
  7. educode寄存器设计与应用之节拍脉冲发生器的设计(在Logisim上实现)
  8. Opencv图像特征点提取(
  9. 【了解结构体与指针、数组、函数、字符串之间的关系】(学习笔记14--结构体)
  10. ChatGpt - 基于人工智能检索进行论文写作