Featuretools 学习3 - 深度特征合成
深度特征合成
深度特征合成(Deep Feature Synthesis, DFS)是一种用于对关系和时间数据执行特征工程的自动化方法。
输入数据
DFS需要结构化的数据集才能执行特征工程。以下演示使用的是模拟客户交易数据集。
运行DFS
通常,没有自动化特征工程的情况下,数据科学家会编写代码以汇总客户的数据,并应用不同的统计功能,从而产生量化客户行为的功能。在此示例中,专家可能对一下特征感兴趣:sessions的总数/customer注册的月份。
将target_entity指定为customer并且将“count”和“month”指定为原语primitives时,DFS可以生成这些功能。
上例中,“count”是一个聚合原语(aggregation primitive),因为它基于与一个customer相关的许多sessions来计算单个值。“month”是一个转换原语(transform primitive),因为它将一个customer的一个值转换为另一个。
创建“深度特征”
DFS的名称源于该算法能够堆叠原语以生成更复杂特征的能力。每次堆叠原语时,都会增加特征的“深度”。max_depth参数控制DFS返回功能的最大深度。
选择其中一个深度为2的生成特征了解一下:
该特征为每一个customer:(1)计算每个session的所有交易金额,得到每个session的总金额;(2)然后将均值应用于多个sessions的总金额,以确定每个session花费的平均金额。
举例:为每个customer计算他们开始session时 最常见的时间
改变目标实体
DFE功能强大,可以为数据集中任何实体创建特征矩阵。将目标实体切换为session,那么可以为每个session综合功能。
上例中,DFS也可以对父实体构建深度特征。比如:计算session的customer的平均交易额。
参考官方链接:Deep Feature Synthesis
Featuretools 学习3 - 深度特征合成相关推荐
- 特征工程之自动特征生成(自动特征衍生)工具Featuretools——深度特征合成
深度特征合成 深度特征合成(DFS)是一种用于对关系数据和时间数据执行特征工程的自动方法. 输入数据 深度特征合成需要结构化数据集才能执行特征工程.为了演示DFS的功能,我们将使用客户交易数据集. I ...
- 深度特征合成与遗传特征生成,两种自动特征生成策略的比较
来源:Deephub Imba 本文约1800字,建议阅读8分钟 本文我们将通过一个示例介绍如何使用 ATOM 包来快速比较两种自动特征生成算法. 特征工程是从现有特征创建新特征的过程,通过特征工程可 ...
- 机器学习的未来——深度特征融合
摘要: 深度特征融合是一项能够克服机器学习不足,为机器学习打开通往未来大门的新技术.新技术要不要了解一下? 即使是最敏锐的技术布道师也无法预测大数据对数字革命的影响.因为他们最初的关注点都聚焦在了扩大 ...
- 旷视提Circle Loss,统一优化视角,革新深度特征学习范式 | CVPR 2020
作者 | 旷视研究院 本文是旷视 CVPR 2020的被收录论文解读第.它提出用于深度特征学习的Circle Loss,从相似性对优化角度正式统一了两种基本学习范式(分类学习和样本对学习)下的损失函数 ...
- CVPR 2020 Oral | 旷视提出Circle Loss,革新深度特征学习范式
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文系旷视研究院投稿 本文是旷视CVPR2020论文系列解读第4篇, ...
- CVPR 2020 Oral | 旷视研究院提出Circle Loss,革新深度特征学习范式
IEEE 国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision and Pattern Recognition) 将于 6 月 14 ...
- CVPR 2020 Oral | 人脸识别Loss新突破: 旷视提出Circle Loss,革新深度特征学习范式...
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 来源:旷视研究院@微信公众号 旷视研究院提出用于深度特征学习的Circle Los ...
- 直播 | Circle Loss:从对相似性优化的统一视角进行深度特征学习
「PW Live」是 PaperWeekly 的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义, ...
- 旷视提出Circle Loss,革新深度特征学习范式 |CVPR 2020 Oral
本文提出用于深度特征学习的Circle Loss,从相似性对优化角度正式统一了两种基本学习范式(分类学习和样本对学习)下的损失函数.通过进一步泛化,Circle Loss 获得了更灵活的优化途径及更明 ...
最新文章
- Prefix HDU - 5790 字典树 + 主席树
- 台式机计算机怎么分割,编辑手把手教程 如何给电脑硬盘分区
- Report Style
- js中图片获取src的正则
- 第六天 购车程序
- Jmeter中的几个重要测试指标释义
- Oracle_PL/SQL(3) 游标
- 射频百科 | 高速射频连接器
- ICEM CFD学习笔记(2)
- 医学超声成像—合成孔径法(Synthetic Aperture Methods)[1]
- 2020爬取美赛数学成绩
- 双向搜索(bfs,dfs)
- 巨人10Q4财报:营收3.6亿元环比增8.7%
- 基础SQL Server 操作问题——仅当使用了列表并且IDENTITY_INSERT为ON时,才能为表中的标识列制定显示值
- linux 终端 主题 配色方案,自定义 Windows Terminal 终端界面与配色方案
- 特斯拉音乐线圈周围的电场信号
- Contextual Word Representations and Pretraining
- linux命令红帽,红帽linux命令
- mini-batch_Spring Batch教程– ULTIMATE指南
- LuaPlus使用入门