【天池智慧海洋建设】Topline源码——特征工程学习

目录


DataWhale智慧海洋学习完整链接地址
https://github.com/datawhalechina/team-learning-data-mining/blob/master/wisdomOcean

前言

topline代码开源学习,仅关注特征工程部分,具体为输入,输出,作用、原理及部分个人理解。

此部分为智慧海洋建设竞赛的特征工程模块,通过特征工程,可以最大限度地从原始数据中提取特征以供算法和模型使用。通俗而言,就是通过X,创造新的X’以获得更好的训练、预测效果。

“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”——机器学习界;

类似的,吴恩达曾说过:“特征工程不仅操作困难、耗时,而且需要专业领域知识。应用机器学习基本上就是特征工程。”

赛题:智慧海洋建设

特征工程的目的: