算法工程师进化-基础理论
1 引言
算法工程师需要掌握的基础理论包括bias-variance tradeoff,VC Dimension,信息论,正则化,最优化理论;其中从面试的角度来看,bias-variance tradeoff和正则化是重点考察的内容。本文主要总结和学习bias-variance tradeoff和VC Dimension。
2 bias-variance tradeoff
所谓bias-variance tradeoff,是指偏差和方差权衡,它是解释机器学习模型的重要工具。
2.1 基本概念
偏差度量了学习算法的期望预测和真实结果的偏离程度,刻画了学习算法本身的拟合能力;
方差度量了同样大小的训练集的变动所导致的学习性能的变化,刻画了数据扰动所造成的影响;
噪声表达了当前任务上任何学习算法所达到的期望泛化误差的下界;
2.2 图形化定义
从图中可以看出:
- 对于某一真实值(红靶心),模型基于相同大小的训练集可以预测出多种结果,可以看出该模型的偏差和方差;
- 一般而言,偏差大往往指的是欠拟合,方差大指的是过拟合;
2.3 面试常考点
- 基于偏差和方差分析RF和GBDT的区别
随机森林(RF)作为一种集成学习方法,它是基于bagging的思想,能够降低方差提高模型的性能;
GBDT作为另一种集成学习方法,它是基于boosting的思想,能够降低偏差来提高模型的性能;
关于这两种方法在降低偏差和方差的证明,见为什么说bagging是减少variance,而boosting是减少bias?
- 基于偏差和方差分析K折交叉验证的K值
当K值大的时候,我们会有更少的偏差,更多的方差;原因:K值越大,数据的分布与原数据集分布类似,因此方差大;
当K值小的时候,我们会有更多的偏差,更少的方差;原因:K值越小,数据的分布与原数据集分布相差太大,因此偏差大;
2.4 参考博客
Bias-Variance Tradeoff(权衡偏差与方差)
3 VC Dimension
VC Dimension是统计学习理论用来衡量函数集性能的一种指标,VC维越大,则学习过程越复杂;但是目前并没有通用的理论来计算函数集的VC维,只知道一些特殊函数集的VC维,例如P维线性函数的VC维为P+1。
3.1 基本概念
对于一个指示函数集,如果存在h个数据样本能够被函数集中的函数按所有可能的2^h种形式分开,则称函数集能够把h个数据样本打散。则函数集的VC维就是能打散的最大数据样本数目h。
- 举个例子,对于二维线性指示函数,无论3个数据样本怎么安排,二维线性指示函数都能给你安排的明明白白的(打散),但是对于4个样本,那就没法安排了,见下图;因此二维线性指示函数的VC维为3;
- 对于能够把任意数目的数据样本安排好的函数集(打散),该函数集的VC维为无穷大;
- 一般而言,函数集弯曲程度越大,函数集的VC维越大,模型越复杂;
3.2 面试常考点
关于VC维的面试考点,我还没有遇到过,但是我觉得重点是要理解VC维的意义,它可以衡量模型的复杂度和灵活度,VC维越高的模型,模型越复杂,学习过程也越复杂。
后续如果遇到VC维的考点,继续补充;
3.3 参考资料
统计学习中的VC维是什么意思?
4 信息论
在机器学习领域,信息论的相关知识十分重要,例如在决策树里面就出现了信息增益和信息增益率的概念。下面对信息论的一些概念做一个系统的总结。
4.1 信息熵
熵是每条消息中包含信息的平均量,它是不确定性的度量,越随机的信号源其熵越大;
4.2 联合熵
度量二维随机变量的不确定性;
4.3 条件熵
已知其中一个变量,求另一个变量的平均不确定性;
4.4 相对熵
KL散度,又称为信息散度和信息增益,它主要是用来衡量两个分布的相似度;
4.5 互信息
相对熵是衡量同一变量的两个一维分布之间的相似性,而互信息是用来衡量两个相同的一维分布变量的独立性;
转载于:https://www.cnblogs.com/dailinfly/p/9135557.html
算法工程师进化-基础理论相关推荐
- 差分进化算法_特邀嘉宾 | 科普差分进化算法(创新奇智运筹优化算法工程师朱小龙博士)...
文案:段克邪 排版:随心390 hello,大家好.各位可点击此处,访问公众号官方店铺.谨防上当受骗,感谢各位支持! 今天我们有幸请到创新奇智运筹优化算法工程师朱小龙博士为大家科普差分进化算法,本次推 ...
- 推荐算法工程师的成长之道
作者 | gongyouliu 来源 | 大数据与人工智能(ID: ai-big-data) 本文,作者会基于自己的实践经验讲述推荐算法工程师的成长之道,这里的"道"有发展路径和道 ...
- 一份来自贾扬清的AI修炼指南:不存在算法工程师,调参侠没有市场
作者 | 陈彩娴.蒋宝尚 编辑 | 青 暮 算法工程师不仅需要具备牛逼的算法能力,还要精通业务.善于沟通?(小本子赶紧记下来!) 8月23日晚,知乎直播"AI时代听大咖聊"邀请到A ...
- 【资源】NLP 算法工程师相关的面试题
点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要4分钟 跟随小博主,每天进步一丢丢 作者 | songyingxin https://github.com/songyingxin/NLPer- ...
- 自然语言处理算法工程师历史最全资料汇总-基础知识点、面试经验
2019年秋招已过,零星的招聘任然在继续.本资源适用于NLP算法工程师面试,也适用于算法相关的其他岗位.整理了算法面试需要数学基础知识.编程语言.深度学习.机器学习.计算机理论.统计学习.自然语言处理 ...
- 听听阿里老哥对算法工程师技术学习路线的建议
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源丨https://zhuanlan.zhihu.com/p/192633890 前言 知乎 ...
- 如何“快”、“准”、“狠”成为优秀算法工程师
如何"快"."准"."狠"成为优秀算法工程师 https://www.cnblogs.com/DicksonJYL/p/9713948.ht ...
- 北京内推 | 启元实验室招聘视觉感知算法工程师(北京事业单位)
合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 启元实验室 启元实验室成立于 2020 年 7 月,由北京市人民政府设立, ...
- 深圳招聘 | 元象唯思:决策AI研发工程师、NLP算法工程师(可实习)
合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 元象唯思 元象(XVerse)将前沿科技,特别是人工智能.云渲染.视频编解 ...
最新文章
- 基于简化点云地图的语义边缘对齐的单目定位方法
- 微信小程序API·目录
- 蓝桥杯 错误票据 (stringstream的使用)
- c# xmlhttp POST提取远程webservice数据
- GridView 配合模板实现 合并单元格(多列)
- 奥维地图导入西安坐标_带了坐标的照片,要上天了
- jsbridge实现及原理_Hybrid APP基础篇(四)-JSBridge的原理
- 【MySQL】Could not initialize master info structure
- java opts配置_JAVA_OPTS设置参数
- 用Python做证券指数的三种策略分析
- OpenXml 之 Excel 复制插入行
- mysql数据库character_关于MySQL如何修改character
- 回望2022,依然值得仰望星空
- 一年级abb式词语并造句_abb词语造句,用ABB词语造句
- 关于DS12C887 以外部RAM方式访问
- IDEA在一个窗口创建多个项目
- KEIL4 的操作技巧
- 项目经理/小组长的职责
- 12Cr2Mo1R(H)化学成分
- P型MOS管开关电路及工作原理详解-KIA MOS管
热门文章
- python数值类型的操作_Python学习笔记,数值类型及操作
- 为什么开发人员要使用Linux
- 'qapplicationapp'在此作用域中尚未声明 linux,qt 编译问题总结
- 数组乱码_python 爬虫随笔-土办法治乱码
- python tcl smb_Python——操作smb文件服务器(上传和下载)
- 【算法】斐波那契(黄金分割法) 查找算法
- 【正则表达式】正则表达式
- 【Elasticsearch】elasticsearch 磁盘相关常用配置 磁盘优化
- Maven打包Package执行插件的顺序
- 【Flink】flink报错:This type GenericType pojo cannot be used as key