● L1和L2正则化的区别

参考回答:

L1是模型各个参数的绝对值之和,L2为各个参数平方和的开方值。L1更趋向于产生少量的特征,其它特征为0,最优的参数值很大概率出现在坐标轴上,从而导致产生稀疏的权重矩阵,而L2会选择更多的矩阵,但是这些矩阵趋向于0。

● 问题:Loss Function有哪些,怎么用?

参考回答:

平方损失(预测问题)、交叉熵(分类问题)、hinge损失(SVM支持向量机)、CART回归树的残差损失

● 问题:线性回归的表达式,损失函数;

参考回答:

线性回归y=wx+b,w和x可能是多维。线性回归的损失函数为平方损失函数。

解析:一般会要求反向求导推导

● 线性回归的损失函数

参考回答:

● 机器学习:知道哪些传统机器学习模型

参考回答:

常见的机器学习算法:

1).回归算法:回归算法是试图采用对误差的衡量来探索变量之间的关系的一类算法。回归算法是统计机器学习的利器。 常见的回归算法包括:最小二乘法(Ordinary Least Square),逻辑回归(Logistic Regression),逐步式回归(Stepwise Regression),多元自适应回归样条(Multivariate Adaptive Regression Splines)以及本地散点平滑估计(Locally Estimated Scatterplot Smoothing)。

2).基于实例的算法:基于实例的算法常常用来对决策问题建立模型,这样的模型常常先选取一批样本数据,然后根据某些近似性把新数据与样本数据进行比较。通过这种方式来寻找最佳的匹配。因此,基于实例的算法常常也被称为“赢家通吃”学习或者“基于记忆的学习”。常见的算法包括 k-Nearest Neighbor(KNN), 学习矢量量化(Learning Vector Quantization, LVQ),以及自组织映射算法(Self-Organizing Map,SOM)。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。

3).决策树学习:决策树算法根据数据的属性采用树状结构建立决策模型, 决策树模型常常用来解决分类和回归问题。常见的算法包括:分类及回归树(Classification And Regression Tree,CART),ID3 (Iterative Dichotomiser 3),C4.5,Chi-squared Automatic Interaction Detection(CHAID), Decision Stump, 随机森林(Random Forest),多元自适应回归样条(MARS)以及梯度推进机(Gradient Boosting Machine,GBM)。

4).贝叶斯方法:贝叶斯方法算法是基于贝叶斯定理的一类算法,主要用来解决分类和回归问题。常见算法包括:朴素贝叶斯算法,平均单依赖估计(Averaged One-Dependence Estimators,AODE),以及Bayesian Belief Network(BBN)。

5).基于核的算法:基于核的算法中最著名的莫过于支持向量机(SVM)了。基于核的算法把输入数据映射到一个高阶的向量空间,在这些高阶向量空间里,有些分类或者回归问题能够更容易的解决。常见的基于核的算法包括:支持向量机(Support Vector Machine,SVM), 径向基函数(Radial Basis Function,RBF),以及线性判别分析(Linear Discriminate Analysis,LDA)等。

6).聚类算法:聚类,就像回归一样,有时候人们描述的是一类问题,有时候描述的是一类算法。聚类算法通常按照中心点或者分层的方式对输入数据进行归并。所以的聚类算法都试图找到数据的内在结构,以便按照最大的共同点将数据进行归类。常见的聚类算法包括 k-Means算法以及期望最大化算法(Expectation Maximization,EM)。

7).降低维度算法:像聚类算法一样,降低维度算法试图分析数据的内在结构,不过降低维度算法是以非监督学习的方式试图利用较少的信息来归纳或者解释数据。这类算法可以用于高维数据的可视化或者用来简化数据以便监督式学习使用。常见的算法包括:主成份分析(Principle Component Analysis,PCA),偏最小二乘回归(Partial Least Square Regression,PLS),Sammon映射,多维尺度(Multi-Dimensional Scaling, MDS), 投影追踪(Projection Pursuit)等。

8).关联规则学习:关联规则学习通过寻找最能够解释数据变量之间关系的规则,来找出大量多元数据集中有用的关联规则。常见算法包括 Apriori算法和Eclat算法等。

9).集成算法:集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。集成算法的主要难点在于究竟集成哪些独立的较弱的学习模型以及如何把学习结果整合起来。这是一类非常强大的算法,同时也非常流行。常见的算法包括:Boosting,Bootstrapped Aggregation(Bagging),AdaBoost,堆叠泛化(Stacked Generalization,Blending),梯度推进机(Gradient Boosting Machine, GBM),随机森林(Random Forest)。

10).人工神经网络:人工神经网络算法模拟生物神经网络,是一类模式匹配算法。通常用于解决分类和回归问题。人工神经网络是机器学习的一个庞大的分支,有几百种不同的算法。(其中深度学习就是其中的一类算法,我们会单独讨论),重要的人工神经网络算法包括:感知器神经网络(Perceptron Neural Network), 反向传递(Back Propagation),Hopfield网络,自组织映射(Self-Organizing Map, SOM)。学习矢量量化(Learning Vector Quantization, LVQ)。

机器学习面试-处理回归问题相关推荐

  1. 机器学习面试——逻辑回归和线性回归

    1.什么是广义线性模型(generalize linear model)? 普通线性回归模型是假设X为自变量,Y为因变量,当X是一维的,y是一维的,共进行n次观测,则 其中,w是待估计的参数,称为回归 ...

  2. 27场机器学习面试后,来划个概念重点吧

    机器之心报道 编辑:小舟 机器学习面试宝典,有这一本就够了. 在机器学习和数据科学岗位的面试中,机器学习领域的概念是经常考察的内容.一位近期经过 27 次 AI 领域面试(包括 Google 等大型公 ...

  3. 机器学习面试:这25个实用又有深度的问题

    机器学习面试可以有趣且有深度么? 这是你的机器学习系统? --嗯对呀!把数据倒进这堆线性代数,然后在另一端迎接答案. 那答案是错的怎么办? --搅一搅,拌一拌,答案就会越来越对了... 大多数数据科学 ...

  4. 业界丨涨薪20%!听听这位资深机器学习面试官的内心独白

    在营长的众多死党微信群,营长发现,大家很爱谈论机器学习面试,也是,毕竟面试表现越好,银子也能谈得越高,能把自己卖个好价钱,当然关心了. 对于这个话题最为关注的,莫过于研究生毕业的孩纸,和有两.三年工作 ...

  5. [机器学习] 面试常见问题+解析汇总

    机器学习面试题的分类 The first really has to do with the algorithms and theory behind machine learning. You'll ...

  6. 深度学习机器学习面试问题准备(必会)

    深度学习机器学习面试问题准备(必会) 第一部分:深度学习 1.神经网络基础问题 (1)Backpropagation(要能推倒)  后向传播是在求解损失函数L对参数w求导时候用到的方法,目的是通过链式 ...

  7. [面试笔试整理1]:深度学习机器学习面试问题准备(必会)

    此系列三篇文章的原文链接 面试笔试整理1:深度学习机器学习面试问题准备(必会) 1.神经网络基础问题 (1)Backpropagation(要能推倒) 后向传播是在求解损失函数L对参数w求导时候用到的 ...

  8. BAT机器学习面试1000题系列(第1~305题

    1 请简要介绍下SVM,机器学习 ML模型 易SVM,全称是support vector machine,中文名叫支持向量机.SVM是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同 ...

  9. BAT机器学习面试1000道

    本文转载自: https://blog.csdn.net/sinat_35512245/article/details/78796328 1.请简要介绍下SVM. SVM,全称是support vec ...

  10. BAT机器学习面试1000题系列(第150~279题)

    首页 博客 学院 下载 GitChat TinyMind 论坛 问答 商城 VIP 活动 招聘 ITeye CSTO 写博客 发Chat leadai的博客 RSS订阅 转 BAT机器学习面试1000 ...

最新文章

  1. JQuery 动态创建表单,并自动提交
  2. SAP MM ME57界面看到的供应源跟Source List主数据不一致?
  3. 2022新年重磅技术分享|深入理解Linux操作系统
  4. 全年营业额怎么计算_门店盈亏平衡计算及案例分析 | 商品管理
  5. python SimpleHTTPServer 快速共享文件
  6. TikZ绘图示例——尺规作图: 圆内接正五边形的近似画法
  7. 蓝桥杯 ALGO-140 算法训练 P1101
  8. 动态规划 分享巧克力 4794_包装|颇具艺术欣赏性的巧克力创意包装设计
  9. 资源搜索神器 海量精品资源教程 大大啦啦资源神器
  10. SPSS-描述统计与图示分析
  11. android x86 联网,没有网络连接 – VMWare Fusion上的Android-x86
  12. Python | Web Crawler
  13. python炒股难度_诺贝尔奖得主教你如何分配炒股仓位 | python量化系列
  14. 怎么用控制面板卸载软件?(简单 有图)
  15. 英雄联盟无法开始第二局(已解决,亲测有效)
  16. 基于51单片机的心形流水灯
  17. Java 的历史和版本
  18. 魔界战记修复服务器,怪物猎人世界steam坏档修复方法 MHW存档备份修复方法
  19. 网购平台比价系统的实现
  20. MySQL超市会员管理系统_springboot+mysql超市会员管理系统

热门文章

  1. 移动前端的一些坑和解决方法(外观表现)
  2. (转) EF三种编程方式的区别Database first ,Model first ,code first
  3. KCP - A Fast and Reliable ARQ Protocol
  4. 520 简单表白代码(JS)
  5. python全栈开发-Day3 字符串
  6. Coursera-AndrewNg(吴恩达)机器学习笔记——第一周
  7. 【2017-5-21】问题总结 Session,Cookie,登录状态保持
  8. readline,readlines,read函数
  9. asp,jsp,php等web开发必懂技术---什么时候使用静态页,什么时候必须使用动态页...
  10. jQuery图片垂直滚动焦点图