1.逻辑回归怎么实现多分类

方式一:修改逻辑回归的损失函数,使用 softmax 函数构造模型解决多分类问题,softmax 分 类模型会有相同于类别数的输出,输出的值为对于样本属于各个类别的概率,最后对于样本进行 预测的类型为概率值最高的那个类别.

方式二:根据每个类别都建立一个二分类器,本类别的样本标签定义为 0,其它分类样本标签 定义为 1,则有多少个类别就构造多少个逻辑回归分类器 若所有类别之间有明显的互斥则使用softmax 分类器,

若所有类别不互斥有交叉的情况则构造相应类别个数的逻辑回归分类器.

2.SVM 中什么时候用线性核什么时候用高斯核?

当数据的特征提取的较好,所包含的信息量足够大,很多问题是线性可分的那么可以采用线性核.若特征数较少,样本数适中,对于时间不敏感,遇到的问题是线性不可分的时候可以使用高 斯核来达到更好的效果.

3.什么是支持向量机,SVM 与 LR 的区别?

支持向量机为一个二分类模型,它的基本模型定义为特征空间上的间隔最大的线性分类器.而它的学习策略为最大化分类间隔,最终可转化为凸二次规划问题求解.

LR 是参数模型,SVM 为非参数模型.LR 采用的损失函数为 logistical loss,而 SVM 采用的是 hinge loss.在学习分类器的时候,SVM 只考虑与分类最相关的少数支持向量点.LR 的模型相对简单,在进行大规模线性分类时比较方便.

4.监督学习和无监督学习的区别

输入的数据有标签则为监督学习,输入数据无标签为非监督学习.

5.机器学习中的距离计算方法?

6. 朴素贝叶斯(naive Bayes)法的要求是?

朴素贝叶斯属于生成式模型,学习输入和输出的联合概率分布.给定输入 x,利用贝叶斯概率定理求出最大的后验概率作为输出 y.

7.训练集中类别不均衡,哪个参数最不准确?

举例,对于二分类问题来说,正负样例比相差较大为 99:1,模型更容易被训练成预测较大占比的类别.因为模型只需要对每个样例按照 0.99 的概率预测正类,该模型就能达到 99% 的准确率.

8.如果数据有问题,怎么处理;

1.上下采样平衡正负样例比;2.考虑缺失值;3.数据归一化

9.LR 和线性回归的区别

线性回归用来做预测,LR 用来做分类.线性回归是来拟合函数,LR 是来预测函数.线性回归用最小二乘法来计算参数,LR 用最大似然估计来计算参数.线性回归更容易受到异常值的影响, 而 LR 对异常值有较好的稳定性.

10.分类算法列一下有多少种?应用场景.

单一的分类方法主要包括:LR 逻辑回归,SVM 支持向量机,DT 决策树,NB 朴素贝叶斯,NN 人工神经网络,K-近邻;

集成学习算法:基于 Bagging 和 Boosting 算法思想,RF 随机森林,GBDT, Adaboost,XGboost.

11.SVM 的损失函数

12. 核函数的作用

核函数隐含着一个从低维空间到高维空间的映射,这个映射可以把低维空间中线性不可分的 两类点变成线性可分的.

13.SVM 为什么使用对偶函数求解

对偶将原始问题中的约束转为了对偶问题中的等式约束,而且更加方便了核函数的引入,同 时也改变了问题的复杂度,在原始问题下,求解问题的复杂度只与样本的维度有关,在对偶问题下, 只与样本的数量有关.

14.ID3,C4.5 和 CART 三种决策树的区别

ID3 决策树优先选择信息增益大的属性来对样本进行划分,但是这样的分裂节点方法有一个很大的缺点,当一个属性可取值数目较多时,可能在这个属性对应值下的样本只有一个或者很少 个,此时它的信息增益将很高,ID3 会认为这个属性很适合划分,但实际情况下叫多属性的取值会 使模型的泛化能力较差,所以 C4.5 不采用信息增益作为划分依据,而是采用信息增益率作为划分 依据.但是仍不能完全解决以上问题,而是有所改善,这个时候引入了 CART 树,它使用 gini 系数 作为节点的分裂依据.

面试必备资源!程序员面试——算法工程师面试大全第二部分相关推荐

  1. 程序员转行算法工程师-四个月总结

    程序员转行算法工程师-四个月总结 前言 学习感受 年后计划 我的想法 前言 经过四个半月的学习,培训的理论学习已经完成,年后将开始实战课程学习,总结一下现在的感受和以后的规划吧,这是一篇处于迷茫时期的 ...

  2. 【面试必备】java开发转算法工程师

    今年互联网形式依旧严峻,再次爆发几次大规模裁员潮.我决定把这篇文章分享出来帮助那些对前途感到迷茫的朋友. 在猎头的眼里,我已不是根正苗红的程序员.何为根正苗红?计算机专业毕业,从毕业起就从事特定方向的 ...

  3. 网易python面试经验_Python程序员应该如何准备面试

    当前Python语言的上升趋势非常明显,随着大数据和人工智能领域的发展,Python语言未来的应用前景还是非常值得期待的.另外,Python语言在Web开发.嵌入式开发和各种后端服务开发中也扮演着重要 ...

  4. Interview:人工智能岗位面试—人工智能岗位求职之机器学习算法工程师必备知识框架结构图

    Interview:人工智能岗位面试-人工智能岗位求职之机器学习算法工程师必备知识框架结构图 目录 机器学习算法工程师思维导图 机器学习算法工程师思维导图 后期继续更新-- 1.思维导图01

  5. 找到所有数组中消失的数字_【一点资讯】千万程序员的呼声:面试如何拿到大厂Offer?这份阅读量超过11W+的算法刷题宝典请你原地查收 www.yidianzixun.com...

    如何才能通过面试拿到大厂Offer? "刷leetcode!" 这是我听到最多的回答! 现在越来越多的人应聘工作时都得先刷个几十百来道题,不刷题感觉都过不了面试. 无论是面测试.算 ...

  6. 程序员编程艺术:面试和算法心得

    本文转载至:http://taop.marchtea.com/ 本书是July和他伙伴们的<程序员编程艺术>的电子书 <程序员编程艺术:面试和算法心得> 目录 第一部分 数据结 ...

  7. 《程序员编程艺术:面试和算法心得》链接

    转载自: http://taop.marchtea.com/index.html The Art of Programming By July 本书是July和他伙伴们的<程序员编程艺术> ...

  8. 算法工程师面试问题及相关资料集锦(附链接)

    来源:专知 本文约9800字,建议阅读20分钟. 本文为你介绍算法工程师面试问题及相关资料集锦,相当全面,值得收藏. 目录 算法工程师 Github.牛客网.知乎.个人博客.微信公众号.其他 机器学习 ...

  9. 算法工程师面试问题及资料超详细合集(多家公司算法岗面经/代码实战/网课/竞赛等)

    这里是算法江湖,传授AI武林秘籍. 资源目录: 一.算法工程师 Github.牛客网.知乎.个人博客.微信公众号.其他 二.机器学习 面试问题.资料.代码实战 三.深度学习 面试.资料.代码实战Pyt ...

  10. 面试了一个程序员,只因这一个细节,被我一眼看穿是培训班出来的,没啥工作经验...

    首先,我说一句:培训出来的,优秀学员大有人在,我不希望因为带着培训的标签而无法达到用人单位和候选人的双向匹配,是非常遗憾的事情. 最近,在网上看到这样一个留言,引发了程序员这个圈子不少的轰动. &qu ...

最新文章

  1. java concurrenthashmap与阻塞队列
  2. Android开发--实现对话框(AlertDialog)
  3. kotlin与java对比
  4. 里程碑 .Net7再更新,从此彻底碾压Java!
  5. 西门子逻辑运算指令_西门子S7-200 SMART逻辑运算指令应用实例
  6. mysql用命令修改主键名_MySQL的常用命令:添加外键,修改字段名称,增加字段 设置主键自增长等...
  7. tensorflow--forword(前向传播)
  8. 算法:动态规划,最大子数组之和 Maximum Subarray
  9. 差速转向机器人数学模型
  10. linux更换输入法_一日一Linux之一:CentOS 8.1 王者荣耀
  11. python爬携程上出境游数据_Python爬虫 —— 携程机票数据
  12. python pytz_python – 找不到符合要求pytz的版本
  13. 如何把PDF中的英文翻译成中文
  14. Albumentation使用指南
  15. python中运行代码时没有报错但是也没有输出而且还有exit code 0的结束标志
  16. 笔记本能ping通但是telnet不通
  17. Linux下轻型编辑器geany如何格式化代码
  18. asp.net 调试 无法显示该网页
  19. 内存数据库中的索引技术
  20. [转]根本原因分析(Root Cause Analysis)

热门文章

  1. V神:预计1个月左右将推出完全兼容EVM的Rollup
  2. 普及风险管理的一些环节
  3. [脚本编程] 过云盾、D盾各种盾shell
  4. python3.6+selenium_使用外部数据的数据驱动
  5. linux定时任务总结。
  6. ThinkPHP之add、save无法添加、修改的解决方案
  7. ASP.NET AJAX,WCF,ADO.NET Entity 开发实例
  8. [导入]正则表达式学习心得体会(3)(转)
  9. 互利网上数字金融典型场景: 网络营销
  10. Python: 自定义类对象序列化为Json串