问题

Q1 从3.27求w和b,为什么不能直接让它的导数等于0来求?

你说的方法是解析法,但是实际问题很复杂,很难求得精确解,所以一般要用数值法(拟牛顿法等)来求近似解。

Q2 1.为什么推导logistic回归时需要用到极大似然法,推导最小二乘解时却不需要?在什么情况下需要用到极大似然?2.牛顿迭代二阶导,为啥是对βT求导?

逻辑回归是统计学的角度,用样本估计总体分布的参数,所以用最大似然。最小二乘法,是从数学分析的角度来求解的。完全两个不同的解决问题的途径。 牛顿迭代只是那种数学公式形式,对转置求导,也是对其中的变量求导啊,与是否转置没太大关系啊,不必太纠结。

Q3 代码里的 y_train = df_train[‘class’] - 1 是什么意思?这里为什么要这样做?

为了让类别从0开始计数

Q4 对于线性不可分的数据,为什么用核方法升维在SVM上可以起到很好的效果,而在LR上很容易出现过拟合?

个人觉得 svm有一定的软间隔,即安全距离,所以泛化能力强一些。仅供参考,没有理论支撑。

Q5 能不能解释下判别式模型和生成式模型,何种属于判别式模型,何种属于生成式模型?

判别模型就是直接建模,直接建立一个判别的拟合函数,生成模型就是间接建模计算。这属于文字的概念,影响不大。

Q6 请问5人组队参加相比单人参加有哪些具体优势吗?然后如果是多人参加应该怎么分工比较好

每个人用自己的方法做到最好成绩,然后5个模型进行融合,成绩应该会有提高。融合就是5个人的分类结果,少数服从多数。

Q7 请问只有一般的Windows笔记本电脑但是想学linux该怎么办…因为以后总是要用到是装虚拟机还是双系统还是换电脑

ubuntu18.04用refuns做个启动盘安装,里面有选择双系统并存,非常简单。

Q8 我看有人说做机器学习或深度学习最好用linux系统,就算mac系统也要比windows好用。是真的吗

当然用linux啊,很多代码都是在linux下进行开发的,只不过初学者先windows入手,但在这个比赛中来讲,没啥区别

Q9 lg = LogisticRegression(C=4, dual=True) 里dual参数的用处是什么?

目标函数转换成对偶函数,易于优化

Q10 我现在做了一些特征,就是文章的长度,怎么和两个特征结合啊,他们的类型不一样啊

可以尝试着把各个特征都归一化

Q11 对于数据集严重偏斜的问题,除了smote,ensemble这些方法以外,还有什么处理技巧?在上述方法无效的情况下,如何处理数据?

一般就是上下采样/不同类别赋予不同的权重/ensemble.先验分布主要就是以部分样本估计总体分布的思想,所以是估计

Q12 做lstm,如果要用batch normalization,那输入数据的预处理,是否可以直接让bn做就行?还是说仍然要注意输入数据处理后的分布?

cnn里面也有bn,但是仍然需要做预处理,所以我的个人建议是预处理仍然要做,bn会重新normalize,然后学一个新的分布,所以最坏的情况只是多做了一个normalize

Q13 那个l1正择化和l2有什么本质的区别吗

当然本质区别了,l1可以让一些变量等于0,l2可以让一些变量趋向0

分享

S1 对数几率回归推导,并附代码实现

对数几率回归 —— Logistic Regression

S2 帮助大家理解SVM
机器学习第二阶段:机器学习经典算法(5)——支持向量机

机器学习_周志华_问题汇总_第1周相关推荐

  1. 周志华:“数据、算法、算力”人工智能三要素,在未来还要加上“知识”

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源:AI科技评论 作者:李雨晨 2020 年 8 月 7 日,全球人工智能和机器人峰会(CC ...

  2. 机器学习_周志华_问题汇总_第2周

    问题 Q1 如果我想分析一下文本分类错误的原因,应该从哪些方面入手? 可以去分析一下哪个类别错误率高,然后看看这个类别的是否不平衡,针对这个类别看看能不能进行改进. 还有就是数据量过少,或是数据质量较 ...

  3. 机器学习_周志华(西瓜书) 课后习题答案 第一章 Chapter1

    机器学习_周志华 课后习题答案 第一章 Chapter1 习题1.1 Q:表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间. 由所给出的数据集(训练集)可知,属性3个:色泽.根蒂.敲声, ...

  4. 周志华《机器学习》课后习题(第七章):贝叶斯分类

    作者 | 我是韩小琦 链接 | https://zhuanlan.zhihu.com/p/51768750 7.1 试使用极大似然法估算回瓜数据集 3.0 中前 3 个属性的类条件概率. 答: 以第一 ...

  5. 周志华 《机器学习初步》模型评估与选择

    周志华 <机器学习初步>模型评估与选择 Datawhale2022年12月组队学习 ✌ 文章目录 周志华 <机器学习初步>模型评估与选择 一.泛化能力 二.过拟合和欠拟合 泛化 ...

  6. 《机器学习》周志华 学习笔记

    <机器学习>周志华 学习笔记 第一章 绪论 1.1 引言 机器学习:致力于研究如何通过计算的手段,利用经验来改善系统自身的性能. 经验:"经验"通常以"数据& ...

  7. 周志华 机器学习初步 线性模型

    周志华 <机器学习初步> 线性模型 还未更新完,会持续更新 文章目录 周志华 <机器学习初步> 线性模型 一.线性回归 1.线性模型 线性模型的特点和重要性 线性模型的基本形式 ...

  8. 机器学习(周志华) 第九章聚类

    关于周志华老师的<机器学习>这本书的学习笔记 记录学习过程 本博客记录Chapter9 文章目录 1 聚类任务 2 性能度量 3 距离计算 4 原型聚类 4.1 k均值算法 4.2 学习向 ...

  9. 【吃瓜教程】周志华机器学习西瓜书第三章答案

    线性模型结构梳理 3.1 试析在什么情形下式3.2中不必考虑偏置项b 答案一: 偏置项b在数值上代表了自变量取0时,因变量的取值: 1.当讨论变量x对结果y的影响,不用考虑b: 2.可以用变量归一化( ...

  10. 【读书笔记】周志华 机器学习 第二章 模型评估和选择

    第二章 模型评估和选择 1 欠拟合和过拟合 偏差和方差 1.1 欠拟合和过拟合 1.2 偏差和方差 2 评估方法 性能度量 2.1 评估方法 2.1.1 留出法 2.2.2 交叉验证法 2.2.3 自 ...

最新文章

  1. 抽象语法树 Abstract syntax tree
  2. boost::statechart模块实现无效结果复制测试
  3. [设计模式] ------ 装饰模式
  4. Summed-Area Variance Soft Shadow Mapping(SAVSM):二
  5. C++学习笔记(11) 重载流插入运算符和流提取运算符,以及自动类型转换
  6. 微信分享功能问题-描述内容换行,导致js加载失败
  7. dubbo 异步回调
  8. 倒计时 5 天!Apache Flink Meetup 7.10 北京站,Flink x TiDB 专场等你来!
  9. IDEA开发环境中maven 项目配置使用JDK9,JDK10,JDK11,JDK12等
  10. AI语音机器人有哪些需要注意事项
  11. 计算机硬件系统的主要性能指标
  12. 安卓怎么转移到iphone_如何将联系人从iPhone转移到另一部电话
  13. 手把手教你VirtualBox安装Centos,全网最全教程
  14. air dots 配对_Redmi AirDots可以作为iphone的合格伴侣吗?
  15. Linux中系统的分区管理
  16. 怎么提升个人的代码编写能力
  17. 树、二叉树、满二叉树、完全二叉树、二叉树的重要性质及其存储结构
  18. 用matlab代码写一下jackknife方法的校正步骤?、
  19. 在LiCO中实现模型训练
  20. Ubuntu 18.04 安装 xdm 2018 ( Xtreme Download Manager 2018 )

热门文章

  1. webform repeater
  2. Java与UML交互图
  3. 【建模必备】遗传算法的定义与生物学基础
  4. 如何利用C#开发“通讯录”小程序
  5. U盘中毒了?教你如何删除System Volume Information这个顽固文件夹
  6. 阿里云蒋江伟:我们致力于为世界提供70%的算力 | 凌云时刻
  7. GitHub标星近1万:只需5秒音源,这个网络就能实时“克隆”你的声音
  8. 超阿里、大华,澎思科技行人再识别(ReID)技术刷新三大数据集记录
  9. 10万人的1000万张图像,微软悄然删除最大公开人脸数据集
  10. 弃Java、Swift于不顾,为何选Python?