机器学习_周志华_问题汇总_第1周
问题
Q1 从3.27求w和b,为什么不能直接让它的导数等于0来求?
你说的方法是解析法,但是实际问题很复杂,很难求得精确解,所以一般要用数值法(拟牛顿法等)来求近似解。
Q2 1.为什么推导logistic回归时需要用到极大似然法,推导最小二乘解时却不需要?在什么情况下需要用到极大似然?2.牛顿迭代二阶导,为啥是对βT求导?
逻辑回归是统计学的角度,用样本估计总体分布的参数,所以用最大似然。最小二乘法,是从数学分析的角度来求解的。完全两个不同的解决问题的途径。 牛顿迭代只是那种数学公式形式,对转置求导,也是对其中的变量求导啊,与是否转置没太大关系啊,不必太纠结。
Q3 代码里的 y_train = df_train[‘class’] - 1 是什么意思?这里为什么要这样做?
为了让类别从0开始计数
Q4 对于线性不可分的数据,为什么用核方法升维在SVM上可以起到很好的效果,而在LR上很容易出现过拟合?
个人觉得 svm有一定的软间隔,即安全距离,所以泛化能力强一些。仅供参考,没有理论支撑。
Q5 能不能解释下判别式模型和生成式模型,何种属于判别式模型,何种属于生成式模型?
判别模型就是直接建模,直接建立一个判别的拟合函数,生成模型就是间接建模计算。这属于文字的概念,影响不大。
Q6 请问5人组队参加相比单人参加有哪些具体优势吗?然后如果是多人参加应该怎么分工比较好
每个人用自己的方法做到最好成绩,然后5个模型进行融合,成绩应该会有提高。融合就是5个人的分类结果,少数服从多数。
Q7 请问只有一般的Windows笔记本电脑但是想学linux该怎么办…因为以后总是要用到是装虚拟机还是双系统还是换电脑
ubuntu18.04用refuns做个启动盘安装,里面有选择双系统并存,非常简单。
Q8 我看有人说做机器学习或深度学习最好用linux系统,就算mac系统也要比windows好用。是真的吗
当然用linux啊,很多代码都是在linux下进行开发的,只不过初学者先windows入手,但在这个比赛中来讲,没啥区别
Q9 lg = LogisticRegression(C=4, dual=True) 里dual参数的用处是什么?
目标函数转换成对偶函数,易于优化
Q10 我现在做了一些特征,就是文章的长度,怎么和两个特征结合啊,他们的类型不一样啊
可以尝试着把各个特征都归一化
Q11 对于数据集严重偏斜的问题,除了smote,ensemble这些方法以外,还有什么处理技巧?在上述方法无效的情况下,如何处理数据?
一般就是上下采样/不同类别赋予不同的权重/ensemble.先验分布主要就是以部分样本估计总体分布的思想,所以是估计
Q12 做lstm,如果要用batch normalization,那输入数据的预处理,是否可以直接让bn做就行?还是说仍然要注意输入数据处理后的分布?
cnn里面也有bn,但是仍然需要做预处理,所以我的个人建议是预处理仍然要做,bn会重新normalize,然后学一个新的分布,所以最坏的情况只是多做了一个normalize
Q13 那个l1正择化和l2有什么本质的区别吗
当然本质区别了,l1可以让一些变量等于0,l2可以让一些变量趋向0
分享
S1 对数几率回归推导,并附代码实现
对数几率回归 —— Logistic Regression
S2 帮助大家理解SVM
机器学习第二阶段:机器学习经典算法(5)——支持向量机
机器学习_周志华_问题汇总_第1周相关推荐
- 周志华:“数据、算法、算力”人工智能三要素,在未来还要加上“知识”
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源:AI科技评论 作者:李雨晨 2020 年 8 月 7 日,全球人工智能和机器人峰会(CC ...
- 机器学习_周志华_问题汇总_第2周
问题 Q1 如果我想分析一下文本分类错误的原因,应该从哪些方面入手? 可以去分析一下哪个类别错误率高,然后看看这个类别的是否不平衡,针对这个类别看看能不能进行改进. 还有就是数据量过少,或是数据质量较 ...
- 机器学习_周志华(西瓜书) 课后习题答案 第一章 Chapter1
机器学习_周志华 课后习题答案 第一章 Chapter1 习题1.1 Q:表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间. 由所给出的数据集(训练集)可知,属性3个:色泽.根蒂.敲声, ...
- 周志华《机器学习》课后习题(第七章):贝叶斯分类
作者 | 我是韩小琦 链接 | https://zhuanlan.zhihu.com/p/51768750 7.1 试使用极大似然法估算回瓜数据集 3.0 中前 3 个属性的类条件概率. 答: 以第一 ...
- 周志华 《机器学习初步》模型评估与选择
周志华 <机器学习初步>模型评估与选择 Datawhale2022年12月组队学习 ✌ 文章目录 周志华 <机器学习初步>模型评估与选择 一.泛化能力 二.过拟合和欠拟合 泛化 ...
- 《机器学习》周志华 学习笔记
<机器学习>周志华 学习笔记 第一章 绪论 1.1 引言 机器学习:致力于研究如何通过计算的手段,利用经验来改善系统自身的性能. 经验:"经验"通常以"数据& ...
- 周志华 机器学习初步 线性模型
周志华 <机器学习初步> 线性模型 还未更新完,会持续更新 文章目录 周志华 <机器学习初步> 线性模型 一.线性回归 1.线性模型 线性模型的特点和重要性 线性模型的基本形式 ...
- 机器学习(周志华) 第九章聚类
关于周志华老师的<机器学习>这本书的学习笔记 记录学习过程 本博客记录Chapter9 文章目录 1 聚类任务 2 性能度量 3 距离计算 4 原型聚类 4.1 k均值算法 4.2 学习向 ...
- 【吃瓜教程】周志华机器学习西瓜书第三章答案
线性模型结构梳理 3.1 试析在什么情形下式3.2中不必考虑偏置项b 答案一: 偏置项b在数值上代表了自变量取0时,因变量的取值: 1.当讨论变量x对结果y的影响,不用考虑b: 2.可以用变量归一化( ...
- 【读书笔记】周志华 机器学习 第二章 模型评估和选择
第二章 模型评估和选择 1 欠拟合和过拟合 偏差和方差 1.1 欠拟合和过拟合 1.2 偏差和方差 2 评估方法 性能度量 2.1 评估方法 2.1.1 留出法 2.2.2 交叉验证法 2.2.3 自 ...
最新文章
- 抽象语法树 Abstract syntax tree
- boost::statechart模块实现无效结果复制测试
- [设计模式] ------ 装饰模式
- Summed-Area Variance Soft Shadow Mapping(SAVSM):二
- C++学习笔记(11) 重载流插入运算符和流提取运算符,以及自动类型转换
- 微信分享功能问题-描述内容换行,导致js加载失败
- dubbo 异步回调
- 倒计时 5 天!Apache Flink Meetup 7.10 北京站,Flink x TiDB 专场等你来!
- IDEA开发环境中maven 项目配置使用JDK9,JDK10,JDK11,JDK12等
- AI语音机器人有哪些需要注意事项
- 计算机硬件系统的主要性能指标
- 安卓怎么转移到iphone_如何将联系人从iPhone转移到另一部电话
- 手把手教你VirtualBox安装Centos,全网最全教程
- air dots 配对_Redmi AirDots可以作为iphone的合格伴侣吗?
- Linux中系统的分区管理
- 怎么提升个人的代码编写能力
- 树、二叉树、满二叉树、完全二叉树、二叉树的重要性质及其存储结构
- 用matlab代码写一下jackknife方法的校正步骤?、
- 在LiCO中实现模型训练
- Ubuntu 18.04 安装 xdm 2018 ( Xtreme Download Manager 2018 )
热门文章
- webform repeater
- Java与UML交互图
- 【建模必备】遗传算法的定义与生物学基础
- 如何利用C#开发“通讯录”小程序
- U盘中毒了?教你如何删除System Volume Information这个顽固文件夹
- 阿里云蒋江伟:我们致力于为世界提供70%的算力 | 凌云时刻
- GitHub标星近1万:只需5秒音源,这个网络就能实时“克隆”你的声音
- 超阿里、大华,澎思科技行人再识别(ReID)技术刷新三大数据集记录
- 10万人的1000万张图像,微软悄然删除最大公开人脸数据集
- 弃Java、Swift于不顾,为何选Python?