【李宏毅2021机器学习深度学习——作业2 Classification】 Phoneme Classification 记录(双过strong baseline)
文章目录
- 实验结果:(已过 strong baseline)
- 可视化实验记录:(稳定在0.75升不上去了,50个epoch可以收敛了)
- 修改记录:
- 改进想法:
- 做完这个实验应该有的收获:
- 参考资料:
实验结果:(已过 strong baseline)
可视化实验记录:(稳定在0.75升不上去了,50个epoch可以收敛了)
修改记录:
数据方面:
- 调整验证集比例为0.01,不需要那么多:
VAL_RATIO = 0.01
BATCH_SIZE = 2048
,用到bn
,BATCH_SIZE
必须大才有效果
网络方面:
3. dim 直接到2048,不然val_acc不会动,直接抄的参考资料1
4. DNN
非常容易过拟合,dropout也用上:nn.Dropout(0.5),
5. BN
加快收敛(BN和dropout一起用可以吗?(可以吧,bn相当于每一层做归一化,效果还不错)(等待求解中·…)):nn.BatchNorm1d(2048), # bn在激活函数之后,限制 值范围
6. L2正则化:optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate, weight_decay=l2), l2 = 1e-4
(不太理解weight_decay
就是L2正则化,等待学习中…李沐老师视频-12 权重衰退【动手学深度学习v2】)
改进想法:
- 对数据分析发现是个不平衡数据集,对不平衡数据集的处理?重采样?weight_sample?
- AM-Softmax?(从后面视频听来的) (用了之后没什么效果啊,可能用错了?)参考链接
- 后处理再细致些?参考【ML2021李宏毅机器学习】作业2 TIMIT phoneme classification 思路讲解
做完这个实验应该有的收获:
这个实验还是关于DNN的,DNN非常容易过拟合,所以解决过拟合的手段都可以用上看看:
dropout,BN,正则化
dim直接开到2048才能看到效果… 早期的调参记录无任何经验瞎分析,dim <= 1024 无任何提升始终停留0.7
在
Dataloader
中别忘记开num_workers=8, pin_memory=True
,快:val_loader = DataLoader(val_set, batch_size=BATCH_SIZE, shuffle=False, num_workers=8, pin_memory=True) # 记得一定要num_workers=8, pin_memory=True
自己看的新的损失函数AM-Softmax没什么效果… 【待求解中…】
单个模型最高的分数升不到0.76,这里直接照抄参考资料1,自己在做的时候只做了model1和model2的ensemble,就能升到0.76了,再加上后处理刚刚好过strong baseline(111,前后相同,中间改为前或后,这里应该是根据声音是连续的领域知识,更细的后处理如维比特算法?)
看来模型ensemble是个大杀器!
如何做 ensemble?
开多几个页面(复制粘贴的事,这样就能多个模型一起训练,当然看gpu内存够不够),修改不同的架构,超参数,训练轮次…,
- 参考资料1直接用所有数据进行训练,也行?(先训练特征提取器,后微调,在很多文章的做法)
参考资料:
https://github.com/pai4451/ML2021/blob/main/hw2/model%201.ipynb
https://github.com/1am9trash/Hung_Yi_Lee_ML_2021/blob/main/hw/hw2/hw2_code.ipynb
【李宏毅2021机器学习深度学习——作业2 Classification】 Phoneme Classification 记录(双过strong baseline)相关推荐
- 【李宏毅2021机器学习深度学习】作业讲解 笔记收藏 课程主页
作业仓库 15个作业仓库 作业参考 大佬代码参考 参考2–目前只有1-3作业? 笔记收藏 21 年 课程主页 sample code & slide 21 年笔记 20 年笔记 [<20 ...
- 李宏毅2020机器学习深度学习 笔记1(理论上持续更新中)
我真的超能鸽
- 【李宏毅2020机器学习深度学习(完整版)国语】P22 Semi-supervised
文章目录 写在前面 Introduction Why semi-supervised learning helps? Outline 1. Semi-supervised Learning for G ...
- 李宏毅深度学习作业二
任务说明 Binary classification is one of the most fundamental problem in machine learning. In this tutor ...
- 【资源放送】机器学习/深度学习最全公开视频大放送!
文章首发于微信公众号<有三AI> [资源放送]机器学习/深度学习最全公开视频大放送! 该篇小记一下机器学习与深度学习的一些好的基础视频资源. 如果你是刚入门的小白,建议细细阅读一下下面将要 ...
- [转载]机器学习深度学习经典资料汇总,全到让人震惊
自学成才秘籍!机器学习&深度学习经典资料汇总 转自:中国大数据: http://www.thebigdata.cn/JiShuBoKe/13299.html [日期:2015-01-27] 来 ...
- 2018年机器学习深度学习资料 全新汇总(不断更新),希望看到文章的朋友能够学到更多
向AI转型的程序员都关注了这个号??? 大数据挖掘DT数据分析 公众号: datadw 注:机器学习资料篇目一共500条,篇目二开始更新 本文提到链接 请查看原文 https://github.c ...
- 【吐血推荐】机器学习/深度学习入门资料汇总及学习建议【入门必看】
机器学习入门,初学者遇到的问题非常多,但最大的问题就是: 资料太多!!!看不完!!!不知道如何取舍!!! 一.机器学习的数学基础 正规的机器学习数学基础主要有: 数学分析(微积分),线性代数,概率论, ...
- 机器学习 深度学习 ai_人工智能,机器学习,深度学习-特征和差异
机器学习 深度学习 ai Artificial Intelligence (AI) will and is currently taking over an important role in our ...
最新文章
- 2021年大数据Hive(七):Hive的开窗函数
- 个人站点渲染和跳转过滤功能
- tensorflow-gpu版本出现libcublas.so.8.0:cannot open shared object file
- Java Web学习路线
- Linux 文件基本属性
- 关于nginx配置的不完全总结
- 为旗下硬件产品服务,LG推出基于SLAM技术的3D摄像头
- git 常用命令笔记
- python技巧——使用list comprehension生成素数(prime number)
- 使用grep命令快速定位代码位置
- 国产操作系统(Linux)技术流派
- IAR软件生成库文件.a的license限制
- DSP烧写程序的步骤流程
- mt7621芯片更换ram
- anaconda prompt提示系统找不到指定的路径
- 移远百科 | GNSS定位技术知多少
- Html5之canvas重叠矩形、getContext、fillStyle、fillRect
- mysql 定义取值范围_MySQL中各种字段的取值范围
- 串口服务器与协议转换器的区别,串口服务器和串口转以太网模块区别
- win10检查更新后,蓝牙没了,卸载usb也没有用,蓝牙 未知usb设备 设备描述符请求失败