文章目录

  • 实验结果:(已过 strong baseline)
  • 可视化实验记录:(稳定在0.75升不上去了,50个epoch可以收敛了)
  • 修改记录:
  • 改进想法:
  • 做完这个实验应该有的收获:
  • 参考资料:

实验结果:(已过 strong baseline)

可视化实验记录:(稳定在0.75升不上去了,50个epoch可以收敛了)

修改记录:

数据方面:

  1. 调整验证集比例为0.01,不需要那么多:VAL_RATIO = 0.01
  2. BATCH_SIZE = 2048,用到bn,BATCH_SIZE必须大才有效果

网络方面:
3. dim 直接到2048,不然val_acc不会动,直接抄的参考资料1
4. DNN非常容易过拟合,dropout也用上:nn.Dropout(0.5),
5. BN加快收敛(BN和dropout一起用可以吗?(可以吧,bn相当于每一层做归一化,效果还不错)(等待求解中·…)):nn.BatchNorm1d(2048), # bn在激活函数之后,限制 值范围
6. L2正则化:optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate, weight_decay=l2), l2 = 1e-4 (不太理解weight_decay就是L2正则化,等待学习中…李沐老师视频-12 权重衰退【动手学深度学习v2】)

改进想法:

  1. 对数据分析发现是个不平衡数据集,对不平衡数据集的处理?重采样?weight_sample?
  2. AM-Softmax?(从后面视频听来的) (用了之后没什么效果啊,可能用错了?)参考链接
  3. 后处理再细致些?参考【ML2021李宏毅机器学习】作业2 TIMIT phoneme classification 思路讲解

做完这个实验应该有的收获:

  • 这个实验还是关于DNN的,DNN非常容易过拟合,所以解决过拟合的手段都可以用上看看:dropout,BN,正则化

  • dim直接开到2048才能看到效果… 早期的调参记录无任何经验瞎分析,dim <= 1024 无任何提升始终停留0.7

  • Dataloader中别忘记开num_workers=8, pin_memory=True,快:val_loader = DataLoader(val_set, batch_size=BATCH_SIZE, shuffle=False, num_workers=8, pin_memory=True) # 记得一定要num_workers=8, pin_memory=True

  • 自己看的新的损失函数AM-Softmax没什么效果… 【待求解中…】

  • 单个模型最高的分数升不到0.76,这里直接照抄参考资料1,自己在做的时候只做了model1和model2的ensemble,就能升到0.76了,再加上后处理刚刚好过strong baseline(111,前后相同,中间改为前或后,这里应该是根据声音是连续的领域知识,更细的后处理如维比特算法?)

  • 看来模型ensemble是个大杀器!

如何做 ensemble?
开多几个页面(复制粘贴的事,这样就能多个模型一起训练,当然看gpu内存够不够),修改不同的架构,超参数,训练轮次…,

  • 参考资料1直接用所有数据进行训练,也行?(先训练特征提取器,后微调,在很多文章的做法)

参考资料:

  1. https://github.com/pai4451/ML2021/blob/main/hw2/model%201.ipynb

  2. https://github.com/1am9trash/Hung_Yi_Lee_ML_2021/blob/main/hw/hw2/hw2_code.ipynb

【李宏毅2021机器学习深度学习——作业2 Classification】 Phoneme Classification 记录(双过strong baseline)相关推荐

  1. 【李宏毅2021机器学习深度学习】作业讲解 笔记收藏 课程主页

    作业仓库 15个作业仓库 作业参考 大佬代码参考 参考2–目前只有1-3作业? 笔记收藏 21 年 课程主页 sample code & slide 21 年笔记 20 年笔记 [<20 ...

  2. 李宏毅2020机器学习深度学习 笔记1(理论上持续更新中)

    我真的超能鸽

  3. 【李宏毅2020机器学习深度学习(完整版)国语】P22 Semi-supervised

    文章目录 写在前面 Introduction Why semi-supervised learning helps? Outline 1. Semi-supervised Learning for G ...

  4. 李宏毅深度学习作业二

    任务说明 Binary classification is one of the most fundamental problem in machine learning. In this tutor ...

  5. 【资源放送】机器学习/深度学习最全公开视频大放送!

    文章首发于微信公众号<有三AI> [资源放送]机器学习/深度学习最全公开视频大放送! 该篇小记一下机器学习与深度学习的一些好的基础视频资源. 如果你是刚入门的小白,建议细细阅读一下下面将要 ...

  6. [转载]机器学习深度学习经典资料汇总,全到让人震惊

    自学成才秘籍!机器学习&深度学习经典资料汇总 转自:中国大数据: http://www.thebigdata.cn/JiShuBoKe/13299.html [日期:2015-01-27] 来 ...

  7. 2018年机器学习深度学习资料 全新汇总(不断更新),希望看到文章的朋友能够学到更多

    向AI转型的程序员都关注了这个号??? 大数据挖掘DT数据分析  公众号: datadw 注:机器学习资料篇目一共500条,篇目二开始更新 本文提到链接 请查看原文  https://github.c ...

  8. 【吐血推荐】机器学习/深度学习入门资料汇总及学习建议【入门必看】

    机器学习入门,初学者遇到的问题非常多,但最大的问题就是: 资料太多!!!看不完!!!不知道如何取舍!!! 一.机器学习的数学基础 正规的机器学习数学基础主要有: 数学分析(微积分),线性代数,概率论, ...

  9. 机器学习 深度学习 ai_人工智能,机器学习,深度学习-特征和差异

    机器学习 深度学习 ai Artificial Intelligence (AI) will and is currently taking over an important role in our ...

最新文章

  1. 2021年大数据Hive(七):Hive的开窗函数
  2. 个人站点渲染和跳转过滤功能
  3. tensorflow-gpu版本出现libcublas.so.8.0:cannot open shared object file
  4. Java Web学习路线
  5. Linux 文件基本属性
  6. 关于nginx配置的不完全总结
  7. 为旗下硬件产品服务,LG推出基于SLAM技术的3D摄像头
  8. git 常用命令笔记
  9. python技巧——使用list comprehension生成素数(prime number)
  10. 使用grep命令快速定位代码位置
  11. 国产操作系统(Linux)技术流派
  12. IAR软件生成库文件.a的license限制
  13. DSP烧写程序的步骤流程
  14. mt7621芯片更换ram
  15. anaconda prompt提示系统找不到指定的路径
  16. 移远百科 | GNSS定位技术知多少
  17. Html5之canvas重叠矩形、getContext、fillStyle、fillRect
  18. mysql 定义取值范围_MySQL中各种字段的取值范围
  19. 串口服务器与协议转换器的区别,串口服务器和串口转以太网模块区别
  20. win10检查更新后,蓝牙没了,卸载usb也没有用,蓝牙 未知usb设备 设备描述符请求失败

热门文章

  1. 如果人工智能的上半场是分类,那么下半场就是聚类
  2. Flash旋转3D展示
  3. 部署NPS实现Socks5代理访问公司内网教程
  4. JAVA对特殊字符的处理
  5. echarts图表(可视化)的简单使用(推荐)
  6. 从0入门折半(二分)查找
  7. Saltstack数据系统——grains和pillar
  8. Goland下载安装
  9. Review of Algorithm (HITSZ) 含22年真题回忆
  10. 三星计算机打不开,三星电脑开机后进不了系统 技术教你解决方法