准备工作:去课程github下载原始代码,kaggle下载数据集。或者关注本公众号,下载代码和数据集(文末有方法)。解压数据集,出现libriphone文件夹将文件和代码放到同一目录下。

kaggle提交: https://www.kaggle.com/c/ml2022spring-hw2,提交结果可能需要科学上网,想讨论的可进QQ群:156013866。

  • Simple Baseline (acc>0.45797): 直接运行代码,可能需要下载一些工具包,运行过后出现prediction.csv文件,将其提交到kaggle上得到分数:0.46083。

  • Medium Baseline (acc>0.69747)concat_nframes参数设置+网络架构改变+学习率设置。对train_labels.txt文件进行统计,发现每一个音位占用的frame均值是9个,因此可以将concat_nframes参数设置为>9(必须为奇数),经尝试可以将concat_nframes设置的大些,这里我设置为17。网络架构调整的更宽和稍深。学习率也稍微调整的大些。运行代码,提交得到kaggle分数:0.70594

  • Strong Baseline (acc>0.75028)concat_nframes参数设置+batch_size+网络架构改变+余弦退火学习率。concat_nframes参数设置为19。batch_size设置为2048。设置三个宽度为1024的隐藏层。利用余弦退火学习率,有的学生可能问了,为什么老是余弦退火啊,用李宏毅老师的话,这都是古圣先贤的意思,用就对了,不过我的理解是使用余弦退火的时候可以很直观的看到哪些学习率是比较合适的,这对我们选择正确的学习率参数很有帮助。运行代码,提交后得到分数:0.75321,好于strong baseline。

  • Boss Baseline (acc>0.82324)concat_nframes参数设置+batch_size+BiLSTM-CRF网络架构+余弦退火学习率

    BiLSTM-CRF网络结构是序列标注中的经典模型,该结构可以综合考虑lstm的输出结果和标签顺序分布,可参考pytorch官方样例:https://pytorch.org/tutorials/beginner/nlp/advanced_tutorial.html,或者使用pytorchcrf库。在使用BiLSTM-CRF架构的时候,需要修改数据的产生方式,之前每个sample的feature和label size分别是(batch_size, 39*concat_nframes)(batch_size,),现在是(batch_size,concat_nframes, 39)(batch_size,concat_nframes),最后做推理的时候也需要相应的改变。同时因为BiLSTM和CRF的收敛速度一般是不一样的,CRF的学习率要设置的大些,运行代码提交后,分数是:0.79449,还没到boss baseline,想得到更好的结果需要进行精细调参,另外可以尝试Transfromer-CRF或Bert-CRF结构。

作业二答案获得方式:

  1. 关注微信公众号 “机器学习手艺人” 

  2. 后台回复关键词:202202

李宏毅2022机器学习HW2解析相关推荐

  1. 李宏毅2022机器学习HW10解析

    准备工作 作业十是黑箱攻击(Blackbox Attack),完成作业需要助教代码和数据集,运行代码过程中保持联网可以自动下载数据集,已经有数据集的情况可关闭助教代码中的下载数据部分.关注本公众号,可 ...

  2. 李宏毅2022机器学习HW5解析

    准备工作 作业五是机器翻译,需要助教代码,运行代码过程中保持联网可以自动下载数据集,已经有数据集的情况可关闭助教代码中的下载数据部分.关注本公众号,可获得代码和数据集(文末有方法). 提交地址 这次作 ...

  3. 李宏毅老师机器学习选择题解析

    机器学习选择题解析加整理 项目说明,本项目是李宏毅老师在飞桨授权课程的配套问题 课程 传送门 该项目AiStudio项目 传送门 仅供学习参考! 三岁出品必是精品! 整理内容源于李宏毅老师机器学习课程 ...

  4. 李宏毅2022机器学习hw6

    目录 ​Machine Learning HW6 一.任务 二.数据集 Crypko: 三.结果 四.改进方法 4.

  5. 李宏毅2022机器学习HW1收获

    colab的使用 把训练集取出一部分作为验证集 选择特征 tqdm,tensorboard使用 在训练和验证时要关闭梯度计算 要把模型和数据放在同一个device上 保证模型可复现性 pytorch和 ...

  6. 【李宏毅《机器学习》2022】作业1:COVID 19 Cases Prediction (Regression)

    文章目录 [李宏毅<机器学习>2022]作业1:COVID 19 Cases Prediction (Regression) 作业内容 1.目标 2.任务描述 3.数据 4.评价指标 代码 ...

  7. 李宏毅《机器学习》国语课程(2022)来了

    提起李宏毅老师,熟悉机器学习的读者朋友一定不会陌生.很多人选择的机器学习入门学习材料都是李宏毅老师的台大公开课视频.今年李宏毅老师开设一门新的机器学习机器学习课程,涵盖最新热门主题,非常值得关注! 李 ...

  8. 【千呼万唤】李宏毅《机器学习》国语课程(2022)终于来了

    提起李宏毅老师,熟悉机器学习的读者朋友一定不会陌生.很多人选择的机器学习入门学习材料都是李宏毅老师的台大公开课视频.今年李宏毅老师开设一门新的机器学习机器学习课程,涵盖最新热门主题,非常值得关注! 李 ...

  9. 李宏毅2020机器学习作业2-Classification:年收入二分类

    更多作业,请查看 李宏毅2020机器学习资料汇总 文章目录 0 作业链接 1 作业说明 环境 任务说明 数据说明 作业概述 2 原始代码 2.0 数据准备 导入数据 标准化(Normalization ...

最新文章

  1. [51nod1238] 最小公倍数之和 V3(杜教筛)
  2. 数据库之Oracle 查询 select - day01
  3. SVG与CSS的特殊性
  4. java 自己的 pid_Java获取自身PID方法搜集
  5. 6.5 使用快捷键快速调整图表线条的宽度 [原创Excel教程]
  6. 【运维必备-堡垒机】
  7. 美团外卖红包个人CPS H5推广链接和小程序码,小程序跳转路径的获取方法
  8. 美团、抖音、淘宝,为什么App们爱上“群聊”?
  9. 2022中国消费者洞察
  10. C语言学习-调用自定义函数
  11. [2017.02.06] 阅读《Effective Morden C++》
  12. 朴素贝叶斯文本分类(python代码实现)
  13. [转载]三联生活周刊:12万亿财富疯狂膨胀人人都是股神
  14. 史上最小 x86 Linux 模拟器「GitHub 热点速览 v.22.50」
  15. python车牌识别算法_百度车牌识别API-Python版
  16. php对比.net,.NET_ASP.NET比拼PHP的测试环境,ASP.NET与PHP速度对比 PHPChina资 - phpStudy...
  17. java上下左右晃动_动画(Animation) 之 (闪烁、左右摇摆、上下晃动等效果)
  18. 九阳豆浆机的命名规则
  19. 使用svn删除Xcode工程中的文件
  20. 格力手机“跳票”认怂?当真你就输了

热门文章

  1. 如何实现输入银行卡号每隔四位自动添加一个空格的功能?
  2. 华为p6 android4.4,华为P6终于品尝到了安卓4.4.2 可惜……
  3. 江在川上曰:JS函数
  4. 江在川上曰:云服务器上的flask项目部署(Ubuntu+Flask+Gunicorn+Supervisor+Nginx+Anaconda)
  5. Android Studio——类微信界面设计
  6. VB中传值(ByVal)和传地址(ByRef)的区别
  7. python程序设计入门书籍推荐_python刚刚入门,接下来这几本python的书会让你成为别人眼里的大神!...
  8. 拓扑学+计算机,拓扑学是什么
  9. 2021-11-02
  10. 医疗卫生信息化领域的一些术语和标准