书接上回

深度学习Deep learning小白入门笔记——在AI平台上训练LLM——PanGu

对训练模型重新认知与评估。

模型评估

在训练过程中或训练完成后,通常使用验证集或测试集来评估模型的性能,其中一些关键的评估指标就包括精度、召回率和F1分数。以下是一般步骤的描述:

  1. 预测:使用模型对验证集或测试集进行预测。这将给出模型对每个样本的预测标签。

  2. 计算评估指标:基于模型的预测结果和真实标签,计算精度、召回率和F1分数。具体的公式如下:

  • 精度(Precision):精度是正确预测的阳性样本(TP)与所有预测为阳性的样本(即TP+FP)的比例,即( Precision = \frac{TP}{TP+FP} )。

  • 召回率(Recall):召回率是正确预测的阳性样本(TP)与所有真实为阳性的样本(即TP+FN)的比例,即( Recall = \frac{TP}{TP+FN} )。

  • F1分数(F1 Score):F1分数是精度和召回率的调和平均值,即( F1 = 2 \cdot \frac{Precision \cdot Recall}{Precision + Recall} )。

在Python中,可以使用sklearn.metrics模块中的precision_scorerecall_scoref1_score函数来计算这些指标。

这里是一个简单的例子:

from sklearn.metrics import precision_score, recall_score, f1_score# Assuming y_true is the array of true labels and y_pred is the array of predicted labels
y_true = [...]
y_pred = [...]precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)print(f"Precision: {precision}")
print(f"Recall: {recall}")
print(f"F1 Score: {f1}")

请注意,这个例子假设你的任务是二分类任务。如果是多分类任务,你可能需要为precision_scorerecall_scoref1_score函数设置average参数,例如average='micro'average='macro',具体取决于你的需求。

模型分析

这个 DataFrame 包含了以下几个关键字段:

  • Timestamp:记录了每个步骤的时间戳。
  • Local_rank:可能是指多设备训练的设备编号。
  • Epoch:记录了当前的训练周期。
  • Step:记录了当前的训练步骤。
  • Loss:记录了当前步骤的损失值。
  • Overflow:这可能是用于标识是否出现了梯度溢出的布尔值。
  • Scale:这可能是用于混合精度训练的比例因子。
  • Learning Rate:记录了当前步骤的学习率。

为了更好地理解这些数据,我们可以对损失和学习率进行可视化,以观察它们如何随训练步骤的进行而变化。通常,如果模型训练得当,我们期望看到损失随着时间的推移逐渐降低,学习率可能会根据选择的学习率策略进行变化。

  1. 损失随训练步骤的变化:随着训练步骤的增加,模型的损失值在波动,但总体呈下降趋势。这是预期的,因为随着模型学习,我们期望损失值会下降。

  2. 学习率随训练步骤的变化:学习率在初期阶段逐渐增加,之后保持相对稳定。这可能反映了在训练开始时使用的学习率预热策略,这是一种常见的优化策略,目的是避免在训练初期由于过大的学习率导致的不稳定。

综上所述,从这些图表中,我们可以看出模型的训练过程看起来是正常的。损失值的下降表明模型正在从训练数据中学习,学习率的变化也符合预期的优化策略。

写在最后

因为未能获得精度、召回率和F1分数所需要的数据,因此未能从这三个方向上分析模型的精度。

深度学习Deep learning小白入门笔记——PanGu模型训练分析相关推荐

  1. [深度学习]DEEP LEARNING(深度学习)学习笔记整理

    转载于博客http://blog.csdn.net/zouxy09 一.概述 Artificial Intelligence,也就是人工智能,就像长生不老和星际漫游一样,是人类最美好的梦想之中的一个. ...

  2. 机器学习(Machine Learning)深度学习(Deep Learning)资料(Chapter 2)

    机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2) - tony的专栏 - 博客频道 - CSDN.NET 注:机器学习资料篇目一共 ...

  3. 【深度学习Deep Learning】资料大全

    感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定! 对商业智能BI.大数据分析挖掘.机器学习, ...

  4. 机器学习(Machine Learning)深度学习(Deep Learning)资料汇总

    本文来源:https://github.com/ty4z2008/Qix/blob/master/dl.md 机器学习(Machine Learning)&深度学习(Deep Learning ...

  5. 深度学习Deep Learning 资料大全

    转自:http://www.cnblogs.com/charlotte77/ [深度学习Deep Learning]资料大全 最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: ...

  6. 机器学习(Machine Learning)深度学习(Deep Learning)资料【转】

    转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...

  7. 机器学习(Machine Learning)深度学习(Deep Learning)资料集合

    机器学习(Machine Learning)&深度学习(Deep Learning)资料 原文链接:https://github.com/ty4z2008/Qix/blob/master/dl ...

  8. 机器学习 Machine Learning 深度学习 Deep Learning 资料

    机器学习(Machine Learning)&深度学习(Deep Learning)资料 機器學習.深度學習方面不錯的資料,轉載. 原作:https://github.com/ty4z2008 ...

  9. 大量机器学习(Machine Learning)深度学习(Deep Learning)资料

    机器学习目前比较热,网上也散落着很多相关的公开课和学习资源,这里基于课程图谱的机器学习公开课标签做一个汇总整理,便于大家参考对比. 1.Coursera上斯坦福大学Andrew Ng教授的" ...

最新文章

  1. EntityFrameworkCore 安装
  2. Memcache的部署和使用
  3. 如何在Spring Boot中玩转智能合约
  4. MATLAB爬虫爬取股票数据
  5. 时光穿越_电脑时间显示为2011年6月1日
  6. 编程笔试(解析及代码实现):国内各大银行(招商银行/浦发银行等)在线笔试常见题目(猴子吃桃/字符串逆序输出/一段话输出字的个数/单词大小转换等)及其代码实现(Java/Python/C#等)之详细攻略
  7. Dubbo 3.0 前瞻之对接 Kubernetes 原生服务
  8. python读取配置文件 分段_Python3读写ini配置文件的示例
  9. es 删除数据_es 写入数据的工作原理是什么啊?es 查询数据的工作原理是什么啊?...
  10. asterisk channel driver dev ref
  11. 前端学习(2184):tabber--封装成独立的组件
  12. 《Python Cookbook 3rd》笔记(1.12):序列中出现次数最多的元素
  13. Meidapipe 3D手势姿态跟踪算法,手机端实时检测 ,多个手势同时捕捉
  14. 高质量C /C编程指南---第1章 文件机关
  15. 2.python中的矩阵、多维数组----numpy
  16. Java密码类型_java加密类型和算法名称
  17. 海康威视网络摄像机连接、使用方法
  18. 软件Faststone Capture 注册码
  19. MATLAB手写数字识别
  20. 爬楼梯 java_爬楼梯问题java实现

热门文章

  1. fmt标签无效,无法解析
  2. 物理方法与实践练习题
  3. pythontkinter窗口外观样式_Python GUI之tkinter窗口视窗教程大集合(推荐)
  4. 最小生成树(Kruskal和Prim算法基础讲述)
  5. Linux设备检测外部网络NAT类型
  6. 【第3版emWin教程】第49章 emWin6.x的AppWizard创建控件回调消息
  7. cake fork什么意思_Cake Fork
  8. OpenGL中的坐标变换、矩阵变换
  9. 【秒杀业务思路-缓存预热-防止超卖】
  10. SoC-点亮led灯