深度学习Deep learning小白入门笔记——PanGu模型训练分析
书接上回
深度学习Deep learning小白入门笔记——在AI平台上训练LLM——PanGu
对训练模型重新认知与评估。
模型评估
在训练过程中或训练完成后,通常使用验证集或测试集来评估模型的性能,其中一些关键的评估指标就包括精度、召回率和F1分数。以下是一般步骤的描述:
预测:使用模型对验证集或测试集进行预测。这将给出模型对每个样本的预测标签。
计算评估指标:基于模型的预测结果和真实标签,计算精度、召回率和F1分数。具体的公式如下:
精度(Precision):精度是正确预测的阳性样本(TP)与所有预测为阳性的样本(即TP+FP)的比例,即( Precision = \frac{TP}{TP+FP} )。
召回率(Recall):召回率是正确预测的阳性样本(TP)与所有真实为阳性的样本(即TP+FN)的比例,即( Recall = \frac{TP}{TP+FN} )。
F1分数(F1 Score):F1分数是精度和召回率的调和平均值,即( F1 = 2 \cdot \frac{Precision \cdot Recall}{Precision + Recall} )。
在Python中,可以使用sklearn.metrics
模块中的precision_score
,recall_score
和f1_score
函数来计算这些指标。
这里是一个简单的例子:
from sklearn.metrics import precision_score, recall_score, f1_score# Assuming y_true is the array of true labels and y_pred is the array of predicted labels
y_true = [...]
y_pred = [...]precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)print(f"Precision: {precision}")
print(f"Recall: {recall}")
print(f"F1 Score: {f1}")
请注意,这个例子假设你的任务是二分类任务。如果是多分类任务,你可能需要为precision_score
,recall_score
和f1_score
函数设置average
参数,例如average='micro'
或average='macro'
,具体取决于你的需求。
模型分析
这个 DataFrame 包含了以下几个关键字段:
Timestamp
:记录了每个步骤的时间戳。Local_rank
:可能是指多设备训练的设备编号。Epoch
:记录了当前的训练周期。Step
:记录了当前的训练步骤。Loss
:记录了当前步骤的损失值。Overflow
:这可能是用于标识是否出现了梯度溢出的布尔值。Scale
:这可能是用于混合精度训练的比例因子。Learning Rate
:记录了当前步骤的学习率。
为了更好地理解这些数据,我们可以对损失和学习率进行可视化,以观察它们如何随训练步骤的进行而变化。通常,如果模型训练得当,我们期望看到损失随着时间的推移逐渐降低,学习率可能会根据选择的学习率策略进行变化。
损失随训练步骤的变化:随着训练步骤的增加,模型的损失值在波动,但总体呈下降趋势。这是预期的,因为随着模型学习,我们期望损失值会下降。
学习率随训练步骤的变化:学习率在初期阶段逐渐增加,之后保持相对稳定。这可能反映了在训练开始时使用的学习率预热策略,这是一种常见的优化策略,目的是避免在训练初期由于过大的学习率导致的不稳定。
综上所述,从这些图表中,我们可以看出模型的训练过程看起来是正常的。损失值的下降表明模型正在从训练数据中学习,学习率的变化也符合预期的优化策略。
写在最后
因为未能获得精度、召回率和F1分数所需要的数据,因此未能从这三个方向上分析模型的精度。
深度学习Deep learning小白入门笔记——PanGu模型训练分析相关推荐
- [深度学习]DEEP LEARNING(深度学习)学习笔记整理
转载于博客http://blog.csdn.net/zouxy09 一.概述 Artificial Intelligence,也就是人工智能,就像长生不老和星际漫游一样,是人类最美好的梦想之中的一个. ...
- 机器学习(Machine Learning)深度学习(Deep Learning)资料(Chapter 2)
机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2) - tony的专栏 - 博客频道 - CSDN.NET 注:机器学习资料篇目一共 ...
- 【深度学习Deep Learning】资料大全
感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定! 对商业智能BI.大数据分析挖掘.机器学习, ...
- 机器学习(Machine Learning)深度学习(Deep Learning)资料汇总
本文来源:https://github.com/ty4z2008/Qix/blob/master/dl.md 机器学习(Machine Learning)&深度学习(Deep Learning ...
- 深度学习Deep Learning 资料大全
转自:http://www.cnblogs.com/charlotte77/ [深度学习Deep Learning]资料大全 最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: ...
- 机器学习(Machine Learning)深度学习(Deep Learning)资料【转】
转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...
- 机器学习(Machine Learning)深度学习(Deep Learning)资料集合
机器学习(Machine Learning)&深度学习(Deep Learning)资料 原文链接:https://github.com/ty4z2008/Qix/blob/master/dl ...
- 机器学习 Machine Learning 深度学习 Deep Learning 资料
机器学习(Machine Learning)&深度学习(Deep Learning)资料 機器學習.深度學習方面不錯的資料,轉載. 原作:https://github.com/ty4z2008 ...
- 大量机器学习(Machine Learning)深度学习(Deep Learning)资料
机器学习目前比较热,网上也散落着很多相关的公开课和学习资源,这里基于课程图谱的机器学习公开课标签做一个汇总整理,便于大家参考对比. 1.Coursera上斯坦福大学Andrew Ng教授的" ...
最新文章
- EntityFrameworkCore 安装
- Memcache的部署和使用
- 如何在Spring Boot中玩转智能合约
- MATLAB爬虫爬取股票数据
- 时光穿越_电脑时间显示为2011年6月1日
- 编程笔试(解析及代码实现):国内各大银行(招商银行/浦发银行等)在线笔试常见题目(猴子吃桃/字符串逆序输出/一段话输出字的个数/单词大小转换等)及其代码实现(Java/Python/C#等)之详细攻略
- Dubbo 3.0 前瞻之对接 Kubernetes 原生服务
- python读取配置文件 分段_Python3读写ini配置文件的示例
- es 删除数据_es 写入数据的工作原理是什么啊?es 查询数据的工作原理是什么啊?...
- asterisk channel driver dev ref
- 前端学习(2184):tabber--封装成独立的组件
- 《Python Cookbook 3rd》笔记(1.12):序列中出现次数最多的元素
- Meidapipe 3D手势姿态跟踪算法,手机端实时检测 ,多个手势同时捕捉
- 高质量C /C编程指南---第1章 文件机关
- 2.python中的矩阵、多维数组----numpy
- Java密码类型_java加密类型和算法名称
- 海康威视网络摄像机连接、使用方法
- 软件Faststone Capture 注册码
- MATLAB手写数字识别
- 爬楼梯 java_爬楼梯问题java实现