完整版教程下载地址：http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547

第22章 DSP矩阵运算-放缩，乘法和转置矩阵

本期教程主要讲解矩阵运算中的放缩，乘法和转置。

22.1 初学者重要提示

22.2 DSP基础运算指令

22.3 矩阵放缩（MatScale）

22.3.1 函数arm_mat_scale_f32

22.3.2 函数arm_mat_scale_q31

22.3.3 函数arm_mat_scale_q15

22.3.4 使用举例（含matlab实现）

22.4 矩阵乘法（MatMult）

22.4.1 函数arm_mat_mult_f32

22.4.2 函数arm_mat_mult_q31

22.4.3 函数arm_mat_mult_q15

22.4.4 函数arm_mat_mult_fast_q31

22.4.5 函数arm_mat_mult_fast_q15

22.4.6 使用举例（含matlab实现）

22.5 转置矩阵 MatTrans

22.5.1 函数arm_mat_trans_f32

22.5.2 函数arm_mat_trans_q31

22.5.3 函数arm_mat_trans_q15

22.5.4 使用举例（含matlab实现）

22.6 实验例程说明（MDK）

22.7 实验例程说明（IAR）

22.8 总结

22.1 初学者重要提示

ARM提供的DSP库逆矩阵求法有局限性，通过Matlab验证是可以求逆矩阵的，而DSP库却不能正确求解。
注意定点数的矩阵乘法运算中溢出问题。

22.2 DSP基础运算指令

本章用到的DSP指令在前面章节都已经讲解过。

22.3 矩阵放缩（MatScale）

以3*3矩阵为例，矩阵放缩的实现公式如下：

22.3.1 函数arm_mat_scale_f32

函数原型：

arm_status arm_mat_scale_f32(

const arm_matrix_instance_f32 * pSrc,

float32_t scale,

arm_matrix_instance_f32 * pDst)

函数描述：

这个函数用于浮点格式的矩阵数据的放缩。

函数参数：

第1个参数是源矩阵地址。
第2个参数是放缩系数。
第3个参数是放缩后的目的数据地址。
返回值，ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致，ARM_MATH_SUCCESS表示成功。

注意事项：

矩阵在数组中的存储是从左到右，再从上到下。

22.3.2 函数arm_mat_scale_q31

函数原型：

arm_status arm_mat_scale_q31(

const arm_matrix_instance_q31 * pSrc,

q31_t scaleFract,

int32_t shift,

arm_matrix_instance_q31 * pDst)

函数描述：

这个函数用于定点Q31格式的矩阵数据的放缩。

函数参数：

第1个参数是源矩阵地址。
第2个参数是放缩系数。
第3个参数是移位的bit数。
第4个参数是放缩后的目的数据地址。
返回值，ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致，ARM_MATH_SUCCESS表示成功。

注意事项：

两个1.31格式的数据相乘产生2.62格式的数据，最终结果要做偏移和饱和运算产生1.31格式数。
定点数的最终放缩比例计算是：scale = scaleFract * 2^shift。
矩阵在数组中的存储是从左到右，再从上到下。

22.3.3 函数arm_mat_scale_q15

函数原型：

arm_status arm_mat_scale_q15(

const arm_matrix_instance_q15 * pSrc,

q15_t scaleFract,

int32_t shift,

arm_matrix_instance_q15 * pDst)

函数描述：

这个函数用于定点Q15格式的矩阵数据的放缩。

函数参数：

第1个参数是源矩阵地址。
第2个参数是放缩系数。
第3个参数是移位的bit数。
第4个参数是放缩后的目的数据地址。
返回值，ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致，ARM_MATH_SUCCESS表示成功。

注意事项：

两个1.15格式的数据相乘产生2.30格式的数据，最终结果要做偏移和饱和运算产生1.15格式数据。
定点数的最终放缩比例计算是：scale = scaleFract * 2^shift。
矩阵在数组中的存储是从左到右，再从上到下。

22.3.4 使用举例（含matlab实现）

程序设计：

/*
*********************************************************************************************************
*    函 数 名: DSP_MatScale
*    功能说明: 矩阵放缩
*    形    参: 无
*    返 回 值: 无
*********************************************************************************************************
*/
static void DSP_MatScale(void)
{uint8_t i;/****浮点数数组******************************************************************/float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};float32_t scale = 1.1f;float32_t pDataDst[9];arm_matrix_instance_f32 pSrcA; //3行3列数据arm_matrix_instance_f32 pDst;/****定点数Q31数组******************************************************************/q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q31_t scaleFract = 10;int32_t shift = 0;q31_t pDataDst1[9];arm_matrix_instance_q31 pSrcA1; //3行3列数据arm_matrix_instance_q31 pDst1;/****定点数Q15数组******************************************************************/q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q15_t scaleFract1 = 10;int32_t shift1 = 0;q15_t pDataDst2[9];arm_matrix_instance_q15 pSrcA2; //3行3列数据arm_matrix_instance_q15 pDst2;/****浮点数***********************************************************************/pSrcA.numCols = 3;pSrcA.numRows = 3;pSrcA.pData = pDataA;pDst.numCols = 3;pDst.numRows = 3;pDst.pData = pDataDst;printf("****浮点数******************************************\r\n");arm_mat_scale_f32(&pSrcA, scale, &pDst);for(i = 0; i < 9; i++){printf("pDataDst[%d] = %f\r\n", i, pDataDst[i]);}/****定点数Q31***********************************************************************/pSrcA1.numCols = 3;pSrcA1.numRows = 3;pSrcA1.pData = pDataA1;pDst1.numCols = 3;pDst1.numRows = 3;pDst1.pData = pDataDst1;printf("****定点数Q31******************************************\r\n");arm_mat_scale_q31(&pSrcA1, scaleFract, shift, &pDst1);for(i = 0; i < 9; i++){printf("pDataDst1[%d] = %d\r\n", i, pDataDst1[i]);}/****定点数Q15***********************************************************************/pSrcA2.numCols = 3;pSrcA2.numRows = 3;pSrcA2.pData = pDataA2;pDst2.numCols = 3;pDst2.numRows = 3;pDst2.pData = pDataDst2;printf("****定点数Q15******************************************\r\n");arm_mat_scale_q15(&pSrcA2, scaleFract1, shift1, &pDst2);for(i = 0; i < 9; i++){printf("pDataDst2[%d] = %d\r\n", i, pDataDst2[i]);}
}

实验现象（按下K1按键后串口打印）：

下面通过matlab来实现矩阵的放缩：

22.4 矩阵乘法（MatMult）

以3*3矩阵为例，矩阵乘法的实现公式如下：

22.4.1 函数arm_mat_mult_f32

函数原型：

arm_status arm_mat_mult_f32(

const arm_matrix_instance_f32 * pSrcA,

const arm_matrix_instance_f32 * pSrcB,

arm_matrix_instance_f32 * pDst)

函数描述：

这个函数用于浮点数的矩阵乘法。

函数参数：

第1个参数是矩阵A的源地址。
第2个参数是矩阵B的源地址。
第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
返回值，ARM_MATH_SUCCESS表示成功，ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

注意事项：

两个矩阵M x N和N x P相乘的结果是M x P（必须保证一个矩形的列数等于另一个矩阵的行数）。
矩阵在数组中的存储是从左到右，再从上到下。

22.4.2 函数arm_mat_mult_q31

函数原型：

arm_status arm_mat_mult_q31(

const arm_matrix_instance_q31 * pSrcA,

const arm_matrix_instance_q31 * pSrcB,

arm_matrix_instance_q31 * pDst)

函数描述：

这个函数用于定点数Q31的矩阵乘法。

函数参数：

第1个参数是矩阵A的源地址。
第2个参数是矩阵B的源地址。
第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
返回值，ARM_MATH_SUCCESS表示成功，ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

注意事项：

两个1.31格式的数据相乘产生2.62格式的数据，函数的内部使用了64位的累加器，最终结果要做偏移和饱和运算产生1.31格式数据。
两个矩阵M x N和N x P相乘的结果是M x P.（必须保证一个矩形的列数等于另一个矩阵的行数）。
矩阵在数组中的存储是从左到右，再从上到下。

22.4.3 函数arm_mat_mult_q15

函数原型：

arm_status arm_mat_mult_q15(

const arm_matrix_instance_q15 * pSrcA,

const arm_matrix_instance_q15 * pSrcB,

arm_matrix_instance_q15 * pDst,

q15_t * pState)

函数描述：

这个函数用于定点数Q15的矩阵乘法。

函数参数：

第1个参数是矩阵A的源地址。
第2个参数是矩阵B的源地址。
第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
第4个参数用于存储内部计算结果。
返回值，ARM_MATH_SUCCESS表示成功，ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

注意事项：

两个1.15格式数据相乘是2.30格式，函数的内部使用了64位的累加器，34.30格式，最终结果将低15位截取掉并做饱和处理为1.15格式。
两个矩阵M x N和N x P相乘的结果是M x P.（必须保证一个矩形的列数等于另一个矩阵的行数）。
矩阵在数组中的存储是从左到右，再从上到下。

22.4.4 函数arm_mat_mult_fast_q31

函数原型：

arm_status arm_mat_mult_fast_q31(

const arm_matrix_instance_q31 * pSrcA,

const arm_matrix_instance_q31 * pSrcB,

arm_matrix_instance_q31 * pDst)

函数描述：

这个函数用于定点数Q31的矩阵乘法。

函数参数：

第1个参数是矩阵A的源地址。
第2个参数是矩阵B的源地址。
第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
返回值，ARM_MATH_SUCCESS表示成功，ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

注意事项：

两个1.31格式的数据相乘产生2.62格式的数据，函数的内部使用了64位的累加器，最终结果要做偏移和饱和运算产生1.31格式数据。
两个矩阵M x N和N x P相乘的结果是M x P.（必须保证一个矩形的列数等于另一个矩阵的行数）。
矩阵在数组中的存储是从左到右，再从上到下。
函数arm_mat_mult_fast_q31是arm_mat_mult_q31的快速算法。

22.4.5 函数arm_mat_mult_fast_q15

函数原型：

arm_status arm_mat_mult_q15(

const arm_matrix_instance_q15 * pSrcA,

const arm_matrix_instance_q15 * pSrcB,

arm_matrix_instance_q15 * pDst,

q15_t * pState)

函数描述：

这个函数用于定点数Q15的矩阵乘法。

函数参数：

第1个参数是矩阵A的源地址。
第2个参数是矩阵B的源地址。
第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
第4个参数用于存储内部计算结果。
返回值，ARM_MATH_SUCCESS表示成功，ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

注意事项：

两个1.15格式数据相乘是2.30格式，函数的内部使用了64位的累加器，34.30格式，最终结果将低15位截取掉并做饱和处理为1.15格式。
两个矩阵M x N和N x P相乘的结果是M x P.（必须保证一个矩形的列数等于另一个矩阵的行数）。
矩阵在数组中的存储是从左到右，再从上到下。

22.4.6 使用举例（含matlab实现）

程序设计：

/*
*********************************************************************************************************
*    函 数 名: DSP_MatMult
*    功能说明: 矩阵乘法
*    形    参: 无
*    返 回 值: 无
*********************************************************************************************************
*/
static void DSP_MatMult(void)
{uint8_t i;/****浮点数数组******************************************************************/float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};float32_t pDataB[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};float32_t pDataDst[9];arm_matrix_instance_f32 pSrcA; //3行3列数据arm_matrix_instance_f32 pSrcB; //3行3列数据arm_matrix_instance_f32 pDst;/****定点数Q31数组******************************************************************/q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q31_t pDataB1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q31_t pDataDst1[9];arm_matrix_instance_q31 pSrcA1; //3行3列数据arm_matrix_instance_q31 pSrcB1; //3行3列数据arm_matrix_instance_q31 pDst1;/****定点数Q15数组******************************************************************/q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q15_t pDataB2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q15_t pDataDst2[9];arm_matrix_instance_q15 pSrcA2; //3行3列数据arm_matrix_instance_q15 pSrcB2; //3行3列数据arm_matrix_instance_q15 pDst2;q15_t pState[9];/****浮点数***********************************************************************/pSrcA.numCols = 3;pSrcA.numRows = 3;pSrcA.pData = pDataA;pSrcB.numCols = 3;pSrcB.numRows = 3;pSrcB.pData = pDataB;pDst.numCols = 3;pDst.numRows = 3;pDst.pData = pDataDst;printf("****浮点数******************************************\r\n");arm_mat_mult_f32(&pSrcA, &pSrcB, &pDst);for(i = 0; i < 9; i++){printf("pDataDst[%d] = %f\r\n", i, pDataDst[i]);}/****定点数Q31***********************************************************************/pSrcA1.numCols = 3;pSrcA1.numRows = 3;pSrcA1.pData = pDataA1;pSrcB1.numCols = 3;pSrcB1.numRows = 3;pSrcB1.pData = pDataB1;pDst1.numCols = 3;pDst1.numRows = 3;pDst1.pData = pDataDst1;printf("****定点数Q31******************************************\r\n");arm_mat_mult_q31(&pSrcA1, &pSrcB1, &pDst1);arm_mat_mult_fast_q31(&pSrcA1, &pSrcB1, &pDst1);for(i = 0; i < 9; i++){printf("pDataDst1[%d] = %d\r\n", i, pDataDst1[i]);}/****定点数Q15***********************************************************************/pSrcA2.numCols = 3;pSrcA2.numRows = 3;pSrcA2.pData = pDataA2;pSrcB2.numCols = 3;pSrcB2.numRows = 3;pSrcB2.pData = pDataB2;pDst2.numCols = 3;pDst2.numRows = 3;pDst2.pData = pDataDst2;printf("****定点数Q15******************************************\r\n");arm_mat_mult_q15(&pSrcA2, &pSrcB2, &pDst2, pState);arm_mat_mult_fast_q15(&pSrcA2, &pSrcB2, &pDst2, pState);for(i = 0; i < 9; i++){printf("pDataDst2[%d] = %d\r\n", i, pDataDst2[i]);}
}

实验现象（按下K2按键后串口打印）：

下面通过matlab来实现矩阵的放缩：

22.5 转置矩阵 MatTrans

以3*3矩阵为例，转置矩阵的实现公式如下：

22.5.1 函数arm_mat_trans_f32

函数原型：

arm_status arm_mat_trans_f32(

const arm_matrix_instance_f32 * pSrc,

arm_matrix_instance_f32 * pDst)

函数描述：

这个函数用于浮点数的转置矩阵求解。

函数参数：

第1个参数是矩阵源地址。
第2个参数是转置后的矩阵地址。
返回值，ARM_MATH_SUCCESS表示成功，ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

注意事项：

矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话，那么pDst地址必须是N x M格式。

22.5.2 函数arm_mat_trans_q31

函数原型：

arm_status arm_mat_trans_q31(

const arm_matrix_instance_q31 * pSrc,

arm_matrix_instance_q31 * pDst)

函数描述：

这个函数用于定点数Q31的转置矩阵求解。

函数参数：

第1个参数是矩阵源地址。
第2个参数是转置后的矩阵地址。
返回值，ARM_MATH_SUCCESS表示成功，ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

注意事项：

矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话，那么pDst地址必须是N x M格式。

22.5.3 函数arm_mat_trans_q15

函数原型：

arm_status arm_mat_trans_q15(

const arm_matrix_instance_q15 * pSrc,

arm_matrix_instance_q15 * pDst)

函数描述：

这个函数用于定点数Q15的转置矩阵求解。

函数参数：

第1个参数是矩阵源地址。
第2个参数是转置后的矩阵地址。
返回值，ARM_MATH_SUCCESS表示成功，ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

注意事项：

矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话，那么pDst地址必须是N x M格式。

22.5.4 使用举例（含matlab实现）

程序设计：

/*
*********************************************************************************************************
*    函 数 名: DSP_MatScale
*    功能说明: 矩阵放缩
*    形    参: 无
*    返 回 值: 无
*********************************************************************************************************
*/
static void DSP_MatScale(void)
{uint8_t i;/****浮点数数组******************************************************************/float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};float32_t scale = 1.1f;float32_t pDataDst[9];arm_matrix_instance_f32 pSrcA; //3行3列数据arm_matrix_instance_f32 pDst;/****定点数Q31数组******************************************************************/q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q31_t scaleFract = 10;int32_t shift = 0;q31_t pDataDst1[9];arm_matrix_instance_q31 pSrcA1; //3行3列数据arm_matrix_instance_q31 pDst1;/****定点数Q15数组******************************************************************/q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q15_t scaleFract1 = 10;int32_t shift1 = 0;q15_t pDataDst2[9];arm_matrix_instance_q15 pSrcA2; //3行3列数据arm_matrix_instance_q15 pDst2;/****浮点数***********************************************************************/pSrcA.numCols = 3;pSrcA.numRows = 3;pSrcA.pData = pDataA;pDst.numCols = 3;pDst.numRows = 3;pDst.pData = pDataDst;printf("****浮点数******************************************\r\n");arm_mat_scale_f32(&pSrcA, scale, &pDst);for(i = 0; i < 9; i++){printf("pDataDst[%d] = %f\r\n", i, pDataDst[i]);}/****定点数Q31***********************************************************************/pSrcA1.numCols = 3;pSrcA1.numRows = 3;pSrcA1.pData = pDataA1;pDst1.numCols = 3;pDst1.numRows = 3;pDst1.pData = pDataDst1;printf("****定点数Q31******************************************\r\n");arm_mat_scale_q31(&pSrcA1, scaleFract, shift, &pDst1);for(i = 0; i < 9; i++){printf("pDataDst1[%d] = %d\r\n", i, pDataDst1[i]);}/****定点数Q15***********************************************************************/pSrcA2.numCols = 3;pSrcA2.numRows = 3;pSrcA2.pData = pDataA2;pDst2.numCols = 3;pDst2.numRows = 3;pDst2.pData = pDataDst2;printf("****定点数Q15******************************************\r\n");arm_mat_scale_q15(&pSrcA2, scaleFract1, shift1, &pDst2);for(i = 0; i < 9; i++){printf("pDataDst2[%d] = %d\r\n", i, pDataDst2[i]);}
}/*
*********************************************************************************************************
*    函 数 名: DSP_MatTrans
*    功能说明: 矩阵数据初始化
*    形    参: 无
*    返 回 值: 无
*********************************************************************************************************
*/
static void DSP_MatTrans(void)
{uint8_t i;/****浮点数数组******************************************************************/float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};float32_t pDataDst[9];arm_matrix_instance_f32 pSrcA; //3行3列数据arm_matrix_instance_f32 pDst;/****定点数Q31数组******************************************************************/q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q31_t pDataDst1[9];arm_matrix_instance_q31 pSrcA1; //3行3列数据arm_matrix_instance_q31 pDst1;/****定点数Q15数组******************************************************************/q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};q15_t pDataDst2[9];arm_matrix_instance_q15 pSrcA2; //3行3列数据arm_matrix_instance_q15 pDst2;/****浮点数***********************************************************************/pSrcA.numCols = 3;pSrcA.numRows = 3;pSrcA.pData = pDataA;pDst.numCols = 3;pDst.numRows = 3;pDst.pData = pDataDst;printf("****浮点数******************************************\r\n");arm_mat_trans_f32(&pSrcA, &pDst);for(i = 0; i < 9; i++){printf("pDataDst[%d] = %f\r\n", i, pDataDst[i]);}/****定点数Q31***********************************************************************/pSrcA1.numCols = 3;pSrcA1.numRows = 3;pSrcA1.pData = pDataA1;pDst1.numCols = 3;pDst1.numRows = 3;pDst1.pData = pDataDst1;printf("****定点数Q31******************************************\r\n");arm_mat_trans_q31(&pSrcA1, &pDst1);for(i = 0; i < 9; i++){printf("pDataDst1[%d] = %d\r\n", i, pDataDst1[i]);}/****定点数Q15***********************************************************************/pSrcA2.numCols = 3;pSrcA2.numRows = 3;pSrcA2.pData = pDataA2;pDst2.numCols = 3;pDst2.numRows = 3;pDst2.pData = pDataDst2;printf("****定点数Q15******************************************\r\n");arm_mat_trans_q15(&pSrcA2, &pDst2);for(i = 0; i < 9; i++){printf("pDataDst2[%d] = %d\r\n", i, pDataDst2[i]);}
}

实验现象（按下K3按键后串口打印）：

下面通过matlab来实现矩阵的放缩：

22.6 实验例程说明（MDK）

配套例子：

V7-217_DSP矩阵运算（放缩，乘法和转置）

实验目的：

学习DSP复数运算（放缩，乘法和转置）

实验内容：

启动一个自动重装软件定时器，每100ms翻转一次LED2。
按下按键K1，串口打函数DSP_MatScale的输出数据。
按下按键K2，串口打函数DSP_MatMult的输出数据。
按下按键K3，串口打函数DSP_MatTrans的输出数据。

使用AC6注意事项

特别注意附件章节C的问题

上电后串口打印的信息：

波特率 115200，数据位 8，奇偶校验位无，停止位 1。

详见本章的3.4 ，4.6和5.4小节。

程序设计：

系统栈大小分配：

RAM空间用的DTCM：

硬件外设初始化

硬件外设的初始化是在 bsp.c 文件实现：

/*
*********************************************************************************************************
*    函 数 名: bsp_Init
*    功能说明: 初始化所有的硬件设备。该函数配置CPU寄存器和外设的寄存器并初始化一些全局变量。只需要调用一次
*    形    参：无
*    返 回 值: 无
*********************************************************************************************************
*/
void bsp_Init(void)
{/* 配置MPU */MPU_Config();/* 使能L1 Cache */CPU_CACHE_Enable();/* STM32H7xx HAL 库初始化，此时系统用的还是H7自带的64MHz，HSI时钟:- 调用函数HAL_InitTick，初始化滴答时钟中断1ms。- 设置NVIV优先级分组为4。*/HAL_Init();/* 配置系统时钟到400MHz- 切换使用HSE。- 此函数会更新全局变量SystemCoreClock，并重新配置HAL_InitTick。*/SystemClock_Config();/* Event Recorder：- 可用于代码执行时间测量，MDK5.25及其以上版本才支持，IAR不支持。- 默认不开启，如果要使能此选项，务必看V7开发板用户手册第8章*/
#if Enable_EventRecorder == 1  /* 初始化EventRecorder并开启 */EventRecorderInitialize(EventRecordAll, 1U);EventRecorderStart();
#endifbsp_InitKey();        /* 按键初始化，要放在滴答定时器之前，因为按钮检测是通过滴答定时器扫描 */bsp_InitTimer();      /* 初始化滴答定时器 */bsp_InitUart();    /* 初始化串口 */bsp_InitExtIO();    /* 初始化FMC总线74HC574扩展IO. 必须在 bsp_InitLed()前执行 */    bsp_InitLed();        /* 初始化LED */
}

MPU配置和Cache配置：

数据Cache和指令Cache都开启。配置了AXI SRAM区（本例子未用到AXI SRAM），FMC的扩展IO区。

/*
*********************************************************************************************************
*    函 数 名: MPU_Config
*    功能说明: 配置MPU
*    形    参: 无
*    返 回 值: 无
*********************************************************************************************************
*/
static void MPU_Config( void )
{MPU_Region_InitTypeDef MPU_InitStruct;/* 禁止 MPU */HAL_MPU_Disable();/* 配置AXI SRAM的MPU属性为Write back, Read allocate，Write allocate */MPU_InitStruct.Enable           = MPU_REGION_ENABLE;MPU_InitStruct.BaseAddress      = 0x24000000;MPU_InitStruct.Size             = MPU_REGION_SIZE_512KB;MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS;MPU_InitStruct.IsBufferable     = MPU_ACCESS_BUFFERABLE;MPU_InitStruct.IsCacheable      = MPU_ACCESS_CACHEABLE;MPU_InitStruct.IsShareable      = MPU_ACCESS_NOT_SHAREABLE;MPU_InitStruct.Number           = MPU_REGION_NUMBER0;MPU_InitStruct.TypeExtField     = MPU_TEX_LEVEL1;MPU_InitStruct.SubRegionDisable = 0x00;MPU_InitStruct.DisableExec      = MPU_INSTRUCTION_ACCESS_ENABLE;HAL_MPU_ConfigRegion(&MPU_InitStruct);/* 配置FMC扩展IO的MPU属性为Device或者Strongly Ordered */MPU_InitStruct.Enable           = MPU_REGION_ENABLE;MPU_InitStruct.BaseAddress      = 0x60000000;MPU_InitStruct.Size             = ARM_MPU_REGION_SIZE_64KB;    MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS;MPU_InitStruct.IsBufferable     = MPU_ACCESS_BUFFERABLE;MPU_InitStruct.IsCacheable      = MPU_ACCESS_NOT_CACHEABLE;    MPU_InitStruct.IsShareable      = MPU_ACCESS_NOT_SHAREABLE;MPU_InitStruct.Number           = MPU_REGION_NUMBER1;MPU_InitStruct.TypeExtField     = MPU_TEX_LEVEL0;MPU_InitStruct.SubRegionDisable = 0x00;MPU_InitStruct.DisableExec      = MPU_INSTRUCTION_ACCESS_ENABLE;HAL_MPU_ConfigRegion(&MPU_InitStruct);/*使能 MPU */HAL_MPU_Enable(MPU_PRIVILEGED_DEFAULT);
}/*
*********************************************************************************************************
*    函 数 名: CPU_CACHE_Enable
*    功能说明: 使能L1 Cache
*    形    参: 无
*    返 回 值: 无
*********************************************************************************************************
*/
static void CPU_CACHE_Enable(void)
{/* 使能 I-Cache */SCB_EnableICache();/* 使能 D-Cache */SCB_EnableDCache();
}

主功能：

主程序实现如下操作：

启动一个自动重装软件定时器，每100ms翻转一次LED2。
按下按键K1，串口打函数DSP_MatScale的输出数据。
按下按键K2，串口打函数DSP_MatMult的输出数据。
按下按键K3，串口打函数DSP_MatTrans的输出数据。

/*
*********************************************************************************************************
*    函 数 名: main
*    功能说明: c程序入口
*    形    参: 无
*    返 回 值: 错误代码(无需处理)
*********************************************************************************************************
*/
int main(void)
{uint8_t ucKeyCode;        /* 按键代码 */bsp_Init();        /* 硬件初始化 */PrintfLogo();    /* 打印例程信息到串口1 */PrintfHelp();    /* 打印操作提示信息 */bsp_StartAutoTimer(0, 100);    /* 启动1个100ms的自动重装的定时器 *//* 进入主程序循环体 */while (1){bsp_Idle();        /* 这个函数在bsp.c文件。用户可以修改这个函数实现CPU休眠和喂狗 *//* 判断定时器超时时间 */if (bsp_CheckTimer(0))    {/* 每隔100ms 进来一次 */  bsp_LedToggle(2);}ucKeyCode = bsp_GetKey();    /* 读取键值, 无键按下时返回 KEY_NONE = 0 */if (ucKeyCode != KEY_NONE){switch (ucKeyCode){case KEY_DOWN_K1:            /* 按下按键K1，串口打函数DSP_MatScale的输出数据 */DSP_MatScale();break;case KEY_DOWN_K2:            /* 按下按键K2，串口打函数DSP_MatMult的输出数据 */DSP_MatMult();break;case KEY_DOWN_K3:            /* 按下按键K3，串口打函数DSP_MatTrans的输出数据 */DSP_MatTrans();break;default:/* 其他的键值不处理 */break;}}}
}

22.7 实验例程说明（IAR）

配套例子：

V7-217_DSP矩阵运算（放缩，乘法和转置）

实验目的：

学习DSP复数运算（放缩，乘法和转置）

实验内容：

启动一个自动重装软件定时器，每100ms翻转一次LED2。
按下按键K1，串口打函数DSP_MatScale的输出数据。
按下按键K2，串口打函数DSP_MatMult的输出数据。
按下按键K3，串口打函数DSP_MatTrans的输出数据。

上电后串口打印的信息：

波特率 115200，数据位 8，奇偶校验位无，停止位 1。

详见本章的3.4 ，4.6和5.4小节。

程序设计：

系统栈大小分配：

RAM空间用的DTCM：

硬件外设初始化

硬件外设的初始化是在 bsp.c 文件实现：

/*
*********************************************************************************************************
*    函 数 名: bsp_Init
*    功能说明: 初始化所有的硬件设备。该函数配置CPU寄存器和外设的寄存器并初始化一些全局变量。只需要调用一次
*    形    参：无
*    返 回 值: 无
*********************************************************************************************************
*/
void bsp_Init(void)
{/* 配置MPU */MPU_Config();/* 使能L1 Cache */CPU_CACHE_Enable();/* STM32H7xx HAL 库初始化，此时系统用的还是H7自带的64MHz，HSI时钟:- 调用函数HAL_InitTick，初始化滴答时钟中断1ms。- 设置NVIV优先级分组为4。*/HAL_Init();/* 配置系统时钟到400MHz- 切换使用HSE。- 此函数会更新全局变量SystemCoreClock，并重新配置HAL_InitTick。*/SystemClock_Config();/* Event Recorder：- 可用于代码执行时间测量，MDK5.25及其以上版本才支持，IAR不支持。- 默认不开启，如果要使能此选项，务必看V7开发板用户手册第8章*/
#if Enable_EventRecorder == 1  /* 初始化EventRecorder并开启 */EventRecorderInitialize(EventRecordAll, 1U);EventRecorderStart();
#endifbsp_InitKey();        /* 按键初始化，要放在滴答定时器之前，因为按钮检测是通过滴答定时器扫描 */bsp_InitTimer();      /* 初始化滴答定时器 */bsp_InitUart();    /* 初始化串口 */bsp_InitExtIO();    /* 初始化FMC总线74HC574扩展IO. 必须在 bsp_InitLed()前执行 */    bsp_InitLed();        /* 初始化LED */
}

MPU配置和Cache配置：

数据Cache和指令Cache都开启。配置了AXI SRAM区（本例子未用到AXI SRAM），FMC的扩展IO区。

/*
*********************************************************************************************************
*    函 数 名: MPU_Config
*    功能说明: 配置MPU
*    形    参: 无
*    返 回 值: 无
*********************************************************************************************************
*/
static void MPU_Config( void )
{MPU_Region_InitTypeDef MPU_InitStruct;/* 禁止 MPU */HAL_MPU_Disable();/* 配置AXI SRAM的MPU属性为Write back, Read allocate，Write allocate */MPU_InitStruct.Enable           = MPU_REGION_ENABLE;MPU_InitStruct.BaseAddress      = 0x24000000;MPU_InitStruct.Size             = MPU_REGION_SIZE_512KB;MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS;MPU_InitStruct.IsBufferable     = MPU_ACCESS_BUFFERABLE;MPU_InitStruct.IsCacheable      = MPU_ACCESS_CACHEABLE;MPU_InitStruct.IsShareable      = MPU_ACCESS_NOT_SHAREABLE;MPU_InitStruct.Number           = MPU_REGION_NUMBER0;MPU_InitStruct.TypeExtField     = MPU_TEX_LEVEL1;MPU_InitStruct.SubRegionDisable = 0x00;MPU_InitStruct.DisableExec      = MPU_INSTRUCTION_ACCESS_ENABLE;HAL_MPU_ConfigRegion(&MPU_InitStruct);/* 配置FMC扩展IO的MPU属性为Device或者Strongly Ordered */MPU_InitStruct.Enable           = MPU_REGION_ENABLE;MPU_InitStruct.BaseAddress      = 0x60000000;MPU_InitStruct.Size             = ARM_MPU_REGION_SIZE_64KB;    MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS;MPU_InitStruct.IsBufferable     = MPU_ACCESS_BUFFERABLE;MPU_InitStruct.IsCacheable      = MPU_ACCESS_NOT_CACHEABLE;    MPU_InitStruct.IsShareable      = MPU_ACCESS_NOT_SHAREABLE;MPU_InitStruct.Number           = MPU_REGION_NUMBER1;MPU_InitStruct.TypeExtField     = MPU_TEX_LEVEL0;MPU_InitStruct.SubRegionDisable = 0x00;MPU_InitStruct.DisableExec      = MPU_INSTRUCTION_ACCESS_ENABLE;HAL_MPU_ConfigRegion(&MPU_InitStruct);/*使能 MPU */HAL_MPU_Enable(MPU_PRIVILEGED_DEFAULT);
}/*
*********************************************************************************************************
*    函 数 名: CPU_CACHE_Enable
*    功能说明: 使能L1 Cache
*    形    参: 无
*    返 回 值: 无
*********************************************************************************************************
*/
static void CPU_CACHE_Enable(void)
{/* 使能 I-Cache */SCB_EnableICache();/* 使能 D-Cache */SCB_EnableDCache();
}

主功能：

主程序实现如下操作：

启动一个自动重装软件定时器，每100ms翻转一次LED2。
按下按键K1，串口打函数DSP_MatScale的输出数据。
按下按键K2，串口打函数DSP_MatMult的输出数据。
按下按键K3，串口打函数DSP_MatTrans的输出数据。

/*
*********************************************************************************************************
*    函 数 名: main
*    功能说明: c程序入口
*    形    参: 无
*    返 回 值: 错误代码(无需处理)
*********************************************************************************************************
*/
int main(void)
{uint8_t ucKeyCode;        /* 按键代码 */bsp_Init();        /* 硬件初始化 */PrintfLogo();    /* 打印例程信息到串口1 */PrintfHelp();    /* 打印操作提示信息 */bsp_StartAutoTimer(0, 100);    /* 启动1个100ms的自动重装的定时器 *//* 进入主程序循环体 */while (1){bsp_Idle();        /* 这个函数在bsp.c文件。用户可以修改这个函数实现CPU休眠和喂狗 *//* 判断定时器超时时间 */if (bsp_CheckTimer(0))    {/* 每隔100ms 进来一次 */  bsp_LedToggle(2);}ucKeyCode = bsp_GetKey();    /* 读取键值, 无键按下时返回 KEY_NONE = 0 */if (ucKeyCode != KEY_NONE){switch (ucKeyCode){case KEY_DOWN_K1:            /* 按下按键K1，串口打函数DSP_MatScale的输出数据 */DSP_MatScale();break;case KEY_DOWN_K2:            /* 按下按键K2，串口打函数DSP_MatMult的输出数据 */DSP_MatMult();break;case KEY_DOWN_K3:            /* 按下按键K3，串口打函数DSP_MatTrans的输出数据 */DSP_MatTrans();break;default:/* 其他的键值不处理 */break;}}}
}

22.8 总结

本期教程就跟大家讲这么多，有兴趣的可以深入研究下算法的具体实现。

【STM32H7的DSP教程】第22章 DSP矩阵运算-放缩，乘法和转置矩阵相关推荐

【STM32F407的DSP教程】第22章 DSP矩阵运算-放缩，乘法和转置矩阵
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第22章 DSP矩阵运算-放缩,乘法和转置矩阵 ...
dsp指令ixh_第一章 DSP入门教程(非常经典).pdf
DSP 入门教程 1.TI DSP 的选型主要考虑处理速度.功耗.程序存储器和数据存储器的容量.片内的资源,如定时器的数量. I/O 口数量.中断数量.DMA 通道数等.DSP 的主要供应商有 TI ...
【STM32H7的DSP教程】第11章 DSP基础函数-绝对值，求和，乘法和点乘
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第11章 DSP基础函数-绝对值,求和,乘法和点 ...
【STM32H7的DSP教程】第38章 STM32H7的FIR高通滤波器实现（支持逐个数据的实时滤波）
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第38章 STM32H7的FIR高通滤波器实现( ...
【STM32F429的DSP教程】第12章 DSP基础函数-相反数，偏移，移位，减法和比例因子
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第12章 DSP基础函数-相反数,偏移,移位,减 ...
【STM32F429的DSP教程】第6章 ARM DSP源码和库移植方法（MDK5的AC5和AC6）
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第6章 ARM DSP源码和库移植方法(MDK5的AC5 ...
【STM32F429的DSP教程】第25章 DSP变换运算-快速傅里叶变换原理（FFT）
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第25章 DSP变换运算-快速傅里叶变换原理(F ...
【STM32F407的DSP教程】第24章 DSP变换运算-傅里叶变换
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第24章 DSP变换运算-傅里叶变换本章节开始 ...
【STM32F407的DSP教程】第18章 DSP控制函数-更好用的SIN，COS计算
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第18章 DSP控制函数-更好用的SIN,COS ...
【STM32F429的DSP教程】第21章 DSP矩阵运算-加法，减法和逆矩阵
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第21章 DSP矩阵运算-加法,减法和逆矩阵本 ...

【STM32H7的DSP教程】第22章 DSP矩阵运算-放缩，乘法和转置矩阵

第22章 DSP矩阵运算-放缩，乘法和转置矩阵

22.1 初学者重要提示

22.2 DSP基础运算指令

22.3 矩阵放缩（MatScale）

22.3.1 函数arm_mat_scale_f32

22.3.2 函数arm_mat_scale_q31

22.3.3 函数arm_mat_scale_q15

22.3.4 使用举例（含matlab实现）

22.4 矩阵乘法（MatMult）

22.4.1 函数arm_mat_mult_f32

22.4.2 函数arm_mat_mult_q31

22.4.3 函数arm_mat_mult_q15

22.4.4 函数arm_mat_mult_fast_q31

22.4.5 函数arm_mat_mult_fast_q15

22.4.6 使用举例（含matlab实现）

22.5 转置矩阵 MatTrans

22.5.1 函数arm_mat_trans_f32

22.5.2 函数arm_mat_trans_q31

22.5.3 函数arm_mat_trans_q15

22.5.4 使用举例（含matlab实现）

22.6 实验例程说明（MDK）

22.7 实验例程说明（IAR）

22.8 总结

【STM32H7的DSP教程】第22章 DSP矩阵运算-放缩，乘法和转置矩阵相关推荐

最新文章

热门文章