C28x FIR - Filter 示例汇编代码解读

SECTIONS
{    D_LINE: align(256) { }  > RAM  PAGE 1. . .
}

上面是cmd文件的配置，D_LINE用于保存FIR要处理的数据。由于使用了循环间接寻址（Circular Indirect Addressing Modes (XAR6, XAR1)），用XAR6来做数据指针，它指向的初始地址必须是256对齐的，即XAR6开始赋给它的指针低8位必须为0,（XAR6 points to the current address in the buffer. The top of the buffer must be at an address where the 8 LSBs are all 0s.），用XAR1的AR1[7:0]来指示一个循环要处理多少数据，处理AR1个数据即循环一次。由于只用了AR1的8位来表示循环范围，所以一个循环最大只能是（0~255）个字（TI 16位dsp中一个字16bit）。

参考：spru430d，TMS320C28x DSP CPU and Instruction Set Reference Guide，p145~146

TAPS    .set    4       ; FIR – Order +1
xn    .usect “D_LINE”,TAPS       ; sample array in I1Q15 .data           ; FIR – Coeffs in I1Q15
tbl    .word    32768*707/1000       ; 0.707    .word    32768*123/1000       ; 0.123.word   32768*(-175)/1000       ; -0.175.word    32768*345/1000       ; 0.345
    .text
FIR:    SETC  SXM       ; 2’s complement mathCLRC  OVM       ; no clipping modeSPM    1       ; fractional mathMOVL    XAR7,#tbl       ; coefficient pointerMOVL  XAR6,#xn       ; circular buffer pointerMOV   AR1,#TAPS-1       ; buffer offsetMOV    *XAR6%++,*(0:adc)       ; get new sample ( x(n) )ZAPA           ; clear ACC,P,OVC    RPT     #(TAPS/2)-1       ; RPT next instr.(#+1)times
||    DMAC    ACC:P,*XAR6%++,*XAR7++ ; multiply & accumulate 2pairsADDL    ACC:P       ; add even & odd pair-sumsMOV    *(0:dac),AH       ; update output ( y(n) )RET

.word    32768*707/1000       ; 0.707 上面这个表示FIR的系数，乘以32768表示使用IQ15， .word表示这个用16bit存储， 707/1000是为了精度考虑

SPM    1 表示DMAC乘了之后结果左移1位。具体说明见后面。

MOV    *XAR6%++,*(0:adc)       ; get new sample ( x(n) )上面这个原型为 MOV loc16,*(0:16bit) ; [loc16] = [0:16bit]，由于是loc16（指向16bit的地址），所以XAR6++表示跳到下一个字（16bit），XAR6后面的%表示循环间接寻址

 loc16
Selects Direct/Stack/Indirect/Register addressing mode for 16-bit data access.loc32
Selects Direct/Stack/Indirect/Register addressing mode for 32-bit data access.

from：spru430d，p126

*XARn++if(loc16), XARn = XARn + 1if(loc32), XARn = XARn + 2

from：spru430d，p134

RPT     #(TAPS/2)-1       ; RPT next instr.(#+1)times这个重复指令作用于它的下一条指令，指示循环多少次

DMAC    ACC:P,*XAR6%++,*XAR7++ ; multiply & accumulate 2pairs原型：DMAC ACC:P,loc32,*XAR7++  由于是loc32，所以一次++表示加了两个字（共32bit）。DMAC表示Dual 16-bit x 16-bit signed multiply and accumulate.具体如下图：

一个32bit的数据拆成2个字，分别相乘，各自结果都移位PM，上半个字乘、移位后累加到ACC，下半个字乘、移位后的结果累加到P，等效的过程如下：

XT = [loc32];
Temp = Prog[*XAR7 or *XAR7++];
ACC = ACC + (XT.MSW * Temp.MSW) << PM;
P = P + (XT.LSW * Temp.LSW) << PM;

参考：spru430d，p243

ADDL    ACC:P循环之后，把ACC和P的结果累加。为什么要累加，见FIR的算法：

MOV    *(0:dac),AH       ; update output ( y(n) )

只取了累加器的高字给16bit的DAC结果缓冲器，由于是取高半字（高16bit），所以相当于右移16bit，前面化为IQ15是左移15位，差了1位，所以让PM等于1，就刚刚好了。

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>分隔>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

    但是上面的代码好像有些问题，因为MOV    *XAR6%++,*(0:adc)仅仅移动了一个字，而DMAC    ACC:P,*XAR6%++,*XAR7++ 这里一“++”就是两个字，所以到边界的时候有可能就对不齐了。    目前还不清楚，DMAC指令当在用循环间接寻址，取32位数的时候，XAR6刚好是一个奇数，刚好距离循环寻址的边界仅剩一个字的时候，这个32位的数值的高字节究竟是循环寻址区的第一个字节还是越循环寻址区，取与寻址区相邻的一个字节呢？根据TI的文档，应该是后一种比较有可能，因为文档中提到If one of the instructions accessing the circular buffer performs a 32-bit operation,make sure XAR6 and AR1 are both even （都是偶数）before the buffer is accessed.所以上面代码是有问题的，但是作为参考，还是有益的。    开始TI的Filter库是放在sprc082，后来出了controlsuite，sprc082就没更新了，对比sprc082的0.9c（不是上面这个，比较完善了）与controlsuite的代码，还是有点区别的，这部分代码还没仔细看，以后应当用controlSUITE的代码。刚刚下的一个controlSUITE是v3.1.1 - October 8, 2012

controlSUITE：http://www.ti.com/tool/controlsuitecontrolSUITE里面的代码分析，暂缓吧

原创： TrueElement转载请注来源>>

转载于:https://www.cnblogs.com/TrueElement/archive/2012/11/22/2782283.html

C28x FIR - Filter 示例汇编代码解读相关推荐

【嵌入式开发】ARM 关闭中断 ( CPRS 中断控制位 | 中断使能寄存器 | 中断屏蔽寄存器 | 关闭中断 | 汇编代码编写 )
一. 中断控制 ( 基于 S3C6410 开发板 ) 1. 关闭中断的两个步骤 (1) 关闭中断步骤 2. CPRS 寄存器中的中断控制位 (1) CPRS 寄存器简介 (2) CPRS 寄存器中断 ...
mips汇编代码示例解释_通过示例解释cosmosdb
mips汇编代码示例解释 Since I'm going to be giving a spiel (or two) about Data and AI at Microsoft Ignite lat ...
【嵌入式开发】ARM 内存操作 ( DRAM SRAM 类型简介 | Logical Bank | 内存地址空间介绍 | 内存芯片连接方式 | 内存初始化 | 汇编代码示例 )
文章目录一. 内存简介 1. 两大内存分类 ( 1 ) DRAM 简介 ( 定期刷新 | 速度慢 | 成本低 ) ( 2 ) SRAM 简介 ( 不需刷新 | 存取速度快 | 功耗大 | 成本高 ...
directshow 虚拟摄像头实例代码解读
本文只介绍这个源码的大致构成以及怎么修改,因为其他的我也不会啊哈哈哈,我就是用QQ调用虚拟摄像头读取我自己的视频或者图片播放给别人让别人以为这就是实时的而已. 1,示例代码:QQ可用 Directsh ...
装逼一步到位！GauGAN代码解读来了
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货作者:游璐颖,福州大学,Datawhale成员 AI神笔马良如何装逼一 ...
Unet论文解读代码解读
论文地址:http://www.arxiv.org/pdf/1505.04597.pdf 论文解读网络架构: a.U-net建立在FCN的网络架构上,作者修改并扩大了这个网络框架,使其能够使用很少 ...
【嵌入式开发】ARM 异常向量表 ( 异常概念 | 异常处理流程 | 异常向量 | 汇编代码 )
一. 异常向量表 1. 异常相关概念 (1) 异常 (2) 异常类型简介 2. 异常处理 (1) 异常处理二. 异常向量表代码编写 1. 初始化异常向量表模块代码 2. 链接器脚本 3. Makef ...
Jsoup代码解读之四-parser(上)
转载自 Jsoup代码解读之四-parser(上) 作为Java世界最好的HTML 解析库,Jsoup的parser实现非常具有代表性.这部分也是Jsoup最复杂的部分,需要一些数据结构.状态机乃至 ...
程序编码（机器级代码+汇编代码+C代码+反汇编）
[-1]相关声明本文总结于csapp: 了解详情,或有兴趣,建议看原版书籍: [0]程序编码 GCC调用了一系列程序,将源代码转化成可执行代码的流程如下: (1)C预处理器扩展源代码,插入所有用#i ...
如何在Visual Studio项目中正确添加汇编代码 .
引用注明>> [作者:张佩][镜像:www.yiiyee.cn/blog] 1. 问题描述在以往的编程经历中,本人最常使用的汇编代码是__asm {int 3}.它可以在我的代 ...

C28x FIR - Filter 示例汇编代码解读

C28x FIR - Filter 示例汇编代码解读相关推荐

最新文章

热门文章