基于Xilinx的Kintex-7系列XC7K325T的硬件加速卡
产品型号: B-PCIE-K7F5XILINX的Kintex-7系列FPGA处理器
B-PCIE-K7F5是一款基于PCI Express总线架构的高性能FPGA算法加速卡,该板卡采用Xilinx的高性能28nm 7系列FPGA作为运算节点。Xilinx的28nm 7系列FPGA通过对资源、接口以及时钟的优化,在高性能计算(High Performance Computing)上表现出卓越的性能。Kintex-7系列FPGA具有优化的GTX高速收发器,最高支持12.5Gbps线速率,具有百万门级的逻辑资源,尤其适合于大规模逻辑运算。
B-PCIE-K7F5算法加速卡具有5片高性能FPGA处理节点,其中1片Kintex-7系列高容量高性能FPGA(具体型号为:XC7K420T-2FFG901I)作为主FPGA,其余4片Kintex-7系列低容量FPGA(具体型号为:XC7K325T-2FFG676I)作为从FPGA,主从处理节点之间全部采用高速串行通信进行数据交互。
主FPGA主要完成与各个处理节点之间的数据交换、对各个处理节点进行任务分配、资源调度、数据分发等。此外主FPGA还将完成高速串行接口GTX(SFP+万兆光纤接口)扩展、高性能PCIE DMA控制器等功能。
从FPGA主要完成主FPGA分解的算法模块,4个高容量运算节点进行并行运算,各个节点之间通过高速GTX串行接口进行数据交互。
板卡具有高带宽大容量动态缓存,其中各个处理节点均载有两组大容量DDR3 SDRAM缓存单元,用于完成处理复杂逻辑与算法时的数据缓存,适合于乒乓操作。其中每片FPGA的高性能BANK(HP)外挂4片4Gb 16位DDR3 SDRAM颗粒,通过Fly-by拓扑结构构成一组64位的DDR3缓存单元,最高可工作在800MHz时钟频率,其中数据速率可以达到1600M*64bps,DDR3 SDRAM效率可以达到90%以上。每片FPGA的宽范围BANK(HR)外挂2片4Gb 16位DDR3 SDRAM,可独立工作在高达400MHz的时钟频率下,其中数据速率可以达到800M*32bps。
硬件指标
- 标准PCI Express全高全长卡,适合于普通服务器、工作站;
- 符合PCI Express Gen2.0规范,x8模式,理论带宽高达4GByte/s;
- 板载5片Kintex-7系列FPGA处理器: 主FPGA:1片Kintex-7系列 FPGA(XC7K420T-2FFG901I),可与XC7K355T-2FFG901I兼容。 从FPGA:4片Kintex-7系列FPGA(XC7K325T-2FFG676I),可与XC7K410T-2FFG676I、XC7K160T-2FFG676I兼容。
- 每两个从处理节点之间都通过x4的高速串行总线进行互联(支持各种高速串行协议,如RapidIO、Aurora等)。
- 主处理节点与从处理节点之间通过x4的高速串行总线进行互联(支持各种高速串行协议,如RapidIO、Aurora等);
- 板载4路SFP+光纤通道,用于高速串行接口的扩展,最大支持10Gbps/lane线速率,理论传输带宽可达4Gbyte/s。光纤通道串行接口支持各种通信协议,例如RapidIO、Aurora64b/66b以及万兆网络等;
- 每片FPGA均挂载2组DDR3 SDRAM内存,其中HR BANK挂2片4Gb DDR3颗粒,组成32位内存总线,可工作在400MHz时钟频率;HP BANK挂4片4Gb DDR3颗粒,组成64位内存总线,可工作在800MHz时钟频率;两组DDR3可进行乒乓操作。
- 板载高精度有源晶振,温度稳定性高达±0.28ppm,老化率±1ppm;
- 板卡具有1路外时钟输入;
- 板卡具有2个独立的低偏斜、高精度全局时钟网络: 全局时钟网络1: 100MHz LVDS差分时钟网络,用于PCIE接口; 全局时钟网络2: 156.25MHz LVDS差分时钟网络,用于SRIO通信参考时钟;
- 板载8位拨码开关,可通过拨码开关选择板卡的工作模式;
- 具有调试指示灯;
- 板载1片FRAM,用于存储少量参数信息;
- 板载1片32MByte BPI Nor Flash,用于主FPGA的加载;
- 板载4片SPI Flash用于从FPGA的加载。
- 支持Chipscope在线调试加载;
- 支持菊花链式JTAG调试接口;
功能特性
- 从FPGA(XC7K325T)处理性能:
- FPGA采用Xilinx的Kintex-7系列(XC7K325T);
- 逻辑资源:50,950个Slices、326,080个逻辑单元;
- 存储器资源:最大4000Kb分布式RAM,445kb块RAM;
- 时钟资源:具有10个CMTs;
- IO资源:最大支持400个单端IO,最大支持192个差分IO;
- 具有1个PCIE Endpoint,支持gen2;
- 具有16个Gbits收发器,最大支持12.5Gbps。
- 主FPGA(XC7K420T)处理性能:
- FPGA采用Xilinx的Kintex-7系列(XC7K420T);
- 逻辑资源:65,150个Slices、416,960个逻辑单元;
- 存储器资源:最大5938Kb分布式RAM,835kb块RAM;
- 时钟资源:具有8个CMTs;
- IO资源:最大支持300个单端IO,最大支持144个差分IO;
- 具有1个PCIE Endpoint,支持gen2;
- 具有32个低功耗GTX Transceivers,最大支持12.5Gbps。
- 互联性能:
- 4个从FPGA: 两两之间通过x4 SRIO互联,支持SRIO gen2@5Gbps/lane,理论带宽可以到达20Gbps。 两两之间通过x16的IO相连,用于传输低速的控制与配置信号。
- 主FPGA与4个从FPGA: 通过x4 SRIO互联,支持SRIO gen2@5Gbps/lane,理论带宽可以到达20Gbps。 主FPGA与各个从FPGA之间有x4的IO相连,用于传输低速的控制信号。
- 存储性能:
- FPGA的HP BANK: 每一个FPGA的HP BANK支持4Gb 64位 DDR3 SDRAM,可独立工作在800M的时钟频率下,数据速率为1600x64bit,运行效率高达90%;
- FPGA的HR BANK: 每一个FPGA的HR BANK支持4Gb 32位DDR3 SDRAM,可独立工作在400MHz时钟频率下,数据速率为800Mx32bit,运行效率高达90%;
接口特性
- 标准PCIE全高全长卡;
- 板卡具有4路SFP+光纤通道,LC接口,支持10G光模块;
- PCIe金手指:x8 金手指,适用于x8、x16机箱;
- 板卡具有1路外时钟输入,通过SMA连接器输入。
软件支持
- FPGA软件支持:
- PCIE DMA链路控制;
- FPGA之间的SRIO通信;
- 板卡与板卡之间的10G光纤接口通信。
- 其他软件支持:
- 定制算法与逻辑;
- 定制PC机驱动与演示程序。
- 支持win7 64位/32位操作系统,支持Linux操作系统。
应用场景
- 高性能计算;
- 服务器硬件加速;
- 算法验证平台。
物理特征
物理与电气特征 |
|
板卡尺寸 |
106.65*352.19mm |
板卡供电 |
2A max@12VDC(±5%) |
散热方式 |
风冷散热 |
工作环境 |
|
工作温度 |
-40°~+85°C(工业级) |
存储温度 |
-55°~+125°C |
工作湿度 |
5%~95%,非凝结 |
可靠性指标 |
|
使用寿命 |
>10年 |
MTTR |
<20分钟 |
MTBF |
10,000,000小时 |
质量标准 |
优势(对比DINIGROUP公司的DNK7_F5PCIE)
对比项目 |
DNK7_F5PCIE |
B-PCIE-K7F5 |
结论 |
处理性能 |
5片K7系列FPGA,1片Virtex-6系列FPGA |
5片Kintex-7系列FPGA |
更优化的结构 |
逻辑资源 |
410K + 325K*4 |
420K + 325K*4 |
优于 |
高速串行收发器 |
主 FPGA:16个GTX |
主FPGA:32个GTX |
优于 |
互联方式 |
互联方式:46位并行总线 |
互联方式:串行SRIO x4 |
优于 |
接口类型 |
4个千兆以太网口 |
2个千兆网口+2个万兆光口 |
|
GTX扩展 |
无 |
4路高速万兆光纤,更易于与系统内其它板卡互联 |
优于 |
PCIE接口 |
支持PCIE gen1 x4,最高支持2.5Gbps线速率 |
支持PCIe gen2 x8,最高支持5Gbps线速率,总数据带宽:4GByte |
等同 |
B-PCIE-K7F5与DINI公司的DNK7_F5PCIE比较最大特色在于:
(1)采用高容量高性能的420T FPGA,简化了PCIE设计,增加了GTX数量,使得系统互联更方便。省去了Virtex-6 FPGA作为PCIE桥片。
(2)互联方式均采用RapidIO高速串行互联,简化了设计,提高了性能。
全文转自:
http://blog.sina.com.cn/s/blog_14ecc0afb0102wfx8.html
http://www.taodudu.cc/news/show-4701589.html
相关文章:
- 7K325T 引脚功能详解
- 7-4 森森旅游 (20 分)
- dijkstra算法和A*算法
- 编写一个带有main函数的类,调用上面的汽车类,实例化奔驰、大众、丰田等不同品牌和型号,模拟开车过程:启动、加速、转弯、刹车、息火,实时显示速度。...
- 松翰2.4G无线传输USB摄像头方案
- 松翰SN8F5703单片机WDT例程
- 寻松翰独立4个PWM的MCU
- FS2711单片机可替换松翰SN8P2711
- 凌阳SPCA2688 4K摄像头/松翰1080P H.264 摄像头/瑞昱WDR(宽动态)USB摄像头模组
- js实现元素曝光
- 基于双曝光与数值计算法全息干涉相位畸变补偿实例分析
- 《计算机网络》day03-计算机网络的体系结构
- 应用安全市场在我们国家当前的情况
- 读 曹林的《人脸识别与人体动作识别技术及应用》笔记
- 读书笔记 Tom Expert 00章-配置环境
- Web Scraping with Python 学习笔记8
- 幸福是一种能力读后感_我分析了736天的幸福感。 这是我学到的。
- 《HeadFirst设计模式》读书笔记-第2章-观察者模式
- 《数学之美》读书记录【思维导图记录】:第五章,隐含马尔可夫模型
- 读保哥《ASP.NET MVC2开发实战》第二回(Model)
- 【读点论文】MnasNet: Platform-Aware Neural Architecture Search for Mobile,用神经网络搜索的方式来设计网络平衡精度与速度
- 《Small Memory Software:Patterns For System With Limited Memory》读书笔记
- 周日下雨,寂寥中读核
- 【笔记】三张图读懂机器学习:基本概念、五大流派与九种常见算法
- gitchat训练营深度学习入门读书笔记
- 单元测试的艺术--读书笔记
- 一文读懂隐马尔科夫
- python 读excel pandas_Python使用Pandas读写EXCEL文件教程
- MarkovModels马尔科夫模型读书笔记
- 关于oracle怎么保证读一致性
基于Xilinx的Kintex-7系列XC7K325T的硬件加速卡相关推荐
- 基于 Kintex UltraScale 系列 FPGA 的高性能 VPX 数据预处理载板(4 路 SRIO X4、 XCKU115-2FFVA1517I)
VPX302 是一款基于 3U VPX 总线架构的高性能数据预处理FMC 载板,板卡具有 1 个 FMC+(HPC)接口,1 个 X8 GTH 背板互联接口,可以实现 1 路 PCIe x8:具有 4 ...
- 基于Xilinx Kintex-7 FPGA K7 XC7K325T PCIeX8 四路光纤卡226
基于Xilinx Kintex-7 FPGA K7 XC7K325T PCIeX8 四路光纤卡 正在上传-重新上传取消 一.板卡概述 板卡主芯片采用Xilinx公司的XC7K325T-2FFG900 ...
- 基于Xilinx Zynq-7000系列XC7Z035/XC7Z045/XC7Z100高性能SoC处理器设计的高端核心板
核心板简介 创龙SOM-TLZ7xH是一款基于Xilinx Zynq-7000系列XC7Z035/XC7Z045/XC7Z100高性能SoC处理器设计的高端核心板,处理器集成PS端双核ARM Cort ...
- 基于 Kintex UltraScale 系列 FPGA 的高性能 PXIE 数据预处理载板(KU060 +FMC子卡接口)
PXIE302 是一款基于 3U PXIE 总线架构的高性能数据预处理FMC 载板,板卡具有 1 个 FMC+(HPC)接口,1 个 X8 GTH 背板互联接口,可以实现 1 路 PCIe x8.板卡 ...
- 基于Xilinx Kintex-7系列FPGA高端设计的TLK7-EVM评估板简介
TLK7-EVM评估板简介 创龙科技TLK7-EVM是一款基于Xilinx Kintex-7系列FPGA设计的高端评估板,由核心板和评估底板组成.核心板经过专业的PCB Layout和高低温测试验证, ...
- 基于Xilinx Kintex-7系列FPGA的JTAG下载器接口、LED指示灯
TL-K7FMC采集卡是一款由广州创龙基于Xilinx Kintex-7系列FPGA自主研发的FMC数据采集卡,可配套广州创龙TMS320C6655.TMS320C6657.TMS320C6678开发 ...
- 基于FMC的Kintex XCKU060高性能PCIe载板 XCKU060板卡 AD采集板卡
基于FMC的Kintex XCKU060高性能PCIe载板 一.板卡概述 板卡主控芯片采用Xilinx 公司的 Kintex UltraScale系列FPGA XCKU060-2FFVA1156.板载 ...
- 基于xilinx vivado的XADC IP设置使用详解
基于xilinx vivado的XADC IP设置使用详解 目录 1 XADC概述 2 引用 3 XADC 端口 4 XADC IP设置 5 IP的例程代码的使用 6 Chanel输出值的含义即寄存器 ...
- 基于Xilinx Spartan-7 FPGA实现SMC接口
1 引言 Static Memory Controller(SMC)静态存储控制器,SMC接口应用场景之一就是ARM和FPGA通信.FPGA作为从设备,ARM作为主设备.具体实现的逻辑功能也是通过地址 ...
最新文章
- Android RatingBar
- 正则表达式学习实例1
- python中plot柱状图-python matplotlib模块: bar(柱状图)
- CVE-2015-0235: GHOST – A Critical Vulnerability in the Glibc Library
- Strange Definition CodeForces - 1471D
- 做一个好的搜索引擎有多难
- centos 7 nginx hhvm mysql_CentOS 7 编译安装 HHVM 3.4.1
- 经典面试题(8):关于逻辑运算符,下面代码运行的结果是什么?
- java 蓝桥杯算法训练 P1102
- ios 获取最后一个cell_ios – UICollectionView estimatedItemSize – 最后一个单元格未对齐...
- vue仿网易云音乐播放器的前端补充
- 软件系统设计-16-架构文档
- 生活中哪些地方运用计算机网络,计算机网络技术在生活中应用.doc
- SubmitButton
- 【总结】仰望星空,脚踏实地 2017.09-2018.02
- android连麦功能,Android IOS WebRTC 音视频开发总结(七六)-- 探讨直播低延迟低流量的粉丝连麦技术...
- 记录项目中遇到的坑(二)
- CVTE 后端开发面经
- 蓝牙芯片----BK3431开发笔记------RW stack中添加自定义服务教程(4)
- 7.25 1figting!