基于ZYNQ平台的卷积神经网络加速器设计及其应用研究
摘 要
近些年来,深度学习作为机器学习的一种新的形式,它使计算机能够从经验 中学习并根据概念层次来理解世界。作为一种崭新的人工神经网络方法,卷积神 经网络(CNN)使神经元之间可以权值共享来减少样本的训练参数使分类的泛化 能力和精确度更进一步的提高。因此CNN在图像识别领域成功得到了广泛的推 广和应用。目前,实现CNN的主要方式通常是基于通用处理器的,但这种基于 软件的方式并不能让CNN的并行性得到充分挖掘,并且使应用在实时性、灵活 性和功耗等方面的需求都不能得到满足。除此之外,由于任何一个CNN模型都 无法对所有数据集进行最佳泛化,因此在将CNN应用于新数据集之前,必须先 选择一组适当的超参数。为新数据集选择新的模型可能是一个耗时且繁琐的任务。 被调整的超参数的数量以及每个新的超参数集合的评估时间使得它们在CNN模 型中的优化尤其困难。
本项目采用一个由Xilinx(赛灵思)公司推出的一个支持软硬件协同设计的 SoC产品ZYNQ平台,ZYNQ开发能让我们既获益ARM丰富的生态系统资源, 又可以获益于FPGA的灵活性和可扩展性。本论文详细介绍了ZYNQ平台的开发 模式和卷积神经网络的基础上,设计出CNN硬件加速器,并研究出一种基于改 进贝叶斯优化算法的CNN超参数优化方法。该方法使用改进的汤普森采样
基于ZYNQ平台的卷积神经网络加速器设计及其应用研究相关推荐
- 【基于zynq的卷积神经网络加速器设计】(一)熟悉vivado和fpga开发流程:使用Vivado硬件调试烧写hello-world led闪烁程序实现及vivado软件仿真
HIGHLIGHT: vivado设计流程: note: 分析与综合 和 约束输入 可以调换顺序 [基于zynq的卷积神经网络加速器设计](一)熟悉vivado和fpga开发流程:使用Vivado硬件 ...
- 基于pynq的数字识别神经网络加速器设计
文章目录 基于pynq的数字识别神经网络加速器设计 软件部分 1. 全连接神经网络: 2. 卷积神经网络搭建: 3. 文件格式转换: 硬件部分 1. MNIST的硬件实现思路 2. 代码编写与硬件综合 ...
- 基于FPGA的VGG16卷积神经网络加速器
文章搬运自本人知乎 VGG16网络结构介绍 VGG在2014年由牛津大学Visual GeometryGroup提出,获得该年lmageNet竞赛中Localization Task(定位任务)第一名 ...
- 基于FPGA的CNN卷积神经网络加速器
目录 1.本文背景 2.高级设计 2.1数学概述: 3.硬件设计 3.1 输入图像 3.2 VGA/摄像头 3.3卷积第一层 3.4 池化层 3.4 卷积第二层 3.5部分和 3.6第一个全连接层 3 ...
- 基于FPGA的深度卷积神经网络的加速器设计
英文论文链接:http://cadlab.cs.ucla.edu/~cong/slides/fpga2015_chen.pdf 翻译:卜居 转载请注明出处:http://blog.csdn.net/k ...
- 优化基于FPGA的深度卷积神经网络的加速器设计
英文论文链接:http://cadlab.cs.ucla.edu/~cong/slides/fpga2015_chen.pdf 翻译:卜居 转载请注明出处:http://blog.csdn.net/k ...
- 卷积神经网络训练准确率突然下降_基于联邦学习和卷积神经网络的入侵检测方法...
王蓉1,马春光2,武朋2 1. 哈尔滨工程大学计算机科学与技术学院,哈尔滨 150001:2. 山东科技大学计算机科学与工程学院,青岛 266590 doi :10.3969/j.issn.1671- ...
- 【论文精读】GoSPA:一种高能效高性能的全局优化稀疏卷积神经网络加速器
GoSPA: An Energy-efficient High-performance Globally Optimized SParse Convolutional Neural Network A ...
- 基于FPGA的一维卷积神经网络CNN的实现(二)资源分配
资源分配 环境:Vivado2019.2. Part:xcku040-ffva1156-2-i,内嵌DSP个数 1920个,BRAM 600个也就是21.1Mb. 说明:通过识别加高斯白噪声的正弦波. ...
最新文章
- python_bomb----函数高级特性(生成器)
- Linux下定时切割Mongodb数据库日志并删除指定天数前的日志记录(转)
- 连接数据库版本不一致
- Linux iperf 网络性能测试工具
- python学习类型转换_Python学习总结5:数据类型及转换
- Node 之NPM介绍
- PyTorch 1.0 文档翻译活动期待大家的参与 | ApacheCN
- 微信小程序架构分析 (中)
- puppet安装配置及测试
- 论文笔记_S2D.63_2020-ICRA_LiStereo:从雷达和双目立体图像生成稠密深度图
- 为什么 HashMap 的加载因子是0.75?我研究源码发现一个重大秘密。。。
- win8安装mysql出现2503_win8.1 安装MSI 出现问题,2502,2503!求高手解答,万分感谢!
- OnSetCursor 及改变鼠标形状
- 【图像增强】基于matlab HSV空间双边滤波图像去雾【含Matlab源码 067期】
- 【AtCoder】AGC007
- 如何把图片制作做成GIF表情包?分享在线快速制作GIF图片的方法
- 搭建nfs调试arm开发板
- linux禁调usb,Linux主机禁用USB接口
- springAop原理之(三)Advised接口族
- tesseract安装及配置
热门文章
- 阿里Java诊断工具 arthas - 生产环境反编译动态修改程序调试应用
- 企业版Docker2——Docker基础命令详解
- 动态获取图片尺寸-uniapp
- 对于重要生产系统,重做日志归档的重要性
- USACO 2016 January Contest Gold T2: Radio Contact
- 轻松应对亿级流量,专享型API网关正式对外开放
- python类的继承关系,python——类和类之间的关系(继承多态)
- 找不到BASE64Decoder类
- Bjerksund and Stensland(1993, 2002)美式期权定价(C#版)
- UML 类图-时序图-用例图