一直没注意过使用Tensorflow的时候有一条warning:

Warning: your cpu supports instructions that this tensorflow binary was not compiled to use: avx2 fma

这玩意是可以用来加速推断的,分CPU和GPU版,业务相关部署在CPU上,实测使用CPU加速能提升3倍左右,但是编译过程有点复杂。所以在本地编译了一个Ubuntu16.04 Python3版本的支持AVX2和FMA指令加速的tensorflow。分享一下编译包,以及编译完以后的whl安装包

【国际惯例】
编译时参考的博客:
通过源码编译安装TensorFlow-CPU版本支持AVX等指令集

分享:
编译过程包:
链接: https://pan.baidu.com/s/1ROK1hQccTSwwkYzPW6isPQ 提取码: gt9c

编译完毕的支持AVX2 FMA XLA的tensorflow包
链接: https://pan.baidu.com/s/1qCiuXihevdwccJcNQ3f7Fg 提取码: jj2e

Tensorflow 指令加速相关推荐

  1. TensorFlow XLA加速编译器

    TensorFlow XLA加速编译器 加速线性代数器(Accelerated linear algebra,XLA)是线性代数领域的专用编译器.根据 https://www.tensorflow.o ...

  2. 用NVIDIA Tensor Cores和TensorFlow 2加速医学图像分割

    用NVIDIA Tensor Cores和TensorFlow 2加速医学图像分割 Accelerating Medical Image Segmentation with NVIDIA Tensor ...

  3. TNN行业首发Arm 32位 FP16指令加速,理论性能翻倍

    转自:https://cloud.tencent.com/developer/article/1774206 https://www.cnblogs.com/zhangshenghui/p/11825 ...

  4. 余弦相似度使用NEON指令加速

    余弦相似度使用NEON指令加速 背景 参考资料 公式 代码实现(未用NEON) 使用NEON加速 加速效果 编译信息 测试使用的arm cpu信息 背景 余弦相似度是通过计算两个向量的夹角余弦值来评估 ...

  5. 深入浅出TensorFlow(七)TensorFlow计算加速

    2017年2月16日,Google正式对外发布Google TensorFlow 1.0版本,并保证本次的发布版本API接口完全满足生产环境稳定性要求.这是TensorFlow的一个重要里程碑,标志着 ...

  6. 使用SIMD指令加速计算

    SIMD即单指令多数据流(Single Instruction Multiple Data)指令集,是通过一条指令同时对多个数据进行运算的硬件加速技术,在传统计算,中使用标量运算一次只能对一对数据执行 ...

  7. ubuntu16.04下安装TensorFlow(GPU加速)----详细图文教程【转】

    本文转载自:https://blog.csdn.net/zhaoyu106/article/details/52793183 le/details/52793183 写在前面 一些废话 接触深度学习已 ...

  8. ARM与NEON指令加速

    在移动平台上进行一些复杂算法的开发,一般需要用到指令集来进行加速.目前在移动上使用最多的是ARM芯片. ARM是微处理器行业的一家知名企业,其芯片结构有:armv5.armv6.armv7和armv8 ...

  9. ubuntu16.04下安装TensorFlow(GPU加速)----详细图文教程

    文章来源:http://www.datacups.com/post/1 软件: ubuntu16.04+cuda8.0+cudnn v5+tensorflow 0.11 1. 下载 1.1 系统镜像 ...

最新文章

  1. NDCG:推荐系统/搜索评价指标
  2. jQuery.parseJSON()函数详解
  3. 3.Vue 条件渲染
  4. iOS app 企业内部发布及HTTPS服务器配置
  5. 【渝粤题库】陕西师范大学180113 学前儿童艺术教育作业
  6. Sharepoin学习笔记—架构系列—07nSharepoint服务(Services)与服务应用程序框架(Service Application Framework) 2
  7. 不知道从哪里开始更新你的秋季海报设计?
  8. 2019年的流水账和总结
  9. 【matlab】元胞数组(由元胞数组创建元胞数组)
  10. 高中计算机评课,高二信息技术评课记录
  11. nginx 自建证书https 报错 no “ssl_certificate“ is defined in server listening on SSL port while SSL handsha
  12. NYOJ-57-6174问题-2013年6月29日11:58:06
  13. 大部分人朋友圈仅三天可见的原因,竟然是……
  14. 从Spring源码探究IOC初始化流程
  15. Elasticsearch通过_update_by_query和script批量修改文档
  16. rabbitmq安装 虚拟ip_步骤4:配置IPv6地址
  17. 从0开始带你成为jvm实战高手(狸猫技术窝)
  18. linux环境nginx从下载到安装
  19. [我可怜的诺基亚3110c!]
  20. 深度剖析Android IPC原理

热门文章

  1. oracle sql序列,SQL server 和Oracle 序列
  2. inlfuxdb版本_InfluxDB和MySQL的读写对比测试
  3. 【编译原理】语言的定义
  4. impdp导入表结构和表数据_ORACLE数据库如何用datapump工具导出表结构然后导入到其它Schema下面...
  5. oracle odbc 设置_Oracle删除不干净怎么办?
  6. linux统计某个目录大小,Linux下统计某个目录的文件个数(转)
  7. 操作系统进程管理实验java_计算机考研操作系统进程管理
  8. zbrush 添加纹理贴图_zbrush零基础新手必看入门讲解
  9. 深入理解C语言——#define宏和枚举的区别
  10. C++中const迭代器 和 const_iterator的区别