SSE Instructions
http://en.wikipedia.org/wiki/Streaming_SIMD_Extensions
SSE introduced both scalar and packed floating point instructions.
Floating point instructions
- Memory-to-Register / Register-to-Memory / Register-to-Register data movement
- Scalar– MOVSS
- Packed – MOVAPS, MOVUPS, MOVLPS, MOVHPS, MOVLHPS, MOVHLPS
- Arithmetic
- Scalar – ADDSS, SUBSS, MULSS, DIVSS, RCPSS, SQRTSS, MAXSS, MINSS, RSQRTSS
- Packed – ADDPS, SUBPS, MULPS, DIVPS, RCPPS, SQRTPS, MAXPS, MINPS, RSQRTPS
- Compare
- Scalar – CMPSS, COMISS, UCOMISS
- Packed – CMPPS
- Data shuffle and unpacking
- Packed – SHUFPS, UNPCKHPS, UNPCKLPS
- Data-type conversion
- Scalar – CVTSI2SS, CVTSS2SI, CVTTSS2SI
- Packed – CVTPI2PS, CVTPS2PI, CVTTPS2PI
- Bitwise logical operations
- Packed – ANDPS, ORPS, XORPS, ANDNPS
Integer instructions
- Arithmetic
- PMULHUW, PSADBW, PAVGB, PAVGW, PMAXUB, PMINUB, PMAXSW, PMINSW
- Data movement
- PEXTRW, PINSRW
- Other
- PMOVMSKB, PSHUFW
Other instructions
- MXCSR management
- LDMXCSR, STMXCSR
- Cache and Memory management
- MOVNTQ, MOVNTPS, MASKMOVQ, PREFETCH0, PREFETCH1, PREFETCH2, PREFETCHNTA, SFENCE
SSE Instructions相关推荐
- The TensorFlow library wasn‘t compiled to use SSE instructions, but these are available on your mach
pycharm python中遇到The TensorFlow library wasn't compiled to use SSE instructions, but these are avail ...
- Warning: The TensorFlow library wasn't compiled to use SSE,SSE2,SSE3,SSE4.1 instructions
Tensorflow Warning: The TensorFlow library wasn't compiled to use SSE,SSE2,SSE3,SSE4.1 instructions, ...
- sse指令加速例子-无对比
#define WIN #include "timing.h" #include <intrin.h> #include <stdlib.h> #inclu ...
- Intel 64/x86_64/IA-32/x86处理器 - SIMD指令集 - SSE扩展(1) - 概述/历史/新数据类型/XMM寄存器组
SSE Instructions SSE Overview & History Intel SSE技术的全称是Streaming SIMD Extension,中文译作流式单指令多数据指令扩展 ...
- 运行TensorFlow出现The TensorFlow library wasn‘t compiled to use FMA instructions)代码
TensorFlow出错点(2)(The TensorFlow library wasn't compiled to use FMA instructions) 错误提示: 解决措施: 错误提示: 摘 ...
- 上验证cudnn是否安装成功_windows和linux上的tensorflow安装(极简安装方法)
电脑环境:win7系统,64位. 说明:以下是我自己在windows和linux实操通过的很简单的安装方式,如果觉得有意义可以参考,如果遇到其他问题,可留言交流,一起解决. 主要的几个步骤: 1.1 ...
- Qt configure 参数不完全说明
只需要加个 -fast参数就ok了.其他参数视自己情况而定,比如你不需要qt3支持可以添加-no-qt3support,或者不需要webkit插件 -no-webkit 配置参数选项: 前面是*号的表 ...
- SIMD学习 -- 用SSE2指令作点乘和累加计算
这几天在做学校的一个学习小项目,需要用到SIMD指令计算提速.也是第一次碰这个,看了一些资料和代码,模仿着写了两个函数. void sse_mul_float(float *A, float *B, ...
- TensorFlow的基本介绍及Hello,world
转载自: http://www.tensorfly.cn/tfdoc/get_started/basic_usage.html https://blog.csdn.net/sarsscofy/arti ...
最新文章
- 如何轻松实现iOS9多任务管理器效果(iCarousel高级教程)
- 象过河怎么用远程服务器,象过河远程协助的教程
- 为什么await()后会执行lock.unlock,await()时不就释放锁了吗
- 图文详解安装NetBackup 6.5备份恢复Oracle 10g rac 数据库(修订)
- luoguP4206 [NOI2005]聪聪与可可 期望概率DP
- .net一个函数要用另一个函数的值_MATLAB中的神经网络工具箱(2)函数命令及模型搭建...
- 关于对象的引用作为参数,可以直接访问私有成员的问题
- 使用容器服务支持开发者快速搭建小程序后端服务
- php中数组下标,PHP数组介绍_php
- 7-121 深入虎穴 (25 分)(dfs,bfs)
- linux下mongo工具,linux – 从另一台机器上使用mongodb工具(mongodump,mongorestore)
- 私藏的开发过程中的那些基类
- 3.7 Spark RDD编程
- js实现页面滚动,菜单固定
- 计算机网络中数据通讯方式有哪些,常见的数据通信方式原理是什么
- 矿物质防火电缆对于水的防护也很重要
- 已解决-NVIDIA安装程序失败-win10
- 【机器人学】逆运动学
- wxpython之入门
- Go 每日一库之 cron