sf上的SIMD的程序库
与SIMD相关的大概有这样一些:
Vector3D SSE Updated 2011-01-09
A C++ header library for fast operations on vectors/matrices (3D/3x3) using Streaming SIMD Extensions (SSE, SSE2, SSE3, SSE4); Tends to be used in 3D graphics applications and game developement.
http://sourceforge.net/projects/v3d/
http://nchc.dl.sourceforge.net/project/v3d/v3d-0.1b_r2.tar.gz
parallel for Updated 2008-05-29
A data parallel scientific programming model. Compiles efficiently to different platforms like distributed memory (MPI), shared memory multi-processor (pthreads), Cell BE processor, Nvidia Cuda, SIMD vectorization (SSE, Altivec), and sequential C++ code.
http://sourceforge.net/projects/parallel-for/
SSEPlus Updated 2008-05-21
SSEPlus is a SIMD function library. It provides optimized emulation for newer SSE instructions. It also provides a rich set of high performance routines for common operations such as arithmetic, bitwise logic, and data packing and unpacking.
http://sourceforge.net/projects/sseplus/
http://nchc.dl.sourceforge.net/project/sseplus/SSEPlus/0.3.67/SSEPlus_0.3.67.zip
(这个库居然是AMD开发的,有丰富的文档。看看,Intel,向人家AMD好好学学!)
GENIAL Updated 2008-04-01
GENIAL is a C++ library for signal and image processing. It uses template-generic techniques, multi threading, cache optimization and SIMD instructions for Pentium (MMX, SSE, SSE2, SSE3) to achieve high performance: FFT,DCT,Convolution,Linear Algebra...
http://sourceforge.net/projects/genial/
http://ncu.dl.sourceforge.net/project/genial/genial/genial-2.1.0/genial-2.1.0.zip
(使用了一下,但是因为没有下载最新的GCC及其头文件中的xmmintrin.h等文件导致无法编译通过。有很详细的文档,简单看了下,提供了各种高度简化的向量计算函数)
SIMDx86 Updated 2006-10-31
This library is meant for high performance calculations for science or 3D games/rasterizers using SIMD instructions of x86 processors to allow an unparalleled level of optimization. This takes advantage of MMX, 3DNow!, 3DNow!+/MMX+, & SSE/SSE2/SSE3/SSSE3
http://sourceforge.net/projects/simdx86/
http://nchc.dl.sourceforge.net/project/simdx86/SIMDx86-src/libSIMDx86-devel-src-0.4.0.zip
NVec Updated 2005-09-28
NVec is a C++ Library that provides SIMD accelerated functions without the user needing to know that SIMD functionality is available. Currently supports x86 and x86_64 SSE/SSE2/SSE3, for Linux and Windows (mingw) Requires a recent version of gcc. (~3.4)
http://sourceforge.net/projects/nvec/
http://ncu.dl.sourceforge.net/project/nvec/nvec/alpha-20050928/nvec.zip
libSIMD Updated 2005-04-05
Mathematical library utilising SIMD features of common processors to accelerate many commonly-used algorithms where compilers fear to tread.
http://sourceforge.net/projects/libsimd/
http://nchc.dl.sourceforge.net/project/libsimd/libsimd/20050405/libSIMD-20050405.tar.gz
Cross-platform SIMD C Headers Updated 2004-10-27
A cross-platform, cross-compiler, cross-CPU C header library for programming with SIMD instruction sets. X86 (MMX/SSE/SSE2) GCC and MSVC, PPC Altivec GCC, WMMX ARM GCC, and software emulated SIMD are supported.
http://sourceforge.net/projects/simd-cph/
http://nchc.dl.sourceforge.net/project/simd-cph/simd-cph/2004.10.26/simd_cph_20041026.tgz
sf上的SIMD程序库
sf上的SIMD的程序库相关推荐
- 分类整理我在SF上针对某些问题作的回答
Android 资源Resource与布局Layout android:怎么实现一个控件与另一个指定控件左对齐 针对你这种情况,最简单的一种办法是,设置两个TextView的宽度为固定值,且相等. L ...
- 传奇SF上传列表格式
[Server] ; 标题|服务器标题|服务器名称|服务器IP|服务器端口|是否自动展开(0不展开,1自动展开)|微端IP|微端端口(0表示不使用微端)|安全盾防火墙端口(0表示不使用防火墙)|防火墙 ...
- Unity SF上的2017全球游戏果酱
Ever create a game in 48 hours? That's exactly what we set out to do this weekend as we celebrated G ...
- 「SF图片上传不清晰」解决方案
背景 用SF自带的图片上传功能,由于sf为了网页流畅度做了压缩,导致一些本可以清晰的图片,变得不清晰. 分析 sf在排版的时候正文最大宽度是757.5px 高度貌似没太大的限制. 自带的copy图片粘 ...
- CUDA上深度学习模型量化的自动化优化
CUDA上深度学习模型量化的自动化优化 深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参数 ...
- CUDA上的量化深度学习模型的自动化优化
CUDA上的量化深度学习模型的自动化优化 深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参 ...
- SIMT和SIMD之总结篇
一.SISD与SIMD 以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数:之后再一次访问内存,取得第二个操作数:随后才能进行求和运算.而在SIMD ...
- CUDA 编程简介(上)
参考资料: NVIDIA CUDA Programming Guide, NVIDIA. (https://docs.nvidia.com/cuda/cuda-c-programming-guide/ ...
- 异构处理器,SIMD
什么是异构多核处理器? 简单地说异构多核处理器指的是在CPU里集成了 CPU与[其他模块]一起同步工作,[也就是说 一块cpu 里不单有 CPU运算模块 还有其他运算模块 例如 GPU,FPGA,DS ...
- 使用SIMD指令实现数据库运算(论文阅读笔记)
摘要 现代cpu的指令允许在多个数据元素上并行执行基本操作.这些指令称为SIMD指令,因为它们将一条指令应用于多个数据元素.SIMD技术最初被内置到商业处理器中,以加速多媒体应用程序的性能.SIMD指 ...
最新文章
- Postgres-XL:基于PostgreSQL的开源可扩展数据库集群
- ubuntu dpkg initramfs-tools错误的解决方法
- js实现反恐精英+曲线图+饼状图
- HDU 1618 Oulipo KMP解决问题的方法
- 计算机精英协会考核题 —— 第一题:厄密多项式
- [国家集训队]middle
- python正则表达式生成器_Python学习之路-装饰器生成器正则表达式
- css布局与ldquo;切图rdquo;
- 搭建MVC及WebAPI项目框架时碰到的问题集合
- POJ-10031004
- [osx] android studio下修改avd的hosts文件
- Android使用Http访问网络
- es6 对象中是否有键值_JS获取对象键值对中key值的方法
- android 手机 打印 图片,Mopria打印PDF、TXT文档或图片(适用于Android安卓系统)
- Android 微信、QQ、微博分享问题汇总
- 学计算机干眼,电脑族预防干眼的7个小妙招_39健康网
- Javascript搭建selenium测试环境
- 2020中国.NET开发者峰会近50场热点技术专题揭秘
- nstrFetchProhibited,stack overflow,Task watchdog got triggered解决办法
- 诡辩:认知与智商税!外附送签名版国庆福利
热门文章
- [2018.07.31 T3] 第三题
- BZOJ2301[HAOI2011] Problem b
- Java中字符串的全部知识_java基础教程之字符串的介绍,比较重要的一个知识点「中」...
- nvidia显示设置不可用_白送大福利?实战FreeSync显示器开启NVIDIA G-Sync Compatible
- python点击网页元素_ios+python 简单的查找页面元素并点击,点击的时候出现问题,求指点...
- java 驼峰自动映射_总结springboot开启mybatis驼峰命名自动映射的三种方式
- linux安装jdk8_JDK1.8安装手册汇总
- ch340串口驱动_敏矽微电子Cortex-M0学习笔记07-串口通信详解
- java实现对称加密—基本实现
- Git(4):提交代码时忽略不必要的文件或文件夹