与SIMD相关的大概有这样一些:

Vector3D SSE  Updated 2011-01-09
A C++ header library for fast operations on vectors/matrices (3D/3x3) using Streaming SIMD Extensions (SSE, SSE2, SSE3, SSE4); Tends to be used in 3D graphics applications and game developement.
http://sourceforge.net/projects/v3d/
http://nchc.dl.sourceforge.net/project/v3d/v3d-0.1b_r2.tar.gz

parallel for  Updated 2008-05-29
A data parallel scientific programming model. Compiles efficiently to different platforms like distributed memory (MPI), shared memory multi-processor (pthreads), Cell BE processor, Nvidia Cuda, SIMD vectorization (SSE, Altivec), and sequential C++ code.
http://sourceforge.net/projects/parallel-for/

SSEPlus  Updated 2008-05-21
SSEPlus is a SIMD function library. It provides optimized emulation for newer SSE instructions. It also provides a rich set of high performance routines for common operations such as arithmetic, bitwise logic, and data packing and unpacking.
http://sourceforge.net/projects/sseplus/
http://nchc.dl.sourceforge.net/project/sseplus/SSEPlus/0.3.67/SSEPlus_0.3.67.zip

(这个库居然是AMD开发的,有丰富的文档。看看,Intel,向人家AMD好好学学!)

GENIAL  Updated 2008-04-01
GENIAL is a C++ library for signal and image processing. It uses template-generic techniques, multi threading, cache optimization and SIMD instructions for Pentium (MMX, SSE, SSE2, SSE3) to achieve high performance: FFT,DCT,Convolution,Linear Algebra...
http://sourceforge.net/projects/genial/
http://ncu.dl.sourceforge.net/project/genial/genial/genial-2.1.0/genial-2.1.0.zip

(使用了一下,但是因为没有下载最新的GCC及其头文件中的xmmintrin.h等文件导致无法编译通过。有很详细的文档,简单看了下,提供了各种高度简化的向量计算函数)

SIMDx86  Updated 2006-10-31
This library is meant for high performance calculations for science or 3D games/rasterizers using SIMD instructions of x86 processors to allow an unparalleled level of optimization. This takes advantage of MMX, 3DNow!, 3DNow!+/MMX+, & SSE/SSE2/SSE3/SSSE3
http://sourceforge.net/projects/simdx86/
http://nchc.dl.sourceforge.net/project/simdx86/SIMDx86-src/libSIMDx86-devel-src-0.4.0.zip

NVec  Updated 2005-09-28
NVec is a C++ Library that provides SIMD accelerated functions without the user needing to know that SIMD functionality is available. Currently supports x86 and x86_64 SSE/SSE2/SSE3, for Linux and Windows (mingw) Requires a recent version of gcc. (~3.4)
http://sourceforge.net/projects/nvec/
http://ncu.dl.sourceforge.net/project/nvec/nvec/alpha-20050928/nvec.zip

libSIMD  Updated 2005-04-05
Mathematical library utilising SIMD features of common processors to accelerate many commonly-used algorithms where compilers fear to tread.
http://sourceforge.net/projects/libsimd/
http://nchc.dl.sourceforge.net/project/libsimd/libsimd/20050405/libSIMD-20050405.tar.gz

Cross-platform SIMD C Headers  Updated 2004-10-27
A cross-platform, cross-compiler, cross-CPU C header library for programming with SIMD instruction sets. X86 (MMX/SSE/SSE2) GCC and MSVC, PPC Altivec GCC, WMMX ARM GCC, and software emulated SIMD are supported.
http://sourceforge.net/projects/simd-cph/
http://nchc.dl.sourceforge.net/project/simd-cph/simd-cph/2004.10.26/simd_cph_20041026.tgz

sf上的SIMD程序库

sf上的SIMD的程序库相关推荐

  1. 分类整理我在SF上针对某些问题作的回答

    Android 资源Resource与布局Layout android:怎么实现一个控件与另一个指定控件左对齐 针对你这种情况,最简单的一种办法是,设置两个TextView的宽度为固定值,且相等. L ...

  2. 传奇SF上传列表格式

    [Server] ; 标题|服务器标题|服务器名称|服务器IP|服务器端口|是否自动展开(0不展开,1自动展开)|微端IP|微端端口(0表示不使用微端)|安全盾防火墙端口(0表示不使用防火墙)|防火墙 ...

  3. Unity SF上的2017全球游戏果酱

    Ever create a game in 48 hours? That's exactly what we set out to do this weekend as we celebrated G ...

  4. 「SF图片上传不清晰」解决方案

    背景 用SF自带的图片上传功能,由于sf为了网页流畅度做了压缩,导致一些本可以清晰的图片,变得不清晰. 分析 sf在排版的时候正文最大宽度是757.5px 高度貌似没太大的限制. 自带的copy图片粘 ...

  5. CUDA上深度学习模型量化的自动化优化

    CUDA上深度学习模型量化的自动化优化 深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参数 ...

  6. CUDA上的量化深度学习模型的自动化优化

    CUDA上的量化深度学习模型的自动化优化 深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参 ...

  7. SIMT和SIMD之总结篇

    一.SISD与SIMD 以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数:之后再一次访问内存,取得第二个操作数:随后才能进行求和运算.而在SIMD ...

  8. CUDA 编程简介(上)

    参考资料: NVIDIA CUDA Programming Guide, NVIDIA. (https://docs.nvidia.com/cuda/cuda-c-programming-guide/ ...

  9. 异构处理器,SIMD

    什么是异构多核处理器? 简单地说异构多核处理器指的是在CPU里集成了 CPU与[其他模块]一起同步工作,[也就是说 一块cpu 里不单有 CPU运算模块 还有其他运算模块 例如 GPU,FPGA,DS ...

  10. 使用SIMD指令实现数据库运算(论文阅读笔记)

    摘要 现代cpu的指令允许在多个数据元素上并行执行基本操作.这些指令称为SIMD指令,因为它们将一条指令应用于多个数据元素.SIMD技术最初被内置到商业处理器中,以加速多媒体应用程序的性能.SIMD指 ...

最新文章

  1. Postgres-XL:基于PostgreSQL的开源可扩展数据库集群
  2. ubuntu dpkg initramfs-tools错误的解决方法
  3. js实现反恐精英+曲线图+饼状图
  4. HDU 1618 Oulipo KMP解决问题的方法
  5. 计算机精英协会考核题 —— 第一题:厄密多项式
  6. [国家集训队]middle
  7. python正则表达式生成器_Python学习之路-装饰器生成器正则表达式
  8. css布局与ldquo;切图rdquo;
  9. 搭建MVC及WebAPI项目框架时碰到的问题集合
  10. POJ-10031004
  11. [osx] android studio下修改avd的hosts文件
  12. Android使用Http访问网络
  13. es6 对象中是否有键值_JS获取对象键值对中key值的方法
  14. android 手机 打印 图片,Mopria打印PDF、TXT文档或图片(适用于Android安卓系统)
  15. Android 微信、QQ、微博分享问题汇总
  16. 学计算机干眼,电脑族预防干眼的7个小妙招_39健康网
  17. Javascript搭建selenium测试环境
  18. 2020中国.NET开发者峰会近50场热点技术专题揭秘
  19. nstrFetchProhibited,stack overflow,Task watchdog got triggered解决办法
  20. 诡辩:认知与智商税!外附送签名版国庆福利

热门文章

  1. [2018.07.31 T3] 第三题
  2. BZOJ2301[HAOI2011] Problem b
  3. Java中字符串的全部知识_java基础教程之字符串的介绍,比较重要的一个知识点「中」...
  4. nvidia显示设置不可用_白送大福利?实战FreeSync显示器开启NVIDIA G-Sync Compatible
  5. python点击网页元素_ios+python 简单的查找页面元素并点击,点击的时候出现问题,求指点...
  6. java 驼峰自动映射_总结springboot开启mybatis驼峰命名自动映射的三种方式
  7. linux安装jdk8_JDK1.8安装手册汇总
  8. ch340串口驱动_敏矽微电子Cortex-M0学习笔记07-串口通信详解
  9. java实现对称加密—基本实现
  10. Git(4):提交代码时忽略不必要的文件或文件夹