学校代码:10246

学号:021021073

很*大爹

博士学位论文

针对实际多搽体程序和多碟体扩展指今集

的51五肛)编译优化

院系(所):计算机科学与工程系

专业:计算机系统结构

姓名:姜伟华

指导教师

朱传琪教授

完成日期

2005年4月15日

复旦大学

博士学位论文

针对实际多媒体程序和多媒体扩展指令集的

S!MO编译优化

SIMDComPi.ingOPtimizationforRealIife

MultimediaAPPIicat亩onsandMultimedia

EXt6nsionS

姓名:

学号:

系(所):

专业:

研究方向:

攻读学位:

指导教师:

指导刁、组成员

姜伟华

021021073

计算机科学与工程系

计算机系统结构

编译优化

博士

朱传琪教授

:减斌宇教授

赵一鸣副教授

目录#03(F7,72,144,99)@2&1

摘要#011@2

Abstract#013@2

第一章引言#1(341,1B7,54D,20F)

1.1多媒体扩展指令集#1(F3,292,3B1,2D4)@2&1

1.2SIMD编译优化的意义#3(134,A86,463,AC2)@2&1

1.3SIMD编译优化的内容#5(F7,6FF,449,73D)@2&1

1.3.1SIMD编译优化的层次#5(FB,A49,44D,A83)@2&1

1.3.2SIMD编译优化的要求#6(1BA,B02,505,B3E)@2&1

1.3.3SIMD编译优化的主要内容#7(102,B76,4D1,BB3)@2&1

1.4主要的相关研究工作#12(1C0,908,4BC,946)@2&1

1.4.1经典向量化#12@2

1.4.2相关的SIMD编译优化研究#14(1BF,537,599,572)@2&1

1.5本文的贡献及结构安排#17(104,FA,44A,139)@2&1

第二章多媒体扩展指令集分析#19(219,190,68E,1EA)

2.1多媒体扩展与传统向量机的区别#19(F9,269,556,2AB)@2&1

2.1.1向量差异#19(FC,662,2CF,69C)@2&1

2.1.2内存差异#21@2

2.1.3指令集差异#21(E8,965,2F4,99F)@2&1

2.2IntelMMX/SSE/SSE2/SSE3指令集简介#23@2

2.2.1Intel多媒体扩展指令集发展简史#23(E7,2D3,54D,30D)@2&1

2.2.2IntelMMX/SSE/SSE2/SSE3指令简介#23@2

2.2.3结论#36(1BF,A57,30A,A8F)@2&1

第三章多媒体程序特性分析#39(238,1B5,65C,214)

3.1程序包简介#39(F4,28F,2E8,2CF)@2&1

3.2多媒体程序运行时特点#41(FF,831,447,872)@2&1

3.3多媒体扩展指令集对多媒体程序的效果#42(1B7,AE9,6D1,B2C)@2&1

3.4代码形式特点#44(18D,AC7,3AD,B03)@2&1

3.4.1广泛使用指针进行运算#45(7F,110,3CE,14A)@2&1

3.4.2大量的循环展开#45(82,51A,312,552)@2&1

3.4.3多媒体典型操作的变体很多#45(89,B40,453,B7F)@2&1

3.4.4使用映射数组替代复杂计算#49(79,110,448,14A)@2&1

3.4.5普遍使用宽数据类型#50(142,5C1,44D,5FB)@2&1

3.4.6各种代码形式在BMW中的出现情况#5

计算机系统多媒体扩展指令集,针对实际多媒体程序和多媒体扩展指令集的SIMD编译优化...相关推荐

  1. 执行ios命令_MEDUZA:一款针对iOS应用程序的通用SSL解绑工具

    MEDUZA MEDUZA是一款针对iOS应用程序的通用SSL解绑工具,该工具基于Frida开发,可以当作SSLKillSwitch工具的替代品.本来我是想自己开发自己用的,而且原本并不打算开源出来. ...

  2. android 混淆工具下载,Obfuscapk:一款针对Android应用程序的黑盒混淆工具

    Obfuscapk是一款模块化的Python工具,它可以帮助研究人员在无需应用程序源代码的情况下对Android App进行混淆处理.Obfuscapk使用了apktool来对原始APK文件进行反编译 ...

  3. OpenCV算法加速(2)使用SIMD指令集(MMX、SSE、AVX)和MIPP实现视觉算法优化

    一.概述 很多人觉得OpenCV速度比较慢,其实提升OpenCV运行速度,最常见的就是重新编译OpenCV,添加各种指令集优化支持. SIMD(Single Instruction Multiple ...

  4. ARM Cortex系列(A8/A9/A15/A7) NEON多媒体处理SIMD引擎优化

    出处: http://houh-1984.blog.163.com/blog/static/31127834201211275111378/ Cortex-A9的NEON多媒体处理器是基于ARMv7的 ...

  5. 每个程序员都应当知道的编译器优化知识

    高级编程语言提供的函数.条件语句和循环这样的抽象编程构造极大地提高了编程效率.然而,这也潜在地使性能显著下降成为了用高级编程语言写程序的一大劣势.在理想条件下,在不以性能为妥协的情况下,你应该写出易读 ...

  6. Tensorflow针对CPU的编译优化加速-解决Not compiled to use: SSE4.1 SSE4.2 AVX AVX2 FMA

    本文介绍Tensorlfow 针对 CPU SSE4.1 SSE4.2 AVX AVX2 FMA 的编译优化,以提升Tensorflow在CPU上的计算速度,实测可以提升两倍以上的速度. 1.问题 在 ...

  7. Spark程序运行常见错误解决方法以及优化

    Spark程序运行常见错误解决方法以及优化 参考文章: (1)Spark程序运行常见错误解决方法以及优化 (2)https://www.cnblogs.com/double-kill/p/901238 ...

  8. 90 % Java 程序员被误导的一个性能优化策略

    转载自   90 % Java 程序员被误导的一个性能优化策略 我们经常看到一些 Java 性能优化的书或者理念,说不要在循环内定义变量,这样会占用过多的内存影响性能,而要在循环外面定义.接触 Jav ...

  9. 给出以下程序,制作makefile文件,编译出可执行文件

    给出以下程序,制作makefile文件,编译出可执行文件 方法一(通过静态库方式): 方法二(直接): main.c /* main.c */ #include "mylinux1.h&qu ...

最新文章

  1. 计算机网络邮件客户编程,北京理工大学-计算机网络实践-实验4POP3邮件客户程序.docx...
  2. 如何从 100 亿 URL 中找出相同的 URL?
  3. 你应该知道的print
  4. 从零开始学习docker(八)多台机器通信
  5. Remoting: Server encountered an internal error
  6. Linux系统管理系列(1)——文件管理权限详解 chgrp chown chmod rwx等等
  7. 自然语言处理系统NLP之拼写纠错
  8. “3G域名”遭恶炒 用友移动代理被指画饼圈钱
  9. 无线路由器wan口和lan口
  10. hypothesisTest
  11. 计算机应用基础指法实训报告,计算机基础实训报告
  12. SAP中内部订单月结差异问题的实例
  13. Linux初窥:CentOS配置本地yum源与网络yum源
  14. mysql增加年龄约束_mysql-约束
  15. (BAT批处理)用文件名批量创建文件夹,然后将文件移动进去的批处理命令?
  16. 搜索特定网站中的Email地址search_email_collector
  17. 今日更新【江南大学】初试复试资料分享(附考研群)
  18. PHP implode() 函数
  19. 东方联盟发现SolarWinds黑客使用的3种新恶意软件
  20. Android手持系统PDA打印小票

热门文章

  1. Easyexcel写操作
  2. day7-Stacking与案例(幸福感预测)
  3. 联盛德W806,W801刷固件步骤
  4. SICP3——使用python制作logo解释器
  5. Android中的Drawable基础与自定义Drawable
  6. OSTeC: One-Shot Texture Completion
  7. 面试让我手写红黑树?
  8. 求 主板型号 945GME - ICH7M/U 支持的最大内存,以及内存型号 10
  9. 学习FFmpeg API – 解码视频流程总结
  10. 一文教你如何用Python读取图片GPS定位