当前位置: 首页 > news >正文

企业做网站应该注意的问题建设银行 福建 招聘网站

企业做网站应该注意的问题,建设银行 福建 招聘网站,seo关键词排名软件,删除网站栏目王瑞#xff0a;基金项目#xff1a;本课题得到国家自然科学基金资助项目基金#xff08;项目编号#xff1a;60772101#xff09;的资助。作者简介#xff1a;王瑞#xff08;1986—#xff09;, 男, 山东莱芜人, 硕士, 主要从事视频压缩方面的研究. E#xff0d;mai…王瑞基金项目本课题得到国家自然科学基金资助项目基金项目编号60772101的资助。作者简介王瑞1986—, 男, 山东莱芜人, 硕士, 主要从事视频压缩方面的研究. Emailwangruityut163.com太原理工大学 信息工程学院太原 030024摘要帧内预测是AVS 编码器中十分耗时的模块因此合理的优化这一模块对AVS 编码器的实时实现具有十分重要的意义。本文根据每种帧内预测模式的特点将其分为三大类并在TMS320CDM####46 上如何用汇编实现做了详细分析重新 设计了程序结构优化后的数据显示,在不影响图像质量的前提下汇编代码在时钟周期上效率大幅提高,耗时仅为C 代码的30优化效果相当明显。关键词 TMS320CDM####46帧内预测AVS 实时编码中图分类号TN624Optimize Intra Predicition of AVS by assembly languageWANG RuiCollege of Information Engineering,Taiyuan University of Technology Taiyuan, Taiyuan 030024Abstract Intra prediction is one of the most timeconsuming model in AVS encoder, therefore,optimizing this module reasonably is very significant to realize the realtime AVS encoding.This divide all intra prediction modes into three categories according to the characteristics of each mode,and do a detailed analysis about various mode of intra prediction model with assembly language onTMS320CDM####46, and redesign the program structure, It demonstrates that the assembly code has anotable increase of the clock cycle efficiency.Under the premise of not affecting the image quality, theassembly code‘s timeconsuming is only 30 of C code and the optimization is obvious.Key words TMS320CDM####46;Intra Predicition;AVS real time encoding0 引言AVSAudio Video coding Standard标准是我国具备自主知识产权的第二代信源编码标准1。它的编码效率与MPEG4/H.2#### 相当但是计算复杂度与 专利费用低因此在DSP 上实时实现高分辨率视频编码实例是业界努力攻克的目标。本文以TMS320DM####46 为 开发平台重点分析了AVS 的帧内预测编码模块并使用汇编 语言对其进行优化对实时性的实现十分有利。1 TMS320CDM6000 系列DSP 特点及汇编介绍TMS320C6000 DSP 具有最高800MIPS 的运算性能和高效的C 编译器。其内核CPU 由两个寄存器组A 和B 组成每组包含32 个寄存器内部有8 个功能单元包括2 个乘法器和6 个算术逻辑单元。C####x DSP 具有高级的VLIWVery Long Instruction Word体系结构。VLIW 描述了一种指令集思想2。在这种指令集中编译器把许多简单、独立的指令组合到一条指令字中。当这些指令字从Cache 或内存中取出放到处理器中时,它们被容易地分解成几条简单的指令。这些简单的指令被分派到一些独立的执行单元去执行。C####x CPU 一般情况下能将8 条指令组合到一条指令字中如图21 所示图1 取指包的基本形式Figure1 Basic Format of a Fetch Packet取指包里的八条指令的执行由最低比特位p 控制。p 的值决定两条指令是否并行执行。在C####x DSP 中p 比特的扫描过程遵循从左到右的原则也就是从低地址位到高地址位的顺序如图32 中顺序为从指令A 到指令H。如果第i 条指令的p1则代表该指令与第i1 条指令是并行执行的否则如果第i 条指令的p0则代表该指令与第i1 条指令不是并行的。一个取指包里所有能够并行执行的指令组成一个执行包。每个执行包里的指令使用的功能单元是互不相同的。一般情况下通过编写线性汇编代码然后再通过汇编优化器进行优化也能达到一个满意的程度。但是对实时性要求比较高的地方这个优化程度还是远远不够的。因此需要进一步考虑代码的特点充分利用C####x DSP 的资源安排并行指令合理安排流水结构才能最大限度的优化需要的汇编代码。线性汇编与汇编的主要区别是汇编需要指定并行指令汇编需要考虑寄存器的使用汇编需要考虑指令的延时周期汇编需要考虑功能单元的使用情况汇编需要自己安排流水线3。因此汇编代码的编写主要有以下优化策略配合功能单元利用SIMD、VLIW 思想尽量写并行代码使得8 个功能单元的利用率都很高A、B 通道并行合理使用交叉通路实现同样操作尽量用数据相关性小易于形成 软件流水的指令尽量用最少周期的指令尽量用特殊指令一般效率比较高例如循环体实现一个操作 val is0 val val可以用比较和跳转指令实现但破坏软件流水效率低可以通过比较扩展求或操作得到一个1 或1 的数再用乘运算实现这个操作虽然周期长了一些但能形成软件流水实际提高了效率。2 AVS 帧内预测及其汇编优化AVS 帧内预测是基于空间域的预测即利用周围已编码块的重建像素值滤波得到当前块的像素预测值。AVS 编码标准在传统的帧内编码技术的基础上充分利用了图像在局部空间上的高度相关性来去除图像的空间冗余性然后再对预测残差图像进行变换编码有效提高了图像帧内编码的效率。AVS 的亮度和色度都使用8×8 的预测块且亮度和色度预测模式分别为5 种和4 种但是根据宏块周围块的存在情况在AVS 中实际上亮度预测模式有8 种不同的算法而在色度中7 种不同的算法。但是总体上可以大致分为以下几类1赋值运算 亮度和色度模式0模式DCTop 为垂直赋值亮度和色度的模式1DCLeft 为水平赋值亮度和色度模式DC128 为常数赋值。这一类总体思路一样都采用STDW 指令一次可以完成一行的赋值。色度DCTop 和DCLeft 的所需赋的值需要由加权平均运算指令DOTPUS4 求得其他与亮度相同。如给整个8×8 块赋值128 的运算的汇编代码如下一次加载8 个数。MVKL 0x80808080,r0MVKH 0x80808080,r0MV r0 , r1STDW r1r0, dst2要求平均值或加权平均的运算 亮度模式DCAll 和色度模式DCAll模式3。对亮度模式DCAll将top 和left 用LDDW 指令分别一次读进来并把读进来的left 值解包并把解包的每个值再分别打包共八个值left0 到left7将这八个值分别与top 相加并移位用指令AVGU4这样可能会存在大1 的误差。解决误差的方法是用SUBABS4 将top值都减1 后再用指令AVGU4 与left 操作得到DST这样的话仅top 值为0 时可能存在误差。图2 仅top0 时可能含有误差的算法Figure2 the algorithm only top 0 may contain error然后采用比较法消除0 值误差即先用top 值与0 值比较用指令CMPGTU4得到CMP1再用XPND4 将其展开并用NOT 取反将此值与01010101H 相与得到CMP1最后用DST 减去CMP1 就消除了误差得到最终结果。色度与亮度模式DCAll 的主要区别就是所需要的值要由临近top 和left 的值用DOTPUS4 指令加权平均求出。对于色度模式3主要思路就是用DOTPUS4 指令求得abc 的值对于中间过程则采用16 位运算指令SADDSUB2SHR2 等最后通过SPACKU4 指令把结果饱和为8 位。3要进行移位运算。如亮度中的模式3 和模式4采用的是左上和左下的预测方式即45°角方向的赋值是一样的。对于亮度模式3 所需赋的值是top 和left 的均值所以本文首先两次利用取双字指令LDDW 一次性将我们需要的值全部取出后采用模式2 中所用的方法求得所需赋的值然后利用移位指令不断地组合出下一行的数进行赋值利用存双字指令STDW 一次存进内存中。亮度模式4 所需赋的值可以直接取出然后用移位组合出下一行的数。这样的做法明显提高了数据的利用率减小了算法的复杂性。3 实验结果分析表1 帧内预测实验结果Table1 Intra Predicition Experiment Result帧内预测模式 优化的CCPU 数汇编CPU 数模式0vetical 32 13模式1horizontal 43 18DC128 22 11DCTop 32 13DCLeft 43 18模式2DCDCAll 93 31模式3DownLeft 88 25亮度模式4 DownRight 73 15模式0vetical 32 13模式1horizontal 43 18DC128 22 11DCTop 96 27DCLeft 78 25模式2DCDCAll 139 46色度模式3Plane 1#### 48从表1 的实验结果可以看出通过汇编优化后各个模式全部有很大程度的降低与优化过的C 相比降低幅度均在50以上相比于线性汇编优化结果其CPU 周期数也有很大程度的下降降低幅度大部分在30到50之间。因此对实时性要求比较高的编码器而言汇编能极大地提高运算速度缩短计算时间。4 结论本文用汇编实现了帧内预测的各种模式在不影响图像质量的情况下有效的提高了编码速率。本实验证明利用DSP 汇编指令实现AVS 耗时模块可极大节省计算时间为AVS在TMS320DM####46 上实时实现提供了更大的保障。参考文献 References1《AVS 视频报批最终稿》标准号GB/T 200090.22006 信息技术先进音视频编码第2 部分视频S.2 TMS320C####x/C####x DSP CPU and Instruction Set Reference Guide. Literature Number SPRU732A June20053 TMS320C6000 Optimizing Compiler v 6.1 User‘s Guide. Literature Number SPRU187O May 2008中国论文中心http://www.wenlun.com 警告未经本站许可不得采集本站论文内容作为自己网站的资源(如需要转载请说明出自http://www.wenlun.com/lwcs/so_article.asp?id11050680156) 如果本文不完整请点击这里查看AVS 帧内预测模式的汇编优化的其它内容
http://www.zqtcl.cn/news/790017/

相关文章:

  • 好看的模板网站建设西安网站模板建站
  • 建设网站二级子页打不开广告设计平面设计培训班
  • 网站公司做网站要多少钱新乡
  • 天津谁做网站莱芜人才网招聘网
  • 学做网站的书籍自己做网站 最好的软件
  • 手机网站专题电商入门视频教程免费
  • aspx网站模板制作网页常用的软件有哪些
  • 网站主关键词湖南网站定制
  • 长沙seo网站排名优化公司进入秦皇岛最新规定
  • 企业网站优化平台宝山北京网站建设
  • 给人做代工的网站加盟代理网
  • 网站建设用dw电脑谷歌浏览器打开是2345网址导航
  • 做外贸一般总浏览的网站太原的网站建设公司哪家好
  • 台州建网站公司wordpress 用微信登陆
  • 广州白云网站建设家在深圳业主
  • 呼和浩特网站建设哪家最便宜?携程旅行网网站策划书
  • 网站建设及相关流程北京网站备案域名
  • 汉字叔叔花了多少钱做网站微商城科技
  • 网站代理被抓html网站开发实战
  • 如何建立免费的网站网站copyright写法
  • 官方网站下载12306合肥有没有做网站的单位
  • 甘露园网站建设网站框架图片
  • 做网站怎样赚卖流量石家庄网站建设联系电话
  • wordpress 图片网站本地免费发布信息网站
  • 建设网站和别人公司重名新乡建设招标投标网站
  • 四川省建设厅网站证想开个网站怎样开公司
  • 做机械一般做那个外贸网站电商软件开发费用
  • 网站外链坏处龙岗网站设计信息
  • 郑州网站建设乙汉狮网络搜索优化网络推广
  • Dw做html网站百度推广竞价排名