seo是什么及作用,重庆网站seo费用,网店运营怎么学,鞍山网站建设营销本文介绍了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接实现时的不同。从VFP浮点单元的引入到软浮点(soft-float)和硬浮点(hard-float)的概念#xff0c;然后是在GCC和ARMCC RVCT工具链下的具体编译参数。VFP (vector floating-point)从ARMv5开始然后是在GCC和ARMCC RVCT工具链下的具体编译参数。VFP (vector floating-point)从ARMv5开始就有可选的 Vector Floating Point (VFP) 模块当然最新的如 Cortex-A8, Cortex-A9 和 Cortex-A5 可以配置成不带VFP的模式供芯片厂商选择。VFP经过若干年的发展有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16(只使用16个浮点寄存器默认为32个)和VFPv3NEON (如大多数的Cortex-A8芯片) 。对于包含NEON的ARM芯片NEON一般和VFP公用寄存器。硬浮点Hard-float编译器将代码直接编译成发射给硬件浮点协处理器(浮点运算单元FPU)去执行。FPU通常有一套额外的寄存器来完成浮点参数传递和运算。使用实际的硬件浮点运算单元FPU当然会带来性能的提升。因为往往一个浮点的函数调用需要几个或者几十个时钟周期。软浮点 Soft-float编译器把浮点运算转换成浮点运算的函数调用和库函数调用没有FPU的指令调用也没有浮点寄存器的参数传递。浮点参数的传递也是通过ARM寄存器或者堆栈完成。 现在的Linux系统默认编译选择使用hard-float即使系统没有任何浮点处理器单元这就会产生非法指令和异常。因而一般的系统镜像都采用软浮点以兼容没有VFP的处理器。armel和armhf ABI在armel中关于浮点数计算的约定有三种。以gcc为例对应的-mfloat-abi参数值有三个soft,softfp,hard。soft是指所有浮点运算全部在软件层实现效率当然不高会存在不必要的浮点到整数、整数到浮点的转换只适合于早期没有浮点计算单元的ARM处理器softfp是目前armel的默认设置它将浮点计算交给FPU处理但函数参数的传递使用通用的整型寄存器而不是FPU寄存器hard则使用FPU浮点寄存器将函数参数传递给FPU处理。需要注意的是在兼容性上soft与后两者是兼容的但softfp和hard两种模式不兼容。默认情况下armel使用softfp因此将hard模式的armel单独作为一个abi称之为armhf。而使用hard模式在每次浮点相关函数调用时平均能节省20个CPU周期。对ARM这样每个周期都很重要的体系结构来说这样的提升无疑是巨大的。在完全不改变源码和配置的情况下在一些应用程序上使用armhf能得到20%——25%的性能提升。对一些严重依赖于浮点运算的程序更是可以达到300%的性能提升。Soft-float和hard-float的编译选项在CodeSourcery gcc的编译参数上使用-mfloat-abiname来指定浮点运算处理方式。-mfpuname来指定浮点协处理的类型。可选类型如fpafpe2fpe3maverickvfpvfpv3vfpv3-fp16vfpv3-d16vfpv3-d16-fp16vfpv3xdvfpv3xd-fp16neonneon-fp16vfpv4vfpv4-d16fpv4-sp-d16neon-vfpv4等。使用-mfloat-abihard (等价于-mhard-float) -mfpuvfp来选择编译成硬浮点。使用-mfloat-abisoftfp就能兼容带VFP的硬件以及soft-float的软件实现运行时的连接器ld.so会在执行浮点运算时对于运算单元的选择是直接的硬件调用还是库函数调用是执行/lib还是/lib/vfp下的libm。-mfloat-abisoft (等价于-msoft-float)直接调用软浮点实现库。在ARM RVCT工具链下定义fpu模式? --fpu softvfp? --fpu softvfpvfpv2? --fpu softvfpvfpv3? --fpu softvfpvfpv_fp16? --fpu softvfpvfpv_d16? --fpu softvfpvfpv_d16_fp16.定义浮点运算类型--fpmode ieee_full : 所有单精度float和双精度double的精度都要和IEEE标准一致具体的模式可以在运行时动态指定--fpmode ieee_fixed 舍入到最接近的实现的IEEE标准不带不精确的异常--fpmode ieee_no_fenv 舍入到最接近的实现的IEEE标准不带异常--fpmode std 非规格数flush到0、舍入到最接近的实现的IEEE标准不带异常--fpmode fast 更积极的优化可能会有一点精度损失。一个浮点软链接实现的汇编例子IMPORT __softfp_cosBL __softfp_cosARMCC fplib浮点运算库__aeabi_dadd 浮点double类型数据的加法__aeabi_fdiv 单精度浮点除法。附录常见的芯片和VFP配置Partial reference of SoC and supported ISAsSoCarchitectureVFPSIMDNotesFreescaleiMX5xarmv7Cortex-A8; NEON only reliable in Tape-Out 3 or aboveNvidiaTegra2armv7noneMarvellDovearmv7iwMMXtQualcommSnapdragonarmv7Qualcomm Scorpion coreReference本文介绍了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接实现时的不同。从VFP浮点单元的引入到软浮点(soft-float)和硬浮点(hard-float)的概念然后是在GCC和ARMCC RVCT工具链下的具体编译参数。