浮点单元(Floating Point Unit,FPU),是用于处理浮点数运算的单元。
为使用FPU,除了需要启用FPU外,还需要对编译器进行设置,以使其针对浮点运算生成特殊的指令。虽然在Atmel Studio 6中,开发板使用的工程模板中默认就完成了这两部分工作,但这次仍然对设置的方法进行介绍,同时简单测试一下FPU的效率。
一、 编译器设置
AS6.1 SP2中,使用的编译器为arm-none-eabi-gcc.exe,版本为4.7.3。其中“none”表示没有指定操作系统,“eabi”表示使用的二进制文件接口是eabi。
在ARM GCC中,可以使用-mfloat-abi选项设置浮点数的ABI:
soft: 调用软浮点库对浮点运算进行支持。在GCC中采用常用的指令来模拟浮点运算。
softfp: 使用FPU进行浮点数运算。但是在函数调用时,仍然使用通用的寄存器传递浮点数参数。这需要额外的类型转换的开销。
hard: 使用FPU进行浮点数运算。而且在函数调用时,使用FPU的寄存器传递浮点数参数。
AS6.1使用的编译器,默认情况下即使用soft选项。而为了使用FPU,这里将使用softfp选项。
使用-mfpu选项设置FPU硬件的类型。
SAM4E搭载了Cortex-M4F FPU,它实现了FPv4-SP版本(SP表示单精度)的浮点数扩展。另外,它也搭载了32个32位的单精度寄存器,而这些寄存器也可以被当作16个64位的双精度寄存器以进行load,store和move操作。
所以需要将-mfpu赋值为fpv4-sp-d16。其中d16表示有16个64位寄存器。
AS6中的设置。
在解决方案管理器中,右键点击工程,进入属性页面。然后选中“Toolchain”选项卡,再选择“ARM/GUN C Complier”下的“Miscellaneous”选项,就可以看到自定义的编译器的选项了。
可以看到,默认情况下已经追加了“-mfloat-abi=softfp -mfpu=vfpv4”的选项了。vfpv4默认表示vfpv4-D32,表示实现了完全的FPV4的版本,且配有32个64位寄存器。很明显,这是一个不怎么正确的设置,所以需要更改为“-mfloat-abi=softfp -mfpu= fpv4-sp-d16”:
注意,在Release版本的配置中也需要进行修改。
二、 启用FPU
开发板重置时,FPU是禁止访问的。但是AS6中使用的startup文件会根据编译器设置启用FPU。
启用FPU的方法
向FPU的CPACR寄存器的CP10和CP11字段写入0b11即可开放FPU的完全访问权限。另外,在特权模式下才能读写该寄存器。
在CMSIS中该寄存器的地址被定义成了保留地址。但是在fpu.h 中提供了相应的API:
#include <fpu.h> // 会和sam.h的宏定义冲突,使用board.h即可 fpu_enable();
fpu_enable() 的实现如下:
/** CPACR寄存器 */ #define ADDR_CPACR 0xE000ED88 #define REG_CPACR (*((volatile uint32_t *)ADDR_CPACR)) /** 保存CPU当前中断的状态,并屏蔽之 */ irqflags_t flags; flags = cpu_irq_save(); /** 修改CPACR寄存器*/ REG_CPACR |= (0xFu << 20); __DSB(); /** 等待寄存器修改完成*/ __ISB(); /** 清空处理器流水线 */ /** 根据设置决定是否重新启用中断 */ cpu_irq_restore(flags);
AS6中已经完成的工作
开发板使用的AS6的工程模板中,程序的入口函数是Reset_Handler() 。
该函数在调用main() 函数之前,会执行以下代码:
#if __FPU_USED fpu_enable(); #endif
__FPU_USED在以下代码中定义:
//... /* 判断使用的编译器是否为GCC */ #elif defined ( __GNUC__ ) /* 判断是否启用浮点运算,且运算不是用软件实现的 */ #if defined (__VFP_FP__) && !defined(__SOFTFP__) /* 判断目标平台是否有FPU */ #if (__FPU_PRESENT == 1) #define __FPU_USED 1 #else //...
__FPU_PRESENT 在sam4e16e.h 中定义:
/**< SAM4E16E does provide a FPU */ #define __FPU_PRESENT 1
所以,只需要设置好了编译器的参数,就可以自动启用FPU了。
PS:__GNUC__ 在GCC编译器预定义的宏,__VFP_FP__ 在GCC启用浮点运算时预定义,__SOFTFP__ 是使用软模拟浮点运算时预定义。GCC可以使用“-dM –E”参数打印出预定义的宏。
三、 测试
在第一次示例教程中,我们使用了空循环来进行延时,来完成LED的闪烁工作。在这里,我们将这个空循环的循环体修改为对一个浮点数的运算。然后观察在是否使用硬件FPU时,LED闪烁的频率的差别。
将延时函数修改如下:
void Delay(int num) { volatile float f = 1.0f; for (volatile int i = 0; i < 1024 * 64 * num; ++i ) f *= 1.1f; }
然后分别使用“-mfloat-abi=softfp ”和“-mfloat-abi=soft ”选项编译并执行程序,观察LED闪烁的频率。