立即注册
查看: 759|回复: 2

[arm开发资料] ARM Cortex™-A9 浮点单元技术参考手册

已绑定手机
发表于 2022-12-21 17:58:31 | 显示全部楼层 |阅读模式 来自 台湾省
FPU 是 ARMv7 浮点架构的 VFPv3-D16 实现。 它提供低成本、高性能的浮点计算。 FPU 支持 ARM 体系结构参考手册中描述的所有寻址模式和操作。
FPU 的特点是:
• 支持单精度和双精度浮点格式
• 支持半精度和单精度之间的转换
• 减少了大多数单精度和双精度运算的运算延迟
• 通过 64 位拆分加载和存储总线实现高数据传输带宽
• 可以乱序完成负载转移
• 规范化和非规范化数据都在硬件中处理
• 无陷阱操作可实现快速执行
• 支持推测执行
• 具有高级时钟门控和小芯片尺寸的低功耗。
FPU 全面支持单精度和双精度的加、减、乘、除、乘累加和平方根运算。 它还提供浮点数据格式和 ARM 整型字格式之间的转换,具有特殊操作以在高级语言支持的舍入模式下执行转换。
Cortex-A9 FPU 为嵌入式应用提供性能、功耗和面积方面的优化解决方案,为通用应用提供高性能。
在 ARMv7 中不推荐使用 VFP 矢量模式。 硬件不支持矢量运算。 如果您使用向量,则需要支持代码。 有关详细信息,请参阅 ARM 体系结构参考手册。
笔记
本手册仅描述具体的实施问题。 有关 VFPv3 架构(包括指令集)的信息,请参阅 ARM 架构参考手册。

1.2 应用
FPU 提供适用于广泛应用的浮点计算,例如:
• 用于图形、语音压缩和解压缩、用户界面、Java 解释和即时 (JIT) 编译的个人数字助理和智能手机
• 三维图形和数字音频游戏机
• 用于高清彩色的打印机和多功能外设 (MFP) 控制器渲染
• 数字音频和数字视频机顶盒,以及三维用户界面
• 用于发动机管理和动力传动系计算的汽车应用。

1.3 编写最优的 FP 代码
以下指南为浮点 (FP) 代码提供了显着的性能提升:
• 进出控制寄存器的移动是序列化的。 避免将它们放在循环或时间关键代码中。
• 避免在Cortex-A9 计算引擎寄存器组和FPU 寄存器组之间进行寄存器传输。 每个寄存器组都可以直接加载到主存储器或从主存储器存储。
• 避免连续操作之间有太多的直接依赖关系。 交错不同的操作以减少互锁周期。
• 避免使用单一加载或存储操作,并尽可能使用加载和存储多个操作以获得高效的传输带宽。
• 在FPU 而不是在Cortex-A9 处理器中执行浮点比较操作。

2.1 关于程序员模型
本节介绍 VFPv3 浮点架构 VFPv3-D16 的 FPU 实现。 与 VFPv2 实现不同,此实现提供:
• 定点到浮点转换指令和浮点常量加载
• IEEE 半精度和替代半精度格式支持
• 无陷阱异常支持。
第 2-7 页的表 2-2 描述了以下访问类型:
RW 读写。
RO 只读。

2.2 符合 IEEE 754 标准
本节介绍与 IEEE 754 标准合规性相关的问题:
• 硬件和软件组件
• 基于软件的组件及其可用性。

2.2.1 IEEE 754标准的实施
FPU 指令集不提供 IEEE 754 标准中的以下操作:
• 余数
• 将浮点数舍入为整数值浮点数
• 二进制到十进制的转换
• 十进制到二进制的转换
• 直接比较单精度和双精度值。

2.2.2 IEEE 754 标准实施选择
ARM 体系结构参考手册中描述了 IEEE 754 标准允许并在 VFPv3 体系结构中使用的一些实现选择。
支持格式
VFP 支持:
• 所有运算的单精度和双精度
— 不支持扩展格式。
• 半精度格式
— IEEE 半精度
— 替代半精度。
• 整数格式:
— 无符号 32 位整数
— 二进制补码有符号 32 位整数。

2.3 指令吞吐量和延迟
复杂的指令依赖性和内存系统交互使得不可能在所有情况下描述所有指令的准确周期时序。 在大多数情况下,第 2-5 页的表 2-1 中描述的时序是准确的。 为了精确计时,您必须使用处理器的周期精确模型。

2.3.1 吞吐量和延迟的定义
吞吐量和延迟的定义是:
吞吐量 吞吐量是发出后另一条指令可以开始执行的周期数。
延迟 延迟是数据可用于另一操作之前的周期数。
前向延迟 Fwd 与先写后读 (RAW) 风险相关。 写回延迟 Wbck 与写后写 (WAW) 风险相关。 看
第 2-5 页的表 2-1。
延迟值假定指令已发出,并且 FPU 流水线和 Cortex-A9 流水线均未停止。

2.3.2 指令吞吐量和延迟
第 2-5 页的表 2-1 显示:
• 除加载、存储和系统寄存器访问之外的所有操作的 FPU 指令吞吐量和延迟周期
• 旧的ARM 汇编程序助记符和ARM 统一汇编语言(UAL) 助记符。

游客,如果您要查看本帖隐藏内容请回复


已绑定手机
发表于 2022-12-21 22:41:10 | 显示全部楼层 来自 波兰
谢谢你的分享。那让我检查一下。
已绑定手机
发表于 2023-5-19 15:55:42 来自手机 | 显示全部楼层 来自 广东省深圳市
感谢分享,,,,,,,,
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

合作/建议

TEL: 19168984579

工作时间:
周一到周五 9:00-11:30 13:30-19:30
  • 扫一扫关注公众号
  • 扫一扫打开小程序
Copyright © 2013-2024 一牛网 版权所有 All Rights Reserved. 帮助中心|隐私声明|联系我们|手机版|粤ICP备13053961号|营业执照|EDI证
在本版发帖搜索
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表