ARM,Thumb和Thumb 2指令编码有什么区别?

时间:2015-02-23 08:53:41

标签: arm thumb

我对指令集感到有点困惑。有Thumb,ARM和Thumb 2.从我所看到的Thumb指令都是16位但在 ARMv7M用户手册(第vi页)内有Thumb 16位和Thumb 32位指令提及。

现在我必须克服这种困惑。据说Thumb 2支持16位和32位指令。那么ARMv7M实际上支持Thumb 2指令而不仅仅是Thumb吗?

还有一件事。我可以说Thumb(32位)与ARM指令相同,它们都是32位吗?

4 个答案:

答案 0 :(得分:51)

哦,ARM和他们愚蠢的命名......

这是一种常见的误解,但官方认为没有“Thumb-2指令集”。

忽略ARMv8(其中所有内容都已重命名且AArch64使事情复杂化),从ARMv4T到ARMv7-A有两个指令集:ARM和Thumb。它们都是“32位”,因为它们在具有32位地址的32位宽寄存器中对高达32位的数据进行操作。事实上,在它们重叠的地方,它们代表完全相同的指令 - 只有指令编码不同,并且CPU实际上只有两个不同的解码前端到它的管道,它可以在它之间切换。为清楚起见,我现在故意避免使用术语“32位”和“16位”......

ARM指令具有固定宽度的4字节编码,需要4字节对齐。 Thumb指令具有可变长度(2或4字节,现在称为“窄”和“宽”)编码,需要2字节对齐 - 大多数指令具有2字节编码,但bl和{{1}总是有4字节编码 * 。真正令人困惑的是ARMv6T2,它引入了“Thumb-2技术”。 Thumb-2不仅包括向Thumb添加更多指令(主要是4字节编码)以使其几乎与ARM进行奇偶校验,而且还扩展执行状态以允许条件执行大多数Thumb指令,最后引入全新的汇编语法(UAL,“统一汇编语言”)取代了以前单独的ARM和Thumb语法,允许编写一次代码并将其汇编到任一指令集而无需修改。

Cortex-M架构仅实现Thumb指令集 - ARMv7-M(Cortex-M3 / M4 / M7)支持大多数“Thumb-2技术”,包括条件执行和VFP指令编码,而ARMv6-M (Cortex-M0 / M0 +)仅以少数4字节系统指令的形式使用Thumb-2。

因此,新的4字节编码(以及后来在ARMv7版本中添加的编码)仍然是 Thumb指令 - 它们的“Thumb-2”方面是它们可以拥有< / em> 4字节编码,并且它们(通常)可以通过blx有条件地执行(并且,我认为,他们的menmonics仅在UAL中定义)。

*在ARMv6T2之前,关于it(或bl)是作为4字节指令还是作为一对2字节指令执行,实际上是一个复杂的实现细节。架构定义是后者,但由于它们只能按顺序执行,因此出于性能原因将它们融合到一条指令中,除了中断中断的能力之外几乎没有损失。 ARMv6T2刚刚根据融合的单指令执行重新定义了东西

答案 1 :(得分:11)

除了Notlikethat's answer之外,ARMv8还提示了一些新术语,以减少混淆(当然还增加了更多新术语):

有一个32位执行状态(AArch32)和一个64位执行状态(AArch64)。

32位执行状态支持两个不同的指令集:T32(“Thumb”)和A32(“ARM”)。 64位执行状态仅支持一个指令集 - A64。

所有A64与所有A32一样,指令大小为32位(4字节),需要4字节对齐。

许多/大多数A64指令可以在32位和64位寄存器上运行(或者可以说是相同底层64位寄存器的32位或64位视图)。

所有ARMv8处理器(与所有ARMv7处理器一样)都支持T32指令集中的Thumb-2指令。

答案 2 :(得分:0)

请参考https://developer.arm.com/documentation/ddi0344/c/programmer-s-model/thumb-2-instruction-set 它详细解释了 Thumb2 架构的增强。相同的内容隐含地涵盖了 ARM、Thumb 和 Thumb2 指令集描述。

答案 3 :(得分:0)

Cortex M3 具有 4 字节指令,但不执行 ARM 指令,这让我感到困惑。或者 CPU 能够具有 2 字节和 4 字节操作码,但也能够执行 ARM 指令。所以我读了一本关于 Arm 的书,现在我对它的理解稍微好一点。尽管如此,命名和重叠仍然让我感到困惑。我想先比较几个 CPU 然后再讨论 ISA 会很有趣。

比较几个 CPU 以及它们可以做什么以及它们如何重叠:

  • Cortex M0/M0+/M1/M23 被认为是 Thumb (Thumb-1) 并且可以执行 2 字节与其他操作码相比有限的操作码。但是,一些指令如 mrsmsrbldmbdsbisb 来自 Thumb-2 并且 4 字节。 Cortex M0/M0+/M1 是 ARMv6,而 Cortex M23 是 ARMv8。 Thumb-1 指令在 ARMv7 中得到了扩展,因此可以说 ARMv8 Cortext M23 支持更完整的 Thumb-1(it 指令除外),而 ARMv6 Cortex M0/M0+ 仅支持 ISA 的一个子集(它们缺少特别是 itcbzcbnz 指令)。我可能错了(如果不对,请纠正我),但注意到一些有趣的事情,只有我看到的完全支持 Thumb-1 的 CPU 也是已经支持 Thumb-2 的 CPU,我不知道只有 Thumb-1支持 100% Thumb-1 的 CPU。我认为这是因为 it 可以被视为 Thumb-2 操作码,它是 2 字节并且本质上是添加到 Thumb-1 中的。在 Thumb-1 CPU 上,4 字节操作码可以被视为两个 2 字节来表示 4 字节操作码。

  • Cortex M3/M4/M7/M33/M35P/M55 可以执行 2 字节和 4 字节 操作码,都是 Thumb- 1 和 Thumb-2 并支持全套 ISA。 2 字节和 4 字节操作码混合得更均匀,而上面的 Cortex M0/M0+/M1/M23 大部分时间都倾向于使用 2 字节操作码。 Cortex M3/M4/M7 是 ARMv7,而 Cortex M33/M35P/M55 是 ARMv8。

  • Cortex A/R 可以接受 ARM 和 Thumb 操作码,因此具有 2 字节和 4 字节。要在模式之间切换,PC 需要偏移一个字节(强制未对齐),例如可以使用分支指令 bx 来完成,它设置 TCPSR 位和根据地址的最低位切换模式。这很有效,例如当调用子程序时,PC(及其模式)被保存,然后在子程序内部它可以切换到 Thumb 模式,但是当从 Thumb 模式返回时,它将恢复 PC(及其 T 位)和切换回调用者的任何模式(ARM 或 Thumb 模式),没有任何问题。

  • ARM7 仅支持 ARMv3 4 字节 ISA

  • ARM7T 支持 Thumb-1 和 ARM ISA(2 字节和 4 字节)

  • ARM11(ARMv6、ARMv6T2、ARMv6Z、ARMv6K)支持 Thumb-1、Thumb-2 和 ARM ISA

我参考的那本书指出,在 ARMv7 和更新版本中,架构从冯诺依曼(数据和指令共享总线)切换到哈佛(专用总线)以获得更好的性能。然而,绝对术语“和更新”是不正确的,因为 ARMv8 更新,而 ARMv8 Cortex M23 是冯诺依曼。

ISA 是:

  • ARM 有 16 个寄存器(R0-R12、SP、LR、PC),只有 4 字节操作码,ISA 有修订,但它们只是 4 字节操作码.

  • Thumb(又名 Thumb-1)将 16 个寄存器拆分为较低(R0-R7)和较高(R8-R12、SP、LR、PC),大多数指令都可以访问只有较低的集合,而只有一些人可以访问较高的集合。只有 2 字节的操作码。在具有 16 位总线(并且必须分两步进行 32 位字访问)的低端设备上,当它们执行 2 字节操作码时性能更好,因为它与它们的总线匹配。命名让我感到困惑,Thumb 可以用作 Thumb-1 和 Thumb-2 的家族术语,或者有时 Thumb 只能用于 Thumb-1。我认为 Thumb-1 不是 Arm 的官方术语,只是我看到人们用来使两个 ISA 的 Thumb 系列和第一个 Thumb ISA 之间的区别更清晰的东西。 ARM 中的指令可以有可选的 s 后缀来更新 CPSR 寄存器(例如 andsorrsmovsadds、{ {1}} 指令),而在 Thumb-1 中,subs 始终处于开启状态,并始终保存 s 寄存器。在一些较旧的工具链中,不需要隐式 CPSR,但是在统一汇编语言 (UAL) 的努力中,即使没有不使用 { 的选项,现在也要求显式指定 s {1}}。

  • Thumb-2 是 Thumb 的扩展,可以像 ARM 一样访问所有寄存器,与 ARM 相比具有 4 字节的操作码。在程序集中,可以使用 ss 后缀(例如 .n)强制使用 Thumb-1 2 字节窄操作码和 Thumb-2 4 字节宽操作码。 ARM 和 Thumb-2 操作码格式/编码不同,它们的功能也不同。可以使用指令的条件执行,但仅当 .w (if-then) 指令/块被前置时。这可以明确或隐含地完成(并由用户背后的工具链完成)。并且混淆可能实际上是好的,因为 Arm(公司)希望它们相似,统一汇编语言 (UAL) 付出了很多努力,因此为 ARM 制作的汇编文件可以在 Thumb-2 上编译而无需更改。如果我理解正确,那不能 100% 保证,并且可能会出现一些边缘情况,其中 ARM 程序集无法编译为 Thumb-2,这是另一个不完全正确的绝对陈述。例如,ARM7 orr.w 指令可以寻址 +-32MB,而在 Cortex M3 上它只能寻址 +-16MB。与 Thumb-1 相比,这种情况要好得多,其中 ARM 程序集必须更有可能重写为目标 Thumb-1,而 ARM 重写为 Thumb-2 的可能性较小。另一个区别是数据处理指令。 ARM 和 Thumb-2 都支持 8 位立即数,而 ARM 只能向右旋转位,只能旋转偶数位,而 Thumb 可以向左旋转偶数/奇数位,在此之上允许重复字节模式例如 itbl0xXYXYXYXY。因为移位是旋转的,左右移位可以通过“溢出”来实现,向一个方向移位太多以至于实际上是向相反方向移位0x00XY00XY

总之,一些 Arm CPU 可以做到:

  • 只有纯 ARM ISA 的 4 字节操作码指令
  • 2 字节/4 字节 Thumb-1/Thumb-2 ISA,重点是大部分时间使用 2 字节,只有少数 4 字节操作码,这些通常被标记为 Thumb (Thumb-1 ) 2 字节操作码 CPU(有时不提及少数 4 字节操作码)
  • 2 字节/4 字节 Thumb-1/Thumb-2 ISA,并且在 2 字节和 4 字节操作码之间更均匀地混合,通常标记为 Thumb-2
  • 通过在 ARM/Thumb 模式之间切换来实现 2 字节/4 字节操作码

此信息参考:ARM Assembly Language Programming & Architecture Muhammad Ali Mazidi et al 2016。这本书是在公司名称从 ARM 更改为 Arm 之前编写的,因此有时在引用公司 Arm 和ARM ISA。