日前于美国圣诺塞召开的“Spring Processor Forum”论坛上,英国ARM公司发布了采用超标量结构的ARM内核“Cortex-R4”,主要面向需要实时控制的用途。
ARM公司的Richard York表示,在Coretex-R4的设计过程中,设想的用途是汽车刹车控制、硬盘、喷墨打印机等,要求具备能够快速响应中断的实时性,且对成本削减要求较高的领域。确定的目标是电路规模只是比ARM9略有增加,即可实现更接近于Cortex-A8的运算性能。ARM9的电路规模为15万门,而Cortex-R4尽管采用了超标量结构,但电路规模却控制到了20万门左右。
Coretex-R4采用超标量结构,对此York表示:因为很多客户要求不需过多提高工作频率,就能提高运算性能。在Cortex-R4的设计过程中,工作频率的最佳点位是300MHz。再高的话,不仅需要高速内存,而且时钟树的设计也更为复杂。结果,判断合理的做法就是采用超标量结构,增加单位周期所执行的指令平均数。Cortex-R4单位工作频率的运算性能为1.62MIPS(按Dhrystone换算)/MHz,比ARM9的约1.2MIPS/MHz大幅提高。
当谈及为何采用8级管线时,York表示,这是为了能内存访问中消耗2个周期。如果利用单周期访问缓存和内置内存,就会在时序上产生制约。由编译器生成的内存这种倾向更为明显。通过采用双周期访问,即使工作速度较慢的内存也能使用。除此之外,作为Cortex-R4通过对缓存的控制方式进行改进,将中断响应时间缩短到了20个周期。而ARM946E-S为118个周期,ARM966E-S也要54个周期。
同时,York还表示,公司目前还未考虑支持多线程并行处理。原因是要想进行多线程并行处理,就需要大幅增加缓存容量。同时还必须解决信号一致性问题。作为嵌入用途,多内核结构可能更好用。和NEC电子共同开发的“MPCore”之所以同时支持对称多处理和非对称多处理两种方式,是因为非对称多处理无需太在意内存的信号一致性问题。
此外,他还表示:ARM现已向美国Broadcom等两家公司提供Cortex-R4授权,均计划于2006年底前将试制芯片送厂生产。
延伸阅读
ARM新款Cortex-R4处理器全力支持汽车电子设计
瞄准出货规模超过十亿颗的嵌入式处理器市场,ARM日前发布了新款Cortex-R4处理器,可支持新一代手机、硬盘、打印机及汽车电子设计,能协助新一代嵌入式产品快速执行各种复杂的控制算法与实时工作的运算。