--------------------------------------------------
GPUと ARMと言えば、先日 (1/5) の CECでの NVIDIAの発表がありました
"【CES 2011レポート】NVIDIAカンファレンス編
~GPU統合型ARMベースCPU「Project Denver」の開発を表明"
2011年 1月 6日
"3.NVIDIAが高性能ARMプロセサの開発を表明"
最近の話題 2011年1月8日, Ando's Processor Information Page
NVIDIAのプレスリリース等:
"NVIDIA、「Project Denver」を発表- パーソナル・コンピューターから
スーパーコンピュータまでをターゲットに、ARMアーキテクチャ採用の
カスタムCPUコアを開発"
2011年1月5日
"NVIDIA Announces "Project Denver" to Build Custom CPU Cores Based
on ARM Architecture, Targeting Personal Computers to Supercomputers"
01/05/2011
"Project Denver" Processor to Usher in New Era of Computing"
Bill Dally, Posted on Jan 5 2011
調べてみたら ARMでは、既に GPUコアを提供してました (携帯電話等用です)。
例えば
"Mobile and embedded computing on Mali GPUs"
Anton Lokhmotov, Media Processing Division, ARM
2nd UK GPU Computing Conference
December 13-14 2010
2nd UK GPU Computing Conference
December 13-14 2010
※AMD, Intel, Microsoft等の発表資料が公開されています。個人的には:
"Directive-based programming for GPUs, accelerators and HPC"
Alistair Hart (Cray)
※こういう流れもあるのですね・・・
上記 ARM発表資料に既存 GPU (6ページ) と、ARM-based (7ページ) の比較が
あります。
既存 GPUの場合、CPUのメインメモリと GPUローカルメモリに多くの時間が
さかれます。ターゲットによりますが、転送時間が処理全体の半分位要する
とはよく聞きます。このコンファレンスでの Mathworksの発表とか
"Accelerating Matlab with NVIDIA GPUs"
Jos Martin (Mathworks)
姫野ベンチマークテストでも、データ転送に工夫をしてスコアを上げている
報告があります (すいません、ソースはちょっと忘れました)。
で、ARMの 7ページに戻りますが、この構成だと ARM CPUと GPUでメイン
メモリーの共有が実現しますが、この図には重要なパーツが抜けています。
実際には以下のような構成になるそうです (出荷は 2011年後半位?)
Mali-T604 (ARM製第五世代 GPU) は、MMU-400経由で全体の Cache Coherent
Interconnectと接続されています。MMU-400は、TLB搭載と共に ARMの仮想化に
対応していますので、CCI-400に接続されているメモリコントローラ:DMC-400
経由でメインメモリを共有出来ます (ARM A15論理メモリ空間とメインメモリ
の物理アドレスの変換は ARM A15で、Mali-T604の論理メモリ空間とメイン
メモリの物理アドレス MMU-400で変換)。
CoreLink System IP & Design Tools for AMBA
CoreLink System Controllers for AMBA
ARMの仮想化と System Memory Management Unit (SMMU: MMU-400) の解説:
"Virtualization is Coming to a Platform Near You"
"To address this ARM is introducing the Virtualization Extensions
to its ARM v7 architecture and the System Memory Management Unit
(SMMU) Architecture. This paper examines the rationale behind this,
and explores how SMMU will enable vast reductions in software costs
and complexity, and at the same time aligning with the ARM's ethos
of low power, high performance designs." (Page 1)
"A System MMU is a hardware device designed to provide address
translation services and protection functionalities to any DMA
capable agent in the system other than the main CPU." ... "The SMMU
can be implemented as a standalone device or integrated with an
existing DMA capable processing unit." (Page 9)
AMBAは ARMによる on-chip communication仕様です。最新版は上記 AMBA 4ですが
Mali-T604のライセンス化は 2011年後半なようです。
AMBA Open Specifications
CoreLink Interconnect - AMBA on-chip connectivity
CoreLink Network Interconnect for AMBA AXI
※上記 2つは現行の AMBA 3系がメイン
Mali-T604 (GPU)
ARM Mali Developer Center
Mali Graphics Hardware
※ライブラリは OpenCLに対応
CoreLinkは組み込み用通信メカニズムなので、QoSを重視しています。
CoreLink Advanced Quality of Service
"QoS for High-Performance and Power-Efficient HD Multimedia
April 2010
"Traffic Management for Optimizing Media-Intensive SoCs"
最新 ARMコア (出荷/ライセンス化はまだ)
Cortex-A15 Processor
"full hardware virtualization, Large Physical Address Extensions (LPAE)
addressing up to 1TB of memory as well as error correction capability
for fault-tolerance and soft-fault recovery."
"Hardware support for floating point operations in half-, single- and
double-precision floating point arithmetic."
※Floating Pointについては "Specification" から
CoreLink 400 (AMBA 4系)プレスリリース:
"ARM Announces Corelink 400 System IP to Unleash High Performance CPU and
GPU Systems", 10 November 2010
長々と書きましたが、
が実現されると、GPUの演算能力によりますが、これをディスクコントローラ
に採用すればディスク側の独立した CPUチップ搭載は不要になり:
重複データ処理やいろいろなアルゴリズが低消費電力で可能になるのかなぁ
と思ったりします。
ちなみに冒頭の NVIDIAのプレスリリースですが、本文には:
"同じく本日、発表された戦略的パートナーシップがありました。"
"This new processor stems from a strategic partnership, also announced
today,"
とありますが、NVIDIA、ARM両社ともパートナーシップついてのプレスリリース
はありません。個人的には、ARMコアだけでなく、CoreLinkライセンスも含まれ
ているのではと思います。
NVIDIAとしては、自社 GPUコアと MMU-400とのインタフェースを設計すれば、
ARMコア (ARM-15最大 8コア) との共有メモリシステムチップが構築できますね。
以下は参考です:
ARM関係者の Blog、特に GPU関連
"GPU Computing, the OpenCL debate and performance measurement"
Jem Davies, ARM Fellow, 18 August 2010
"CPUs Have Been Doing GPU Computing Badly for Years"
Jem Davies, ARM Fellow, 03 November 2010
"ARM Mali-T604: New GPU & Architecture For Highest Performance &
Flexibility"
Jem Davies, ARM Fellow, 10 November 2010
The Background
"Over 5 years ago, my boss asked me to go buy a graphics company to
kick-start our entry into the graphics market which was clearly
ready for ARM-quality IP."
"Embedded and Desktop - Similarities and Differences"
Jem Davies, ARM Fellow, 11 November 2010
"Visual Computing Will Be Powered By ARM Mali Graphics"
Ian Smythe, Director of Marketing - Media Processing Division,
15 November 2010
"Historical Look at the Makings of the Newest ARM Mali-T604 GPU"
Edvard Sorgard, Consultant Graphics Architect, ARM
17 November 2010
The initial dream: GPU chip company
"To think it's over 10 years since we started tinkering with GPU
design while still students at the Norwegian University of Science
and Technology in Trondheim, it sure doesn't feel that long."
...
Mali: GPU architecture and philosophy for embedded graphics
"Years of hard work and a lot of brick-by-brick building later,
our humble start-up was acquired by ARM and taken to the next level."
"ARM Strengthens Its 3D Graphics IP Portfolio Through Falanx Acquisition"
23 June 2006
"ARM Mali-T604 GPU Ready for Post-32-bit World and Real Computing"
Jem Davies, ARM Fellow, 08 December 2010
"Just like the ARM Cortex-A15, it has its own MMU and it uses the
same page table formats as the Cortex-A15. The MMU and page
tables present external 40-bit addresses and are ready for
a fully 64-bit world."
...
... "so Mali-T604 has native FP64 support" ...
ARM Community> ARM Blogs> Multimedia
ARM Information Center
※各種資料・仕様が大量に公開されています。
以下は YouTubeから:
"Meet the ARM Mali-T604"
2010/11/10
"ARM Technology Conference 2010 - DAY 2 UPDATE"
2010/11/10
※メインは ARM Mali-T604 GPU
"ARM Mali-T604 GPU -- Bringing Visual Computing To Life",
2010/12/16
オフィシャルコマーシャルビデオ
"ARM Cortex-A15 MPcore processor"
2010/09/08
ARMflix さんのチャンネル
"ARM Mali-T604, the next generation GPU for ARM Powered devices"
2010/11/12
"ARM CoreLink 400 Series"
2010/11/12
Date: Fri, 04 Feb 2011 21:36:33 +0900
--------------------------------------------------
ARM関連の記事です
"ARM Processors Set to Challenge x86 On Its Own Turf"
February 02, 2011
以下はこの記事で引用
"Intel won't be dominant, ARM president says"
Feb. 1, 2011
David Patterson教授が ARMの Blogに投稿
"RISC versus CISC Wars in the PrePC and PC Eras - Part 1"
Posted by David Patterson
18 January 2011
"RISC versus CISC Wars in the PostPC Eras - Part 2"
Posted by David Patterson
24 January 2011
"This two-part blog gives a historical perspective on the ARM vs. 80x86
instruction set competition for three eras: PrePC (late 1970s/early
1980s), PC (mid 1980s to mid 2000s), and PostPC (late 2000s onward)."
--------------------------------------------------
2011/07/09
"ARM Mali-T604 tips mobile graphics, computing, and IP trends"
7/5/2011, EETimes
http://www.eetimes.com/design/eda-design/4217557/ARM-Mali-T604-tips-mobile-graphics--computing--and-IP-trends
--------------------------------------------------
2011/07/29
"ARM、GPU戦略と今後のロードマップを紹介
~2012年にWindows 8向け製品が登場"
2011年 7月 26日, PC Watch
http://pc.watch.impress.co.jp/docs/news/20110726_463064.html
"ARMがGPUコアのロードマップを発表,消費電力が同じで500倍の処理能力の提供を
目指す"
2011/07/26, Tech-On!
http://techon.nikkeibp.co.jp/article/NEWS/20110726/193673
--------------------------------------------------
2011/07/29
"ARM、GPU戦略と今後のロードマップを紹介
~2012年にWindows 8向け製品が登場"
2011年 7月 26日, PC Watch
http://pc.watch.impress.co.jp/docs/news/20110726_463064.html
"ARMがGPUコアのロードマップを発表,消費電力が同じで500倍の処理能力の提供を
目指す"
2011/07/26, Tech-On!
http://techon.nikkeibp.co.jp/article/NEWS/20110726/193673
0 件のコメント:
コメントを投稿