[san-tech][02873] NVIDIA GPUDirect等々 (+Storage と GPU)

Date: Mon, 27 Dec 2010 19:41:05 +0900
[san-tech][02875] Re[2]: NVIDIA GPUDirect等々 (+Storage と GPU)
以前話題となった、NVIDIA GPUDirectですが、Linux用 RPMが既に公開されて


現在公開されているのは 3.1.1です。

対応 HBAは、Mellanox、QLogicに直接メールで確認して欲しいとなっています。
両社とも問い合わせメールアドレスが記載されています。QLogicは Subject

以下は NVIDIAサイトで見つけた各種情報です (HPC系が多いですが):

時系列が逆になりますが、まずは先月開催された SC10関連:

NVIDIA GPU Computing, SC10

NVIDIA GPU Computing Theater, SC10
※NVIDIA展示ブースでの講演資料 (PDF+一部 MP4)

"GPU Computing: To ExaScale and Beyond"
 Bill Dally, NVIDIA Research, November 18, 2010
"SC10 - Exaスケールスパコンの実現を目指すNVIDIAの「Echelon計画」"

"Keeneland - A NSF Heterogeneous Computing Resource for Open
 Computational Science"
 Jeffrey Vetter, Oak Ridge National Laboratory/Georgia Tech
※上記 Dally博士のプロジェクトは DOEですが、こちらは NSF資金です。
スタートが早い分、Initial Delivery systemが納品されています。
※ベースシステムは TSUBAME 2.0と同じ HPブレードサーバです。
※HBAは Mellanoxですが、Director Switchは QLogicです。

"TSUBAME 2.0 Supercomputer"
 Satoshi Matsuoka, Titech, November 17, 2010

"First Look at the World's Fastest Supercomputer-Tianhe 1"
 Andy Keane, NVIDIA, November 17, 2010
※中国のスーパーコンピュータの紹介 (各種基板の写真があります)

以下は 2010年 9月 20~23日に開催された GPU Technology Conference (GTC)
GTC 2010 Schedule-at-a-Glance (本当に一覧)
GTC 2010 Program Guide (10MB超、スポンサー各社の広告入り)

GTC 2010 Presentation Archive
※280 speakers!

NVIDIA Research Summit 2010 - Poster Listing

GTC 2010 Presentationは、大部分は Streaming公開、多くは MP4/FLV公開、
講演資料 (PDF) の公開は半分位です。例えば、

"Interactive 3D Audio Rendering Systems"
 Nicolas Tsingos - Dolby Laboratories
"Processing Petabytes per Second with the ATLAS experiment at the
 Large Hadron Collider at CERN"
 Philip Clark, Andrew Washbrook - University of Edinburgh
"500 Teraflops Heterogeneous Cluster"
 Mark Barnell - Air Force Research Lab (AFRL)
※GPUとは直接関係ありませんが、例の PS3の "Cell Cluster Architecture"

以下はストレージと GPU関連です (GTC 2010以外もあります):
"A Highly Reliable RAID System Based on GPUs"
 Matthew Curry - Sandia National Laboratories and the University of
 Alabama at Birmingham (Streaming)

別件での Matthew Curry氏の講演概要
Using GPUs to Enable Highly Reliable RAID
Matthew Curry, University of Alabama at Birmingham

"A Lightweight, GPU-Based Software RAID System"
 Matthew L. Curry, H. Lee Ward, Anthony Skjellum, Ron Brightwell
 2010 39th International Conference on Parallel Processing
※Ward氏、Brightwell氏は Sandia研究所所属です。

Ron Brightwell, Technical Manager, Scalable System Software
Scalable IO
Publications, Scalable IO, Sandia National Laboratoriesから

"Using GPUs to Enable Highly Reliable Embedded Storage"
 Matthew Curry and Anthony Skjellum
 High Performance Embedded Computing 2008 (HPEC08)
HPEC 2008 Proceedings
HPEC Workshops Proceedings

"Arbitrary Dimension Reed-Solomon Coding and Decoding for Extended RAID
 on GPUs"
 Curry, Matthew L.; Ward, Lee; Skjellum, Anthony; Brightwell, Ron:
 3rd Petascale Data Storage Workshop held in conjunction with SC08

"Accelerating Reed-Solomon coding in RAID systems with GPUs"
 Curry, M.L.;   Skjellum, A.;   Ward, H.L.;   Brightwell, R.;
 Univ. of Alabama at Birmingham,
 2008 IEEE International Symposium on Parallel and Distributed Processing

Matthew Curry氏ではありませんが、
"Efficiency Considerations of Cauchy Reed-Solomon Implementations on
 Accelerator and Multi-Core Platforms"
 Thomas Steinke, Kathrin Peter and Sebastian Borchert
 Zuse Institute Berlin

2010 Symposium on Application Accelerators in High Performance Computing
(SAAHPC'10), 2010/07/12 - 15
Symposium on Application Accelerators in High Performance Computing

"A GPU accelerated storage system"
 Abdullah Gharaibeh (The University of British Columbia, Vancouver), et al.
 19th ACM International Symposium on High Performance Distributed Computing
 (HPDC '10)

"Parallel Reed/Solomon Coding on Multicore Processors"
 Peter Sobe, University of Luebeck, Germany
 2010 International Workshop on Storage Network Architecture and Parallel I/Os
 SNAPI Workshop, May 3rd, 2010
SNAPI Workshop 2010講演資料:

Storageと Reed-Solomon Codingと言えば、テネシー大学の Plank教授
James S. Plank,
Professor, Dept. of Electrical Engineering and Computer Science, University of Tennessee

Jim Plank's Papers
"Mean time to meaningless: MTTDL, Markov models and storage system reliability"
 Kevin M. Greenan, James S. Plank and Jay J. Wylie
 2nd Workshop on Hot Topics in Storage and File Systems (HotStorage '10)

Workshop Program, HotStorage '10
※ペパー、講演資料公開 (大部分、ただし上記講演資料は公開されていません)

Reed-Solomon error correction
From Wikipedia, the free encyclopedia
"One significant application of Reed-Solomon coding was to encode the digital
 pictures sent back by the Voyager space probe."

高いと単純に言えません。以前、各社 HDD符号長を調べたことがありますが、
にした等と解説してありましたが、他は符号長 (bit数) だけの記載でした。
コンシューマ向けの方が bit長が長いメーカもありました。これは演算量と

