Reprints from my posting to SAN-Tech Mailing List and ...

2011/06/11

[san-tech][02873] NVIDIA GPUDirect等々 (+Storage と GPU)

Date: Mon, 27 Dec 2010 19:41:05 +0900
--------------------------------------------------
2011/06/11
[san-tech][02875] Re[2]: NVIDIA GPUDirect等々 (+Storage と GPU)
--------------------------------------------------
以前話題となった、NVIDIA GPUDirectですが、Linux用 RPMが既に公開されて
います:

NVIDIA GPUDirect
  http://developer.nvidia.com/object/gpudirect.html

現在公開されているのは 3.1.1です。

対応 HBAは、Mellanox、QLogicに直接メールで確認して欲しいとなっています。
両社とも問い合わせメールアドレスが記載されています。QLogicは Subject
の指定があります。


以下は NVIDIAサイトで見つけた各種情報です (HPC系が多いですが):

時系列が逆になりますが、まずは先月開催された SC10関連:

NVIDIA GPU Computing, SC10
  http://www.nvidia.com/object/sc10.html
※SC10オフィシャルサイトへのリンク

NVIDIA GPU Computing Theater, SC10
  http://www.nvidia.com/object/sc10_theater.html
※NVIDIA展示ブースでの講演資料 (PDF+一部 MP4)
例えば、

"GPU Computing: To ExaScale and Beyond"
 Bill Dally, NVIDIA Research, November 18, 2010
  http://www.nvidia.com/content/PDF/sc_2010/theater/Dally_SC10.pdf
  http://www.nvidia.com/content/mp4/sc-2010/theater/dally-sc10.mp4
これについての解説:
"SC10 - Exaスケールスパコンの実現を目指すNVIDIAの「Echelon計画」"
 2010/12/24
  http://journal.mycom.co.jp/articles/2010/12/24/sc10-nvidia/index.html

"Keeneland - A NSF Heterogeneous Computing Resource for Open
 Computational Science"
 Jeffrey Vetter, Oak Ridge National Laboratory/Georgia Tech
  http://www.nvidia.com/content/PDF/sc_2010/theater/Vetter_SC10.pdf
※上記 Dally博士のプロジェクトは DOEですが、こちらは NSF資金です。
スタートが早い分、Initial Delivery systemが納品されています。
※ベースシステムは TSUBAME 2.0と同じ HPブレードサーバです。
※HBAは Mellanoxですが、Director Switchは QLogicです。

"TSUBAME 2.0 Supercomputer"
 Satoshi Matsuoka, Titech, November 17, 2010
  http://www.nvidia.com/content/PDF/sc_2010/theater/Matsuoka_SC10.pdf

"First Look at the World's Fastest Supercomputer-Tianhe 1"
 Andy Keane, NVIDIA, November 17, 2010
  http://www.nvidia.com/content/PDF/sc_2010/theater/Keane_SC10_wed.pdf
  http://www.nvidia.com/content/mp4/sc-2010/theater/keane-sc10.mp4
※中国のスーパーコンピュータの紹介 (各種基板の写真があります)


以下は 2010年 9月 20~23日に開催された GPU Technology Conference (GTC)
関連です:
GTC 2010 Schedule-at-a-Glance (本当に一覧)
  http://www.nvidia.com/content/GTC/documents/GTC2010_Schedule.pdf
GTC 2010 Program Guide (10MB超、スポンサー各社の広告入り)
  http://www.nvidia.com/content/PDF/GTC/GTC2010_ProgramGuide.pdf

GTC 2010 Presentation Archive
  http://www.nvidia.com/object/gtc2010-presentation-archive.html
※280 speakers!

NVIDIA Research Summit 2010 - Poster Listing
  http://www.nvidia.com/object/research_summit_posters_2010.html

GTC 2010 Presentationは、大部分は Streaming公開、多くは MP4/FLV公開、
講演資料 (PDF) の公開は半分位です。例えば、

"Interactive 3D Audio Rendering Systems"
 Nicolas Tsingos - Dolby Laboratories
  http://www.nvidia.com/content/GTC-2010/pdfs/2042_GTC2010.pdf
"Processing Petabytes per Second with the ATLAS experiment at the
 Large Hadron Collider at CERN"
 Philip Clark, Andrew Washbrook - University of Edinburgh
  http://www.nvidia.com/content/GTC-2010/pdfs/2135_GTC2010.pdf
"500 Teraflops Heterogeneous Cluster"
 Mark Barnell - Air Force Research Lab (AFRL)
  http://www.nvidia.com/content/GTC-2010/pdfs/2283_GTC2010.pdf
※GPUとは直接関係ありませんが、例の PS3の "Cell Cluster Architecture"
の紹介があります。


以下はストレージと GPU関連です (GTC 2010以外もあります):
"A Highly Reliable RAID System Based on GPUs"
 Matthew Curry - Sandia National Laboratories and the University of
 Alabama at Birmingham
  http://nvidia.fullviewmedia.com/gtc2010/0921-a7-2205.html (Streaming)
  http://www.nvidia.com/content/GTC-2010/flvs/2205_GTC2010.flv
  http://www.nvidia.com/content/GTC-2010/flvs/2205_GTC2010.mp4
※残念ながら講演資料は公開されていません。

別件での Matthew Curry氏の講演概要
Using GPUs to Enable Highly Reliable RAID
Matthew Curry, University of Alabama at Birmingham
  http://www.cs.sandia.gov/CSRI/Seminars/2010/curry.htm

共著ペーパー等
"A Lightweight, GPU-Based Software RAID System"
 Matthew L. Curry, H. Lee Ward, Anthony Skjellum, Ron Brightwell
 2010 39th International Conference on Parallel Processing
  http://doi.ieeecomputersociety.org/10.1109/ICPP.2010.64
※Ward氏、Brightwell氏は Sandia研究所所属です。

Ron Brightwell, Technical Manager, Scalable System Software
  http://www.sandia.gov/~rbbrigh/
Scalable IO
  http://www.cs.sandia.gov/Scalable_IO/
Publications, Scalable IO, Sandia National Laboratoriesから
  http://www.cs.sandia.gov/Scalable_IO/publications.html

"Using GPUs to Enable Highly Reliable Embedded Storage"
 Matthew Curry and Anthony Skjellum
 High Performance Embedded Computing 2008 (HPEC08)
  http://www.ll.mit.edu/HPEC/agendas/proc08/Day2/18-Day2-Session3-Curry-abstract.pdf
  http://www.ll.mit.edu/HPEC/agendas/proc08/Day2/13-Curry-Presentation.pdf
  http://www.ll.mit.edu/HPEC/agendas/proc08/Day2/13-Curry-Presentation.ppt
 
HPEC 2008 Proceedings
  http://www.ll.mit.edu/HPEC/agendas/proc08/agenda.html
HPEC Workshops Proceedings
  http://www.ll.mit.edu/HPEC/2010/previous.html

"Arbitrary Dimension Reed-Solomon Coding and Decoding for Extended RAID
 on GPUs"
 Curry, Matthew L.; Ward, Lee; Skjellum, Anthony; Brightwell, Ron:
 3rd Petascale Data Storage Workshop held in conjunction with SC08
  http://www.pdsi-scidac.org/events/PDSW08/resources/papers/MatthewCurryPaper.pdf

"Accelerating Reed-Solomon coding in RAID systems with GPUs"
 Curry, M.L.;   Skjellum, A.;   Ward, H.L.;   Brightwell, R.;
 Univ. of Alabama at Birmingham,
 2008 IEEE International Symposium on Parallel and Distributed Processing
  http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=4536322

Matthew Curry氏ではありませんが、
"Efficiency Considerations of Cauchy Reed-Solomon Implementations on
 Accelerator and Multi-Core Platforms"
 Thomas Steinke, Kathrin Peter and Sebastian Borchert
 Zuse Institute Berlin
  http://saahpc.ncsa.illinois.edu/10/papers/paper_12.pdf
  http://saahpc.ncsa.illinois.edu/10/presentations/day3/session1/presentation_Steinke.pdf

2010 Symposium on Application Accelerators in High Performance Computing
(SAAHPC'10), 2010/07/12 - 15
  http://saahpc.ncsa.illinois.edu/10/agenda.html
Symposium on Application Accelerators in High Performance Computing
  http://www.saahpc.org/

"A GPU accelerated storage system"
 Abdullah Gharaibeh (The University of British Columbia, Vancouver), et al.
 19th ACM International Symposium on High Performance Distributed Computing
 (HPDC '10)
  http://portal.acm.org/citation.cfm?id=1851476.1851497

"Parallel Reed/Solomon Coding on Multicore Processors"
 Peter Sobe, University of Luebeck, Germany
 2010 International Workshop on Storage Network Architecture and Parallel I/Os
 SNAPI Workshop, May 3rd, 2010
  http://www.computer.org/portal/web/csdl/doi/10.1109/SNAPI.2010.16
講演資料:
  http://people.ac.upc.edu/toni/SNAPI2010/SNAPI%202010%20Slides/Afternoon%202.2.pdf
SNAPI Workshop 2010講演資料:
  http://people.ac.upc.edu/toni/SNAPI2010/snapi2010_Program.htm

Storageと Reed-Solomon Codingと言えば、テネシー大学の Plank教授
James S. Plank,
Professor, Dept. of Electrical Engineering and Computer Science, University of Tennessee
  http://web.eecs.utk.edu/~plank/
ですが、GPUには取り組んでないようです:

Jim Plank's Papers
  http://web.eecs.utk.edu/~plank/plank/papers/papers.html
例えば
"Mean time to meaningless: MTTDL, Markov models and storage system reliability"
 Kevin M. Greenan, James S. Plank and Jay J. Wylie
 2nd Workshop on Hot Topics in Storage and File Systems (HotStorage '10)
  http://web.eecs.utk.edu/~plank/plank/papers/Hot-Storage-2010.html

Workshop Program, HotStorage '10
  http://www.usenix.org/events/hotstorage10/tech/
※ペパー、講演資料公開 (大部分、ただし上記講演資料は公開されていません)


Reed-Solomon error correction
From Wikipedia, the free encyclopedia
  http://en.wikipedia.org/wiki/Reed%E2%80%93Solomon_error_correction
"One significant application of Reed-Solomon coding was to encode the digital
 pictures sent back by the Voyager space probe."

HDDデータ記録でも採用されていますが、Read-Solomon符号が長いと信頼性が
高いと単純に言えません。以前、各社 HDD符号長を調べたことがありますが、
かなりの違いがありました。
Maxtorは、どのような読み込みエラーを想定しているからこのような符号長
にした等と解説してありましたが、他は符号長 (bit数) だけの記載でした。
コンシューマ向けの方が bit長が長いメーカもありました。これは演算量と
コストの兼ね合いや改良等について、各メーカーのノウハウでしょう。

0 件のコメント:

コメントを投稿