Date: Mon, 27 Dec 2010 19:41:05 +0900
--------------------------------------------------
2011/06/11
[san-tech][02875] Re[2]: NVIDIA GPUDirect等々 (+Storage と GPU)
--------------------------------------------------
以前話題となった、NVIDIA GPUDirectですが、Linux用 RPMが既に公開されて
います:
NVIDIA GPUDirect
http://developer.nvidia.com/object/gpudirect.html
現在公開されているのは 3.1.1です。
対応 HBAは、Mellanox、QLogicに直接メールで確認して欲しいとなっています。
両社とも問い合わせメールアドレスが記載されています。QLogicは Subject
の指定があります。
以下は NVIDIAサイトで見つけた各種情報です (HPC系が多いですが):
時系列が逆になりますが、まずは先月開催された SC10関連:
NVIDIA GPU Computing, SC10
http://www.nvidia.com/object/sc10.html
※SC10オフィシャルサイトへのリンク
NVIDIA GPU Computing Theater, SC10
http://www.nvidia.com/object/sc10_theater.html
※NVIDIA展示ブースでの講演資料 (PDF+一部 MP4)
例えば、
"GPU Computing: To ExaScale and Beyond"
Bill Dally, NVIDIA Research, November 18, 2010
http://www.nvidia.com/content/PDF/sc_2010/theater/Dally_SC10.pdf
http://www.nvidia.com/content/mp4/sc-2010/theater/dally-sc10.mp4
これについての解説:
"SC10 - Exaスケールスパコンの実現を目指すNVIDIAの「Echelon計画」"
2010/12/24
http://journal.mycom.co.jp/articles/2010/12/24/sc10-nvidia/index.html
"Keeneland - A NSF Heterogeneous Computing Resource for Open
Computational Science"
Jeffrey Vetter, Oak Ridge National Laboratory/Georgia Tech
http://www.nvidia.com/content/PDF/sc_2010/theater/Vetter_SC10.pdf
※上記 Dally博士のプロジェクトは DOEですが、こちらは NSF資金です。
スタートが早い分、Initial Delivery systemが納品されています。
※ベースシステムは TSUBAME 2.0と同じ HPブレードサーバです。
※HBAは Mellanoxですが、Director Switchは QLogicです。
"TSUBAME 2.0 Supercomputer"
Satoshi Matsuoka, Titech, November 17, 2010
http://www.nvidia.com/content/PDF/sc_2010/theater/Matsuoka_SC10.pdf
"First Look at the World's Fastest Supercomputer-Tianhe 1"
Andy Keane, NVIDIA, November 17, 2010
http://www.nvidia.com/content/PDF/sc_2010/theater/Keane_SC10_wed.pdf
http://www.nvidia.com/content/mp4/sc-2010/theater/keane-sc10.mp4
※中国のスーパーコンピュータの紹介 (各種基板の写真があります)
以下は 2010年 9月 20~23日に開催された GPU Technology Conference (GTC)
関連です:
GTC 2010 Schedule-at-a-Glance (本当に一覧)
http://www.nvidia.com/content/GTC/documents/GTC2010_Schedule.pdf
GTC 2010 Program Guide (10MB超、スポンサー各社の広告入り)
http://www.nvidia.com/content/PDF/GTC/GTC2010_ProgramGuide.pdf
GTC 2010 Presentation Archive
http://www.nvidia.com/object/gtc2010-presentation-archive.html
※280 speakers!
NVIDIA Research Summit 2010 - Poster Listing
http://www.nvidia.com/object/research_summit_posters_2010.html
GTC 2010 Presentationは、大部分は Streaming公開、多くは MP4/FLV公開、
講演資料 (PDF) の公開は半分位です。例えば、
"Interactive 3D Audio Rendering Systems"
Nicolas Tsingos - Dolby Laboratories
http://www.nvidia.com/content/GTC-2010/pdfs/2042_GTC2010.pdf
"Processing Petabytes per Second with the ATLAS experiment at the
Large Hadron Collider at CERN"
Philip Clark, Andrew Washbrook - University of Edinburgh
http://www.nvidia.com/content/GTC-2010/pdfs/2135_GTC2010.pdf
"500 Teraflops Heterogeneous Cluster"
Mark Barnell - Air Force Research Lab (AFRL)
http://www.nvidia.com/content/GTC-2010/pdfs/2283_GTC2010.pdf
※GPUとは直接関係ありませんが、例の PS3の "Cell Cluster Architecture"
の紹介があります。
以下はストレージと GPU関連です (GTC 2010以外もあります):
"A Highly Reliable RAID System Based on GPUs"
Matthew Curry - Sandia National Laboratories and the University of
Alabama at Birmingham
http://nvidia.fullviewmedia.com/gtc2010/0921-a7-2205.html (Streaming)
http://www.nvidia.com/content/GTC-2010/flvs/2205_GTC2010.flv
http://www.nvidia.com/content/GTC-2010/flvs/2205_GTC2010.mp4
※残念ながら講演資料は公開されていません。
別件での Matthew Curry氏の講演概要
Using GPUs to Enable Highly Reliable RAID
Matthew Curry, University of Alabama at Birmingham
http://www.cs.sandia.gov/CSRI/Seminars/2010/curry.htm
共著ペーパー等
"A Lightweight, GPU-Based Software RAID System"
Matthew L. Curry, H. Lee Ward, Anthony Skjellum, Ron Brightwell
2010 39th International Conference on Parallel Processing
http://doi.ieeecomputersociety.org/10.1109/ICPP.2010.64
※Ward氏、Brightwell氏は Sandia研究所所属です。
Ron Brightwell, Technical Manager, Scalable System Software
http://www.sandia.gov/~rbbrigh/
Scalable IO
http://www.cs.sandia.gov/Scalable_IO/
Publications, Scalable IO, Sandia National Laboratoriesから
http://www.cs.sandia.gov/Scalable_IO/publications.html
"Using GPUs to Enable Highly Reliable Embedded Storage"
Matthew Curry and Anthony Skjellum
High Performance Embedded Computing 2008 (HPEC08)
http://www.ll.mit.edu/HPEC/agendas/proc08/Day2/18-Day2-Session3-Curry-abstract.pdf
http://www.ll.mit.edu/HPEC/agendas/proc08/Day2/13-Curry-Presentation.pdf
http://www.ll.mit.edu/HPEC/agendas/proc08/Day2/13-Curry-Presentation.ppt
HPEC 2008 Proceedings
http://www.ll.mit.edu/HPEC/agendas/proc08/agenda.html
HPEC Workshops Proceedings
http://www.ll.mit.edu/HPEC/2010/previous.html
"Arbitrary Dimension Reed-Solomon Coding and Decoding for Extended RAID
on GPUs"
Curry, Matthew L.; Ward, Lee; Skjellum, Anthony; Brightwell, Ron:
3rd Petascale Data Storage Workshop held in conjunction with SC08
http://www.pdsi-scidac.org/events/PDSW08/resources/papers/MatthewCurryPaper.pdf
"Accelerating Reed-Solomon coding in RAID systems with GPUs"
Curry, M.L.; Skjellum, A.; Ward, H.L.; Brightwell, R.;
Univ. of Alabama at Birmingham,
2008 IEEE International Symposium on Parallel and Distributed Processing
http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=4536322
Matthew Curry氏ではありませんが、
"Efficiency Considerations of Cauchy Reed-Solomon Implementations on
Accelerator and Multi-Core Platforms"
Thomas Steinke, Kathrin Peter and Sebastian Borchert
Zuse Institute Berlin
http://saahpc.ncsa.illinois.edu/10/papers/paper_12.pdf
http://saahpc.ncsa.illinois.edu/10/presentations/day3/session1/presentation_Steinke.pdf
2010 Symposium on Application Accelerators in High Performance Computing
(SAAHPC'10), 2010/07/12 - 15
http://saahpc.ncsa.illinois.edu/10/agenda.html
Symposium on Application Accelerators in High Performance Computing
http://www.saahpc.org/
"A GPU accelerated storage system"
Abdullah Gharaibeh (The University of British Columbia, Vancouver), et al.
19th ACM International Symposium on High Performance Distributed Computing
(HPDC '10)
http://portal.acm.org/citation.cfm?id=1851476.1851497
"Parallel Reed/Solomon Coding on Multicore Processors"
Peter Sobe, University of Luebeck, Germany
2010 International Workshop on Storage Network Architecture and Parallel I/Os
SNAPI Workshop, May 3rd, 2010
http://www.computer.org/portal/web/csdl/doi/10.1109/SNAPI.2010.16
講演資料:
http://people.ac.upc.edu/toni/SNAPI2010/SNAPI%202010%20Slides/Afternoon%202.2.pdf
SNAPI Workshop 2010講演資料:
http://people.ac.upc.edu/toni/SNAPI2010/snapi2010_Program.htm
Storageと Reed-Solomon Codingと言えば、テネシー大学の Plank教授
James S. Plank,
Professor, Dept. of Electrical Engineering and Computer Science, University of Tennessee
http://web.eecs.utk.edu/~plank/
ですが、GPUには取り組んでないようです:
Jim Plank's Papers
http://web.eecs.utk.edu/~plank/plank/papers/papers.html
例えば
"Mean time to meaningless: MTTDL, Markov models and storage system reliability"
Kevin M. Greenan, James S. Plank and Jay J. Wylie
2nd Workshop on Hot Topics in Storage and File Systems (HotStorage '10)
http://web.eecs.utk.edu/~plank/plank/papers/Hot-Storage-2010.html
Workshop Program, HotStorage '10
http://www.usenix.org/events/hotstorage10/tech/
※ペパー、講演資料公開 (大部分、ただし上記講演資料は公開されていません)
Reed-Solomon error correction
From Wikipedia, the free encyclopedia
http://en.wikipedia.org/wiki/Reed%E2%80%93Solomon_error_correction
"One significant application of Reed-Solomon coding was to encode the digital
pictures sent back by the Voyager space probe."
HDDデータ記録でも採用されていますが、Read-Solomon符号が長いと信頼性が
高いと単純に言えません。以前、各社 HDD符号長を調べたことがありますが、
かなりの違いがありました。
Maxtorは、どのような読み込みエラーを想定しているからこのような符号長
にした等と解説してありましたが、他は符号長 (bit数) だけの記載でした。
コンシューマ向けの方が bit長が長いメーカもありました。これは演算量と
コストの兼ね合いや改良等について、各メーカーのノウハウでしょう。
0 件のコメント:
コメントを投稿