Reprints from my posting to SAN-Tech Mailing List and ...

2011/06/09

[san-tech][02438] 講演資料:FAST-OS Workshop, (2010/06/22)

Date: Fri, 02 Jul 2010 12:46:54 +0900
--------------------------------------------------
2010年 6月 22日に開催された FAST-OS Workshopの講演資料が公開されています:

FAST-OS Workshop, June 22, 2010
  http://www.usenix.org/events/fastos10/
※2010 USENIX Federated Conferences Week, June 22-25, 2010の一環として
開催されました。↑については別途紹介します。

USENIX 2010 Workshop
  http://www.fastos2.org/usenix-2010-workshop
※Slidesをクリックすると新しい tab (window) が立ち上がります。
資料のダウンロードは、新しい画面の左上のボタンから可能です。

FAST-OSプロジェクトの説明は省かせて頂きますが、以下に公開されている講演と
関連リンクを簡単にリストします (発表者省略):


----------------------------------------
"Monitoring and debugging on 200,000 CPUS"

MRNet
  http://www.paradyn.org
Paradyn/Condor Week 2010, April 12-April 16, 2010
  http://www.cs.wisc.edu/condor/ParadynCondorWeek2010/index.html

実際に米国では 200Kコアで天文学アプリケーションを実行させたことが
報告されています (詳細は SciDAC 2010, 7/11 - 15で発表予定)
"Science at Scale: SciDAC Astrophysics Code Scales to Over 200K Processors"
 June 18, 2010
  http://www.lbl.gov/cs/Archive/news061810.html

MAESTRO: Low Mach Number Astrophysics
  https://ccse.lbl.gov/Research/MAESTRO/
※こちらは数年前から大規模 (数十万コア) をターゲットとして開発して
きています
Compressible Astrophysics: CASTRO
  https://ccse.lbl.gov/Research/CASTRO/index.html

----------------------------------------
"The Colony Project"
  http://www.hpc-colony.org
こちらでも
  SpiderCast: Scalable Membership, Monitoring, & Communication Services

----------------------------------------
"Cielo: The NNSA's Next Generation Capability Computing Platform"

OSというより、ペタフロップス級スーパーコンピュータプロジェクトの紹介です。
ファイルシステム:
  Parallel File System: DVS w/Panasas
※DVS (Data Virtualization Services):演算ノードから Panasasにアクセス
[san-tech][02185] Cray+Panasas = Peta-scale Supercomputer, NNSA, $45M
[san-tech][02187] Re: Cray+Panasas = Peta-scale Supercomputer, NNSA, $45M
[san-tech][02234] PAS HC:Panasas新製品

----------------------------------------
"Reliability, Availability and Serviceability (RAS) for High-End Computing"

※HPCでの耐障害性を高めるための仮想化を検証しています
  VM-level Migration with Xen
  Process-Level Migration with BLCR (Berkeley Lab Checkpoint/Restart)
とか、

----------------------------------------
"Portable, Scalable, and High-Performance I/O Forwarding on Massively Parallel Systems"

I/O Forwarding Scalability Layer
  http://www.iofsl.org

参考プレプリント:
"Optimization Techniques at the I/O Forwarding Layer,"
 K. Ohta, D. Kimpe, J. Cope, K. Iskra, R. Ross, and Y. Ishikawa,
 Preprint ANL/MCS-P1735-0310, March 2010.
  http://www.mcs.anl.gov/publications/paper_detail.php?id=969
  http://www.mcs.anl.gov/uploads/cels/papers/iofsl-cluster10.pdf

----------------------------------------
"ZeptoOS: Experiences with Running a Linux Kernel on Blue Gene/P"
ZeptoOS
  http://www.zeptoos.org/

----------------------------------------
"Plan 9 Execution Model on BG/P"

Bgwiki
  http://wiki.bg.anl-external.org
※こちらで BlueGene/P用 Plan 9のソースコードが公開されてますが・・・

Plan 9ワークショップ:
4th International Workshop on Plan 9, October 21 - 23, 2009
  http://4e.iwp9.org/
5th International Workshop on Plan 9, October 11 - 13, 2010
  http://www.iwp9.org/

----------------------------------------
"Active storage with analytics capabilities on parallel I/O software stack"

参考プレプリント:
"Enabling Active Storage on Parallel I/O Software Stacks,"
 S. W. Son, et al., Preprint ANL/MCS-P1719-0110, January 2010.
  http://www.mcs.anl.gov/publications/paper_detail.php?id=973
  http://www.mcs.anl.gov/uploads/cels/papers/P1719A.pdf

----------------------------------------
"KittyHawk": Providing a Cloud Network Infrastructure on a Supercomputer

デモビデオ:
Building a Web Server Farm
  http://www.research.ibm.com/kittyhawk/movies/appdemo.mov
Building an Intranet
  http://www.research.ibm.com/kittyhawk/movies/fsdemo.mov
More than Appliances
  http://www.research.ibm.com/kittyhawk/movies/f8demo.mov
  http://www.research.ibm.com/kittyhawk/movies/primitives.mov

Open Source Kittyhawk
  http://kittyhawk.bu.edu/kittyhawk/Kittyhawk.html

少しは関連かも (HWが同じ位かなぁ)
[san-tech][02347] "On the Design of a Deep Computing Service Cloud", IBM Technical Report, (2010/05/07)

----------------------------------------
"Scalable fault tolerance for PGAS programming models"

Global Arrays (GA) toolkit
  http://www.emsl.pnl.gov/docs/global
Aggregate Remote Memory Copy Interface
  http://www.emsl.pnl.gov/docs/parsoft/armci/
[san-tech][02337] 講演資料:Global Arrays Technical Meeting, (2010/05/06, 07)

----------------------------------------
全体的に、システム安定化への研究の方向性が感じられます。

0 件のコメント:

コメントを投稿