Reprints from my posting to SAN-Tech Mailing List and ...

2011/06/09

[san-tech][02307] "Silent Corruptions", CERN, 2007

Date: Wed, 19 May 2010 12:17:16 +0900
--------------------------------------------------
少し古い資料ですが (ここで紹介したと思ってました):

"Silent Corruptions",
 KELEMEN Peter, CERN, June 1st, 2007
  http://fuji.web.cern.ch/fuji/talk/2007/kelemen-2007-C5-Silent_Corruptions.pdf

"Data integrity"
 Bernd Panzer-Steindel, CERN/IT
 Draft 1.3 8. April 2007
  http://indico.cern.ch/getFile.py/access?contribId=3&sessionId=0&resId=1&materialId=paper&confId=13797
※PDFファイルです

日本語 Blog:
"あなたのデータは既に壊れているかもしれない(Silent Data Corruption)"
 2009年7月27日, 私家版 ITプロフェッショナルの仕事術
  http://raven.air-nifty.com/night/2009/07/silent-data-cor.html



FIO Group, CERNの解説ページ:
Fsprobe Configuration and Use (31-Jan-2007, TimBell)
  https://twiki.cern.ch/twiki/bin/view/FIOgroup/DiskRefFsprobe
Problem handling for fsprobe (17-Nov-2008, TimBell)
  https://twiki.cern.ch/twiki/bin/view/FIOgroup/DiskPrbFsprobe
Disk Problem Analysis, FIO Group, CERN
  https://twiki.cern.ch/twiki/bin/view/FIOgroup/DiskPrb

多分このディレクトリがオリジナルだと思います:
Index of /fuji/fsprobe
  http://fuji.web.cern.ch/fuji/fsprobe/
  fsprobe-0.1-2.src.rpm              24-Jun-2007 21:16
  fsprobe-0.1-2.x86_64.rpm           24-Jun-2007 21:17
  fsprobe-0.1.tar.gz                 24-Jun-2007 21:18

見直すきっかけは
Third Workshop on Data Preservation and Long Term Analysis in HEP
 07-09 December 2009
  http://indico.cern.ch/conferenceOtherViews.py?view=standard&confId=70422
での
"State of the art for data storage", Tim Bell (CERN)
  http://indico.cern.ch/getFile.py/access?contribId=52&sessionId=13&resId=1&materialId=slides&confId=70422
↑PDF
  http://indico.cern.ch/getFile.py/access?contribId=37&sessionId=13&resId=0&materialId=slides&confId=70422
↑PPT
を眺めていたら最後に上記スライドがリンクされていました。
CERNでは定期的に fsprobeでチェックしているようです。

この発表で、以下には少しドッキリしました:
----------------------------------------
Tape Data Preservation (Page 9, 10)
  Data on tape is still at risk
    60 tapes last year where some data was lost
  However, over 90% of the data on those tapes could be recovered

Improving Tape Reliability (Page 11, 12)
  The most high risk operation is mounting/unmounting the tape
  9,000 mounts per day during peak activity over 120 drives
  60 tapes failed out of 2.6 million mounts reasonable reliability
----------------------------------------
これだけテープを物理 mount/umountしていれば障害はあり得るでしょうが、

関連研究グループ:
ICFA Study Group on Data Preservation and Long Term Analysis in High Energy Physics
  http://www.dphep.org/

0 件のコメント:

コメントを投稿