Date: Wed, 19 May 2010 12:17:16 +0900
--------------------------------------------------
少し古い資料ですが (ここで紹介したと思ってました):
"Silent Corruptions",
KELEMEN Peter, CERN, June 1st, 2007
http://fuji.web.cern.ch/fuji/talk/2007/kelemen-2007-C5-Silent_Corruptions.pdf
"Data integrity"
Bernd Panzer-Steindel, CERN/IT
Draft 1.3 8. April 2007
http://indico.cern.ch/getFile.py/access?contribId=3&sessionId=0&resId=1&materialId=paper&confId=13797
※PDFファイルです
日本語 Blog:
"あなたのデータは既に壊れているかもしれない(Silent Data Corruption)"
2009年7月27日, 私家版 ITプロフェッショナルの仕事術
http://raven.air-nifty.com/night/2009/07/silent-data-cor.html
FIO Group, CERNの解説ページ:
Fsprobe Configuration and Use (31-Jan-2007, TimBell)
https://twiki.cern.ch/twiki/bin/view/FIOgroup/DiskRefFsprobe
Problem handling for fsprobe (17-Nov-2008, TimBell)
https://twiki.cern.ch/twiki/bin/view/FIOgroup/DiskPrbFsprobe
Disk Problem Analysis, FIO Group, CERN
https://twiki.cern.ch/twiki/bin/view/FIOgroup/DiskPrb
多分このディレクトリがオリジナルだと思います:
Index of /fuji/fsprobe
http://fuji.web.cern.ch/fuji/fsprobe/
fsprobe-0.1-2.src.rpm 24-Jun-2007 21:16
fsprobe-0.1-2.x86_64.rpm 24-Jun-2007 21:17
fsprobe-0.1.tar.gz 24-Jun-2007 21:18
見直すきっかけは
Third Workshop on Data Preservation and Long Term Analysis in HEP
07-09 December 2009
http://indico.cern.ch/conferenceOtherViews.py?view=standard&confId=70422
での
"State of the art for data storage", Tim Bell (CERN)
http://indico.cern.ch/getFile.py/access?contribId=52&sessionId=13&resId=1&materialId=slides&confId=70422
↑PDF
http://indico.cern.ch/getFile.py/access?contribId=37&sessionId=13&resId=0&materialId=slides&confId=70422
↑PPT
を眺めていたら最後に上記スライドがリンクされていました。
CERNでは定期的に fsprobeでチェックしているようです。
この発表で、以下には少しドッキリしました:
----------------------------------------
Tape Data Preservation (Page 9, 10)
Data on tape is still at risk
60 tapes last year where some data was lost
However, over 90% of the data on those tapes could be recovered
Improving Tape Reliability (Page 11, 12)
The most high risk operation is mounting/unmounting the tape
9,000 mounts per day during peak activity over 120 drives
60 tapes failed out of 2.6 million mounts reasonable reliability
----------------------------------------
これだけテープを物理 mount/umountしていれば障害はあり得るでしょうが、
関連研究グループ:
ICFA Study Group on Data Preservation and Long Term Analysis in High Energy Physics
http://www.dphep.org/
0 件のコメント:
コメントを投稿