備えよ常に
「備えよ常に」
ボーイスカウト経験者は良く知っている言葉だろう。私はボーイスカウトに参加した経験は無いが、高校生の頃この言葉に触れることができた。この忘却の彼方にあった言葉が言わんとするところが、今ごろになって身に染みることになろうとは、当時想像だにしなかった。
先週は散々だった。その週の月曜日に加速器の制御に使っているPCが立ち上がらなくなっていた。この週の運転に必須のPCではなかったので、時間が空いたときに復旧させようと油断していた。ここから全ては始まっていた。
火曜の朝、出勤し制御室に入ったときに異音に気づいた。偏向電磁石という電子ビームを曲げるための電磁石に流す電流を生み出す電源の制御に使用しているPC-98が悲鳴をあげていた。これは私がこの研究室に配属されて以来、弱点だったところだ。配属されてもう7〜8年経つがずっと放置していた。いつかはこうなることがわかっていたが、この日が訪れるとは。こんなこともあろうかと捨てずに残しておいたPC-98で復旧を試みたが全滅。よってこの一週間、DOS/V機に移行すべく、ハードウェアの調達、ソフトウェアの書き直し等に時間をとられることとなった。
今回の教訓は、バックアップ用のハードウェアを用意していたとしても、動作確認をしていなければ、それはバックアップにならないということだ。また、想定されるトラブルに対して常に準備をしていなければならない。うちの加速器は止められない加速器になりつつある。止まらないのがあたりまえのシステムの維持がどれだけ大変か、その片鱗を垣間見た気がする。
Categories
diary0 TrackBacks
Listed below are links to blogs that reference this entry: 備えよ常に.
TrackBack URL for this entry: http://www.argv.org/~chome/blog/mt-tb.cgi/46


機械が古いのもどうかと思うんだけど…。
えーっと難しいのは、システムを維持するという立場からいうと、新しければ問答無用でOKというわけではないことかな。長期間安定して動いているシステムは、よっぽどの理由がない限り触りたくない。いらんこついじって、実績のあるシステムを破壊したくないからね。たとえばスペースシャトルの姿勢制御システムがなかなか更新されないのは、そのため。
なので止められないシステムには必ずバックアップがある。平時にちゃんと動作するバックアップを用意し、いざというときにすぐ交換できるよう訓練しておく必要があった。にもかかわらず、10年近く放置していた。いつか壊れるのはわかっていたのにね。で、今回ちゃんとそのツケを払わされたという話。
特にPC-98の信頼性はすごく高くて、現在でも工場なんかでは現役だったりする。間違っても、年間8000時間以上のuptimeで電解コンデンサが膨らんでマザボが壊れるなんてことはない。この信頼性の高さに油断していたのが今回の敗因。