
■ インターネット接続障害
数年前までは会社でインターネットが使えないなんてことも珍しくなかったのですが、ここ数年は接続出来るのが当たり前になってしまいました。
それが出来るだけの社会的なインフラが整ったってことなので、それ自体は良い事だとは思うのですが、それが当たり前になってしまうと使えなくなった時の被害が大きくて、システムを預かる身としては辛い所です。
有力なメーカは、インターネットを前提としたシステムを構築していて、「請求書はこのシステムに入力しろ」「発注はこのシステムで入力しろ」「見積もりは・・・」・・・勘弁して欲しいですよ。
なんて状況なのに、インターネットが使えなくなりました。
■ 環境
勤め先のネット接続環境は、かなりシンプル。インターネットに抜けるのはIDCに引いてある回線のみで、そこからプロキシサーバーとWEBフィルタリングサーバーを経由してインターネットに接続しています。
昔は各拠点で回線を引いて使っていたりもしたのですが、コストもかかるし(従量制の回線なのに接続したまま外出、結果として月の請求は10万越えとか)、妙なサイトに接続する不届きものもいたり(そして、ウィルス感染)するし、洒落になっていなかったので集約したのです。
■ 原因の切り分け
とりあえず、障害発生点を調べない事には始まりません。
障害を報告してくれたユーザーのパソコンを見ると、設定(IEのプロキシサーバーの接続先)は問題ないし、他の通信(メールなど)は通ります。そこで、他の端末からも接続して見たのですが、同じくネットに接続出来ません。

ふーむ、試しにWEBフィルタリングサーバーを経由せずに直接プロキシサーバーに接続しても現象は変わらない。続けて、プロキシサーバーすらも無視して直接インターネットに抜けてやると(緊急用に特定の端末からは直接抜けられるようにしていた)、これは接続出来ました。
原因は、プロキシサーバーですね。
■ ヘルプミー!
プロキシサーバーには通信(Ping)も通るし、telnetで接続する事も出来たのでサーバー自体は生きているようです。
実はこの時点でお手上げです。私の担当は基幹系システムで、この手の情報系システムは他の人の担当です。そして、発生した時間帯が夜(就業時間後)で、連休前ということもあり皆さんお帰りでした。さらに悪い事に、他のメンバーは資料をきちんと残してくれるような人達ではないので、調査したくても環境が全く分かりません。
という事で、ベンダーに電話をして助けを乞いました。・・・担当外の分野とは言え、手も足も出ないってのは屈辱ですね。
■ 結論
最初は電話越しに教えて貰った方法(コマンド)で色々とやったのですが、何らかの原因でサービスが上がらない状態と言うことが分かっただけ。結局はベンダーの担当者の方が来て調べてくれたのですが、ログが設計時の想定容量を越えてしまった事が原因だったそうです。
肥大したログを削除して、ログの保持期間を短くしてもらって対応完了です。
■ 後書き
このログの話、ベンダーによるとプロキシサーバーの設計時の打ち合わせの結果だそうです。
今回の事例でもそうですが、ベンダーに任せっぱなしにすると自社に何も情報が残っていないという状態になってしまいます。まともなベンダーなら、お願いすれば良い感じに仕事はしてくれるのですが、障害の発生時にベンダーに頼らないと何も出来ないというのは問題です。自社でシステム部門を抱えていないのであれば仕方の無い話ではありますが、システム部門があるのにこれではねぇ。
さて、それはそれとして私も仕事があるから残業していたのですが、この騒動で何も出来ていません。
・・・この仕事、どうしようかな。
投稿記事の一覧:http://harikofu.web.fc2.com/
--- blog end ---
スポンサードリンク


