[GGW3.2/GGH4.X-5.X] 限られたユーザーによる試験運用では,目立ったトラブルは発生しなかった.これから本番運用に入るが,この結果から大きなトラブルが発生しないと考えて良いか?
技術ノート
2017/04/07
[番号]
技術ノート KGTN 2017022801
[現象]
[GGW3.2/GGH4.X-5.X] 限られたユーザーによる試験運用では,目立ったトラブルは発生しなかった.これから本番運用に入るが,この結果から大きなトラブルが発生しないと考えて良いか?
[説明]
本番運用に入ると,GG (の機能) 以外の部分に存在する問題が顕在化し,その問題によって大きなトラブルが引き起こされることがあります.そのような事例を2件ご紹介します.
[不定期にGGサーバーの接続が切れる]
本番運用サーバーに入ってから,不定期にGGサーバーの接続が切れるという問題が発生しました.さまざまなチェックを行っても,さらにGGサーバー (マシン) を交換してもこの現象が続き,非常に大きな問題となりました.約半年後に分かった原因は,サーバールームの近くに大きなカラーコピーが2台設置されており,その2台のカラーコピーが同時に使われた時に電圧低下が発生し,それによってハブが不安定となり,GGの接続が切れるというものでした.ブラウザ (HTTP/HTTPS) では,セッションの接続と切断を繰り返しますので,ハブが不安定でも障害が目立ちませんが,GGやRDSでは常時セッションが接続されている必要がありますので,ハブが不安定だと接続が切断されることになります.
[不定期にGGサーバーのリソースが枯渇する]
本番運用サーバーに入ってから,不定期にGGサーバーのリソースが枯渇するという問題が発生しました.問題が発生した時点でのユーザーの利用状況を調べたところ,毎回あるユーザーが使用していることが判明しました.そこで,そのユーザーにヒアリングを行ったところ,巨大な Excel のシートを開いていることが分かりました.GGサーバーでは,多くのユーザーが同時にログオンしアプリケーションを使用しますので,1人のユーザーでも巨大なデータ処理等を行うとリソースの枯渇を招くことがあります.
このように,問題の原因がGG以外の部分に存在することも多く,そのような場合にGGに範囲を絞って調査を行うと,いつまでの原因が分からないという状況に陥ります.色々と調べても原因が特定できない場合は,可能な限り調査範囲を広げて,あらゆる可能性を考えてください.