運用じゃない人にわかって欲しい運用の話

sunnyと申します。サーバ運用監視チームの運用をやっています。糖質制限ダイエットで3キロ痩せました。9年程サーバ運用に携わっていますが、運用を業務にしている人とそうでない人のギャップみたいなものを感じることがあるので、それについて書きたいと思います。

運用ってなに

運用、運用って言ってますが定義をしないとよくわかりません。本記事で扱う”運用”は弊社フルマネージドホスティングサービス(以下FMH)のシフト業務を指します。で、そもそもFMHって何という方に関しては、こちら を参照頂ければと思います。かいつまんで言うと 24時間365日サーバを守る仕事です。FMHの主な特徴としてはお預かりしているお客様のサーバの rootアカウント(管理者権限) を弊社で保有してサーバ内で起こりうる全ての事柄に対してサポートをさせて頂くところです。サービス開始当初は「お客様がシステム管理者を採用する必要はありません」といったようなコピーがあった気がします。今となっては他社様でも同様のサービスがあるようですが、事業立ち上げ当初は「ホスティング会社がrootを保有するなんて」というセンセーショナルなサービスだったようです。

そんなFMHですが常に5名前後の運用チーム(自社インフラエンジニア)と協力会社様2〜3名が常駐することで業務を回しております。主な仕事としては以下のものがあります。

  • 監視システムによるサーバ監視
  • サーバ不具合/障害の対応
  • お客様からのメール/電話でのご相談対応
  • アプリケーションの導入/チューニング

これらの業務を24/365で遂行することを”運用”と定義します。

運用は止まれない

今は若干現場を離れていますが、この運用を7年間やっていました。少なくとも私が入社してから今の今まで対応する人間が居ない時間は存在していません。1秒たりともです。常に誰かしらのエンジニアが数千に及ぶサーバで発生しうる障害や、多数のお客様の要望に対応するために構えているわけです。なぜそうする必要があるかというと、もちろんサーバの障害はいつ発生するかわからないですし、お客様の希望に常に応える必要があるためです。

ハードウェアの故障はもちろんのこと、お客様が誤って削除してしまったDBデータの復旧、予期せぬアクセス過多、発見される脆弱性。耐障害性を考慮した環境構築や防止策なども日々適用してはいますが、それでも障害は発生します。何が起こるかを予測することは可能ですが、100%予測することは不可能です。FMHではインターネットが今日も動き続けている以上、運用は止まることはできません。運用が止まるときはコンビニエンスストアがシャッターを下ろすときと同じ、つまりサービスが終了するときです。裏をかえせば運用に携わるスタッフが居なくなるとサービスが終了します。そのためインフルエンザなどの感染症が運用チームで流行してしまう=サービス継続の危機となるため、冬場は加湿を行うなどオフィス環境の整備も充実させなくてはなりません。

運用の責任は成果でなく時間

(※これから述べる事柄は障害やご要望に対処できるフローや手順といった業務環境、またある程度の障害予測が出来ている上、さらに相応の技術力をスタッフが有していることが前提です。)
前述のとおり運用は止まれません。私はこのような運用に従事するスタッフの責任は”時間”にあると考えています。プログラマのように何かを開発したりですとか、営業のように売上の数字をあげることではなく、運用スタッフはただデスクに座って目に見えない何かに備えることこそが、仕事の責任であるということです。これが今回私のもっとも伝えたかった”運用じゃない人にわかって欲しい運用の話”になります。

FMHの運用チームは基本的にMTGがありません。ありませんと言いますか、出来ないというのが正しいのです。また時折、運用じゃない人がなんとなしに運用チームのスタッフに「ちょっと時間ありますか」と仕事か何かの依頼をしようと話かけて「無いです」と一蹴される場面を見ますが、その時間にそこに居て備えることが責務なので当然といえば当然なのです。時間をとられてはならないのです。そのため運用に関わる周知事項や課題などは私の所属する”運用チームの運用チーム”が取りまとめて、他の部署と連携を取るように基本的にはなっていたり、後からでもサッと見られるようなslack等のテキストコミュニケーションを活用しています。

少し極端に書いたかもしれませんが、運用とはこのような仕事であると運用じゃない人にご理解頂ければ幸いです。

運用のやりがい

ここまでの話だと運用がとてもストイックと感じられてしまいそうなので、運用のやりがいについて述べさせて締めたいと思います。FMHのサービスは前述のとおり、お客様のサーバのrootアカウントを弊社で保有させて頂いているため、ホスティングさせて頂いている当社側のサーバー管理権限の制約が全くありません。そのため、調査できる範囲もお客様のサーバの全体となっています。そんな環境だからこそ、やっかいな障害や難しいご要望に対して、最適な対応方法を少ない時間の中で頭の中で描けた瞬間と、またそれがうまくハマった時にエンジニアとしてのやりがいを感じることができるのです。もちろんチームで動いていますので、1人でどうしようも無くなった際もエンジニア同士で相談しあって問題を解決した場合は、また違ったやりがいを感じることもあります。

NHNテコラスでは一緒にプロフェッショナルな運用をめざせる、インフラエンジニアを募集しております!
注) 時期によっては募集していないこともあります。

AWS利用料$100ドル無料

あなたにおすすめの記事