「人が見守ることで信頼を提供する」24時間365日安心できるシステム運用を支えるエンジニアの仕事とは

2022.12.28 13:00
スピードと柔軟性が求められる現代のビジネスにおいて、クラウドサービスの利用率は年々増加している。サーバのクラウド化によって、ハードウェアの監視こそ不要になったものの、システムの安定稼働には監視・運用が欠かせない。そこで活躍するのが運用を担当するエンジニアたちだ。24時間365日、お客さまのサーバ、そしてシステムを見守り続けている。彼らが普段どんな業務を行なっているのか、どんな苦労があるのか。このストーリーでは、株式会社リンクのサポート部で働く栄東逹也、仲田和馬に話を聞いた。(LINK Watch!編集部)
24時間365日、チームで取り組む
栄東は、「ベアサポート」というシステム監視サービスを担当している。ビジネスに不可欠なITシステムだが、何かしらの障害は、必ず起きる。システムを安定して稼働させるためには、障害が発生したらすぐに検知し、対処しなければいけない。サーバを監視し、エラーを示すアラートを検知したら速やかにお客さまに連絡すると共に、事前にお客さまと取り決めた復旧対応をするというのがメインの業務だ。


「分かりやすい例で言うと、お客さまのWebサイトにシステムエラーが発生したとします。するとアラートが通知されるので、それを手順書に沿って復旧させ、Webサイトが問題なく表示されるようにするのが仕事です。どのタイミングでアラートが出るのかは基本的に予測がつかないため、いつアラートが出てもすぐに対応できるように、24時間365日サポート部のメンバーがお客さまのシステムを監視しています。」


栄東によると、24時間365日システムを見守り安定稼働させることはたやすいことではない。

「お客さまに安心を届けるためにはアラートを見逃すわけにはいきませんから。朝番と夜番の2交代制で、常にサポート部のメンバーが貼り付いて監視しています。たしかに大変といえば大変ですね(笑)。ただ、以前は会社に出社しての作業だったのですが、コロナ禍で基本的に在宅ワークになったのでずいぶん楽になりました。」(栄東)

同チームでは、在宅ワーク中でも作業しているメンバーとは、Zoomのような会議システムで常時つなげ、常にコミュニケーションを取っている。

「一人ではなく、常に複数で監視しているので何かあったときに相談できるというのは心強いですね。また、病気で休んでしまうと誰かがカバーしなくてはいけないので、普段から体調管理も気にするようにしています。僕と栄東さんが急に休んだことってほとんどないですよね。たぶん二人とも体が丈夫なだけですけど(笑)。」(仲田)
サポート業務は、お客さまに安心を届ける仕事だ
影響範囲が大きく、責任の大きい仕事である監視・運用・保守を行うサポート業務。なぜ、同職を選択したのだろうか。

「大学で情報系の勉強をしていたのですが、最初はITとは全く関係のない会社に就職しました。でも、やっぱり情報系の仕事に就きたいと思うようになって、転職をしたのがグループ内のパソコンやプリンターの保守をする会社だったんです。そこで保守という仕事に興味を持つようになりました。ハードウェアよりもシステムの方に興味があったのでさらに調べたところ、システムの運用・保守・監視をする専門にするMSP(マネージドサービスプロバイダ※)という業界があることを知りました。システムを正常に運用するためにサポートはなくてはならないものですし、何よりお客さまに安心を届ける仕事だと感じて、5年ほど前にMSPの業界に飛び込みました。それからずっとサポートをやっています。」(仲田)

※サーバやネットワークなどのITインフラやシステムの監視・運用・保守などの管理業務全般を代行する事業者

プログラマーを経て現在の職種についた栄東は、運用業務にやりがいを感じていた。

「最初、プログラマーとして開発をしていまして、アプリだったり、セカンドライフという今でいうメタバースのような仮想空間に企業の広告を載せる仕事をしていました。それからシステムを構築するシステムエンジニアを経て、サポートを担当するようになりました。開発の仕事というのは、基本的にはつくって終わりです。ただ自分がつくったものを安定して稼働させるには、しっかり監視して運用する必要があります。開発をしながらも、その後の運用の部分にもいつかは関わりたいとずっと思っていました。アラートが鳴るとやっぱりドキっとしますし、プレッシャーも感じます。その分復旧できたときの喜びは大きいですし、何よりもお客さまからお礼を言われると、次もがんばろうと疲れも吹き飛びます。」(栄東)
(監視作業中のサポート部がログインしている会議画面。24時間、365日お客さまのサーバを見守り続ける)
人が見守ることで信頼を提供する
サーバの監視を行う際に、監視ツールを活用する会社が多い。しかし、「ベアサポート」では人が監視をしている。その理由を仲田が説明する。

「『ベアサポート』でももちろん監視ツールを使って、自動化できるところは自動化しています。ただ、アラートを検知したからといって、それが本当に障害なのかどうなのかは人じゃないと判断できません。サービスに影響がないのにアラートが出ることもあります。そういう無駄なアラートを減らすために、お客さまと調整して最適な設定を提案して、不要なアラートは減らすのも我々の仕事です。」(仲田)

根本的な問題点を発見するためには、お客様との会話が重要になる。

「自動化だけでは対応できない部分はまだまだあります。お客さんとの会話のなかで、困っていることを聞き出して、新しい問題点を見つけることもあります。会話をしないとお客さまが困っていることを本当に解決することは難しいです。」(栄東)

監視ツールに頼りきらず、最終的に人が監視することで、柔軟な対応を可能にしていると、仲田は続けた。

「担当のお客さまも全員がエンジニアではないので、どんな方にでも分かるように伝える能力も求められます。あとは同じアラートでも状況が違う場合もあるので、そこはしっかりと判断して柔軟に対応していかないといけない。これができるのも人が監視しているからこその強みだと思います。」(仲田)

監視ツールを使いながらも、人が監視をすることで、システムの安定稼働を実現している同チーム。しかし、システム障害が起こってしまうこともある。システム障害が発生したときに心掛けているそうだ。

「サポート部全体として、まずはお客さまに障害の状況を迅速に知らせるように心掛けています。もちろん復旧対応に取りかかるのですが、復旧対応をしている間にも、お客さまの方で何かできることがあるかもしれません。そのためにもまずはお客さまに知らせることが大事だと思っています。」(栄東)

「お客さまとしても、その先のエンドユーザーさんに報告しなければいけないケースもあるので、とにかくいち早く情報を知らせることはやっぱり大切ですよね。あとは復旧作業では焦らず、正確に手順どおりに対応するのがマストです。障害が発生すると早く復旧しなくてはと急いでしまうのですが、しっかりとチェックすべきところは一人ではなく二人以上で多重チェックすることで間違いを防ぐようにルールとして決めています。」(仲田)
臨機応変な対応の実現のため、24時間365日体制で監視をしている同チーム。これまで様々な復旧作業をしてきた。ケースによっては対応が難しいケースもあるという。

「基本的には決められた復旧手順があるので、手に負えないということはありません。ただ、アプリが原因だと、アプリがどうつくられているのか把握していないと対応が難しい場合があります。とはいってもどこでエラーが起きているのかを明らかにするためには切り分けが重要なので、調べられるところは全部調べて、ハードウェア・OS・ミドルウェアも異常がないので、おそらくアプリが原因になっているというように、こちらの考えをお客さまにお伝えするようにしています。」(仲田)

事前の学習も大切になるという。

「どんな事態が起きても対応できるように、普段からいろいろな知識を勉強しておくことも大切です。「ベアサポート」をご利用いただいているお客さまは、リンクが提供している「ベアメタルクラウド」のサーバを利用している方だけではなく、AWSを使っているけれど、監視だけ我々に任せてくださっている方もいらっしゃいます。「ベアメタルクラウド」もAWSもどんどんバージョンアップするので、我々の知識もそれに合わせてバージョンアップしていかないといけない。そこは大変なところでもあるし、新しい技術に触れることができるという意味では、エンジニアにとっては楽しみな部分でもあります。」(栄東)

「やっぱり監視運用という重要な部分を任せていただいているので、これで十分ということはありません。お客さまに安心して仕事を任せられると思ってもらえるように、もっとスキルを上げていきたいですよね。」(仲田)
運用の負担を軽減することでメイン事業に集中してほしい
昔、プログラマーとして開発を行っていた栄東は、自身の過去を振り返り、開発と運用を行う大変さについて語った。


「私が開発をしていた頃は『ベアサポート』のようなサービスがあると知らなかったので、開発もしながらシステムの運用も任されていました。アラートが出たら、たとえ夜中でも対応しなければならないので本当に大変でした。」(栄東)

「そうなんですよね。実は開発担当者が運用も任されているケースが本当に多いんです。エンジニアではない人からすると近く見えるかもしれませんが、開発と監視運用はまったく分野が違うので、両方のスキルを持っている人はほとんどいません。今、すごく苦労されている開発担当者がたくさんいると思うので、そこは我々に頼っていただけると嬉しいですよね。」(仲田)

「それぞれ得意分野は違うので、監視運用の部分は私達に任せてもらって、開発担当者は開発に専念してもらうことが、企業にとっても一番のメリットになると思います。私も開発のときに「ベアサポート」があったら、絶対に利用していたと思います。」(栄東)

最後に、本インタビューを読んで「ベアサポート」に興味を持った方へメッセージを語ってもらった。

「安定してシステムを運用していく上では監視・障害対応というのは不可欠なものだと思っています。私たちのサポートは400社以上のサーバ、システム運用でご利用いただいている実績のあるサービスですので、ぜひ、安心してお任せください。」(栄東)

「システムの監視といっても、何が必要なのか、どれくらい費用がかかるのか分からないという方も多いと思います。20年以上にわたりホスティング事業を行ってきたリンクには、これまでのノウハウがありますので、ご要望に合わせたご提案をさせていただきます。まずは気軽にご相談いただければ嬉しいです。」(仲田)

あわせて読みたい

人と人との関わりを大切に。「一緒に働きたい」と思われるマネジメントをめざして
talentbook
業務改善で次代にバトンをつなぐ スーパーカクテルの導入事例を公開しました
PR TIMES
「Q SKIP」で楽しむ!東急沿線1日お散歩旅
antenna
【ShirofuneのEC関連新機能】GA4の「データドリブンアトリビューションモデル」でECサイト注文データを評価し算出したLTV/CPOによる広告運用の自動最適化が可能に
PR TIMES
【独自】プッチンプリン出荷停止の「主犯」はデロイト!グリコのシステム刷新で1年遅延の末に障害発生“ボロボロ案件”の実態 - コンサル大解剖
ダイヤモンド・オンライン
【星のや京都】蛍の光に想いを馳せる「奥嵐山の蛍狩り」開催
PR TIMES Topics
現場と経営をつなぐ新たなソリューション開発への挑戦。保守サービスを起点に業務運営の省力化に挑んだストーリー
PR TIMES STORY
シャープとNTTデータがキャッシュレス決済分野で協業開始
PR TIMES
防災とアートを掛け合わせた画期的なインテリアアート「sonae 備絵」Limited Boutique開催
PR TIMES Topics
阿蘇くまもと空港に「ugo Pro」を納入
PR TIMES
エリア最大級&24時間営業の「HATA-LARK」がいいオフィスの省人化パッケージを導入
PR TIMES
南高梅と観音山フルーツパーラーのアフタヌーンティーが楽しめるロンドンバスツアー
PR TIMES Topics
女性PMとしてシステム開発の第一線に立つ。人に寄り添い成長を続けるエンジニアとしての歩み
talentbook
【 観光ベンチャー企業 】地方創生に取り組む、株式会社ダイブ|リクルートサイト全面リニューアルを実施
PR TIMES
メディカルハーブブランド「MORAZ」から母の日期間限定コラボセット販売
PR TIMES Topics
ugoとパナソニックEW社、“ロボットとビルOSによるオフィス向けサービス” を共創提案
PR TIMES
無人決済店舗システム「TTG-SENSE」を「北海道警察学校」に導入
PR TIMES
アートのような日本製ジュエリーブランドから新作ジュエリー発売
PR TIMES Topics
インフォマート、フード業界における飲食店ユーザーのDX推進を目指し、「飲食店DXを前へ 私たちの誓い」を発表!
PR TIMES
AI画像認識を利用し、「工場の見える化」を実現!エレコムグループのカメラソリューションと、あわせてご提案する『A-Eye(エーアイ)カメラ』の取り扱いを開始
PR TIMES
期間限定キャンペーン! カンデオホテルズが誇る「スカイスパ」をお得に楽しもう
antenna