株式会社 日立製作所 マネージド&プラットフォームサービス事業部 酒井宏昌/檜垣誠一/岡部大輔
2023年6月に提供を開始した、日立のクラウド運用改善サービスHARC(Hitachi Application Reliability Centers ハルク)。すでに40社を超える企業にお声がけをいただいているこのサービスについて、キーマンである株式会社 日立製作所 マネージド&プラットフォームサービス事業部の酒井宏昌、檜垣誠一、岡部大輔の3名に話を聞いた。第3回は、お客さまの運用改善に伴走するマネジメントサービスについて。

「第1回:運用改善サービス『HARC』の誕生」はこちら>
「第2回:クラウド運用の健康診断」はこちら>
「第3回:運用の成熟度は、運用者の成熟度」
「第4回:HARCのカスタマージャーニー」はこちら>
「第5回:HARC活用事例:オリックス銀行」はこちら>

運用と開発の一体化

――マチュリティ・アセスメントサービスで改善点を抽出した後は、SRE(※)マネジメントサービスという伴走のフェーズに入るということですが、具体的に何をしていくことになるのでしょう。

岡部
マチュリティ・アセスメントサービスでは、例えばこのアーキテクチャーはこの様な問題があるので、こう改善をした方がいいですといった30~50項目の改善提案を提示します。お客さまがどこから始めたらいいのかわからない時には、オブザーバビリティ(可観測性)から始めることをおすすめします。なぜかというと、自分の状態が見えていないと改善も効果も見えないからです。改善提案内容を元にマイルストーンを提案させていただき、お客さまに納得いただければ、改善計画を立てて実行フェーズに入ります。
※ Site Reliability Engineering:開発チームと運用チームが連携し、迅速にシステムの改善を実現するとともに、システムの信頼性を向上させるための方法論。

改善ではお客さまの運用部門と必要に応じて開発部門、そして私たち日立のクラウドエンジニアが「ポッド」と呼ばれるひとつのチームを組み、アジャイル開発で進めていきます。改善のストーリーを考えて、それをスプリント(※)でひとつずつ形にし、成果として確認をとりながら進めていくという方法です。お客さまから新しい要望が出てきた場合でも、取り入れたいものはストーリーを修正しながら柔軟に取り入れていきます。
※ スプリント:アジャイル開発の代表的なフレームワークである「スクラム」の基準となる考え方で、プロジェクトを項目ごとに分けて小単位に区切った期間。

岡部大輔

最初は私たちもクラウド運用の専門家としてフルに伴走しますが、お客さまがクラウド運用の知識や経験を身に付け、ポッドをまとめられるようになれば、私たちは徐々に伴走の比率を下げてサポートに徹するようにします。お客さまが自分たちでストーリーを立て、ポッドを回しながら運用改善できるようになることが理想的なゴールです。

――運用部門と開発部門が一体で取り組む理由は何ですか。

岡部
SREにおいては、自動化できるところは自動化していくことが原則であり、そのためにソフトウェア開発が必要です。それを運用部門が実施する場合もありますが、開発部門が取り組む方が自然です。それだけでなく、新機能の開発と信頼性の向上を同時に実現するためには、本来運用部門と開発部門の情報共有は必須なはずなのです。ところが日本の場合には開発部門と運用部門の間に垣根があって、開発が終わったら運用部門に任せるという関係性になっていることが多いので、できるだけシームレスになるような基準を作っていきましょうという話をしています。

酒井
マネジメントサービスを通してお客さまのクラウド運用の成熟度が上がっていくということは、ポッドで改善に取り組むメンバーの成熟度が上がるということでもあります。SREやクラウド運用に精通したトップエンジニアと一緒に課題と取り組むことで、自然にナレッジが身に付くわけです。例えばレガシーなオンプレミスの運用しか知らなかった方でも、自然とクラウドという新しい環境に適応できるようになります。また、開発部門と運用部門の垣根を乗り越え、運用部門の意識改革にもつながります。

目的は運用改善であって、数字ではない

――マネジメントサービスでは、例えばクラウド運用で問われるコストや可用性などで数値目標を立てて取り組まれるのですか。

檜垣
確かに海外の事例では、「可用性が99%に向上」とか「クラウドコストを30%削減」という数字を紹介しているケースもあります。ただ、それは運用改善に取り組んだ結果であって、目的ではありません。HARCでは、コストや効果など定量的なKPIを目的にはしません。課題を解決しながら運用を改善していく過程で、セキュリティレベルは上がりコストは下がってきますが、数字を目的にはしていないのです。

檜垣誠一

岡部
例えば、インシデントが月10万件発生し、ユーザーの満足度が低い状態において、削減する目標値を決めて対策するといったことは改善のプロセスで行うため、トイル(※)をどれくらい削減した、工数をどれだけ削減した、自動化率がどれくらい上がった、といった数値を出すことはできます。しかしそれは、改善により運用の成熟度が上がった結果です。お客さまにはそこをご理解いただいた上で、一緒にどんどんトライして、失敗するなら早く失敗してより良い解決策を見つけましょうというお話をさせていただいています。
※ トイル(toil):サービスの提供に欠かせない作業の中で、自動化が可能であるにも関わらず手作業で行われているもの。

檜垣
いきなり全体的なことに取り組むのではなく、スモールスタートで小さな成功体験を作り、信頼を積み重ねていくことが大切なのです。

酒井
マネジメントサービスは、長期契約よりも、「まずは3カ月やりましょう」とか、「半年やってみて考えましょう」といったアプローチが多いです。(第4回へつづく

あなたの知らないクラウド運用へ Hitachi Application Reliability Centers (HARC)

「第4回:HARCのカスタマージャーニー」はこちら>

酒井宏昌(さかい ひろまさ)
株式会社 日立製作所 マネージド&プラットフォームサービス事業部 クラウドマネージドサービス本部 クラウド&デジタルマネージドサービス部 担当部長
1989年、日立製作所に入社。通信・ネットワーク機器、ストレージ・サーバ等の海外への拡販や新規事業推進に従事。2016年からデータ利活用を可能にするプラットフォーム「Pentaho」の拡販・営業支援を経験したのち、2022年より現職。

檜垣誠一(ひがき せいいち)
株式会社 日立製作所 マネージド&プラットフォームサービス事業部 クラウドマネージドサービス本部 クラウド&デジタルマネージドサービス部 担当部長 兼 HARCグローバルビジネス推進センタ センタ長
1993年、日立製作所に入社。ストレージ等のIT製品事業の海外展開に従事。2015年からHitachi Vantaraの米国本社に出向し海外での業務に従事後、2022年より現職。

岡部大輔(おかべ だいすけ)
株式会社 日立製作所 マネージド&プラットフォームサービス事業部 クラウドマネージドサービス本部 クラウド&デジタルマネージドサービス部 担当部長
1996年、日立製作所に入社。通信システムの設計・開発に従事。2018年からLSH(Lumada Solution Hub)ポータルやクラウド向けデジタルソリューションの開発を経験したのち、2022年より現職。