[Q]
AVD利用時にセッションホストにアクセスできなくなった場合、ハートビートを監視し、ハートビートが途絶えたときにアラートメールを送信、自動再起動する手順を構築することは可能でしょうか
[A]
まず、ハートビートを監視し、ハートビートが検出されなくなった場合にアラートメールを送信することはAzure MonitorでVM insightsによる仮想マシン監視を有効にすることで設定が可能です。
設定方法に関しては以下URLを参照ください。
<公開情報>
Title:チュートリアル: Azure 仮想マシンが利用不可状態になったときのアラートを作成する
URL:https://docs.microsoft.com/ja-jp/azure/azure-monitor/vm/tutorial-monitor-vm-alert
一方ハートビートが途絶えたときに特定の仮想マシンを自動で再起動する方法としては、何かが起こった場合 (今回ですと Heartbeat が途絶えたり、正常性に問題がある場合) を指定することは難しいですが、Azure Automation を活用して仮想マシンを特定の時間に自動で起動もしくは停止、あるいは再起動を行うような構成は可能です。
そのため、お客様のご要望に適うサービスではないかと存じますが、以下に仮想マシンの自動起動・停止処理を行う Start/Stop VMs during off-hours ソリューションの公開情報をご案内させていただきます。
<公開情報>
タイトル : Start/Stop VMs during off-hours の概要
アドレス : https://docs.microsoft.com/ja-jp/azure/automation/automation-solution-vm-management
また、補足情報としまして、以下に Azure の問題によって生じた仮想マシンへの影響を監視するサービスについてご説明させていただきます。
---
Resource Health (リソース正常性) で仮想マシンの正常性を監視する
---
Heartbeat が途絶える場合は仮想マシンやエージェントに何かしらの問題が起きている可能性がある一方で、ネットワークの影響で正しく動作しないこともございます。
性質は異なるサービスですが、仮想マシンが正常に動作しているかどうかを監視する方法として、Resource Health (リソース正常性) というサービスがございます。
こちらはリソースが正常であるかどうかを評価し、視覚化するサービスでございます。
また、アクティビティ ログを用いてアラート ルールを作成することも可能です。
Azure ポータルでは各リソースの状態を以下の手順でご確認いただけます。
<確認方法>
1 . Azure ポータルからモニターを選択します。
2 . 左側のメニューから "Service Health" を選択します。
3 . 左側のメニューから ”リソース正常性” を選択します。
また、アラート ルールは以下の公開情報に記載がございますので、もしよろしければご一読ください。
<公開情報>
Title : Azure portal を使用してリソースの正常性アラートを構成する
URL : https://docs.microsoft.com/ja-jp/azure/service-health/resource-health-alert-monitor-guide#resource-health-alert-using-azure-portal
以上の監視を活用することで早期の発見につなげ、ご状況に応じてご対応いただけますと幸いでございます。
[更新日]
Update:202202