AWS

タグ:

#EKS

3件のアップデート

SageMaker2026年4月17日

Amazon SageMaker HyperPodが柔軟なインスタンスグループに対応

SageMaker HyperPodで、1つのインスタンスグループ内に複数のインスタンスタイプ・複数サブネットを指定できる「柔軟なインスタンスグループ」が追加された。従来はタイプ・AZごとに別グループで管理する必要があったが、優先順位付きリストで指定でき、高優先のタイプで確保できない場合は自動で下位にフォールバックする。

SageMaker2026年4月17日

Amazon SageMaker HyperPod のオンデマンド深度ヘルスチェック機能

Amazon SageMaker HyperPodが、Amazon EKSおよびSlurm構成のクラスタに対するオンデマンド深度ヘルスチェック機能をサポート開始しました。実行中のインスタンスのGPUアクセラレータのヘルスをいつでも事前に検証できるようになります。Slurm構成のクラスタではクラスタ作成時のノードプロビジョニング中に深度ヘルスチェックを実施することも可能です。

SageMaker2026年4月8日

Amazon SageMaker HyperPod、分散トレーニング向けギャングスケジューリングに対応

Amazon SageMaker HyperPodのタスクガバナンスにギャングスケジューリング機能が追加された。分散トレーニングジョブに必要なすべてのPodが準備完了してから訓練を開始することで、部分的なジョブ実行によるリソース浪費やデッドロックを防止する。EKSオーケストレーターベースのHyperPodクラスターで、15のAWSリージョンで利用可能。