Amazon SageMaker HyperPodが柔軟なインスタンスグループに対応
Amazon SageMaker HyperPod now supports flexible instance groups
概要
SageMaker HyperPodで、1つのインスタンスグループ内に複数のインスタンスタイプ・複数サブネットを指定できる「柔軟なインスタンスグループ」が追加された。従来はタイプ・AZごとに別グループで管理する必要があったが、優先順位付きリストで指定でき、高優先のタイプで確保できない場合は自動で下位にフォールバックする。
何が変わったか
- ・単一インスタンスグループで複数インスタンスタイプ・複数サブネットを指定可能に
- ・InstanceRequirements パラメータで優先順位付きリストを設定し、キャパシティ不足時は自動フォールバック
- ・Karpenterによる自動スケーリングと統合し、最適なタイプ・AZの自動選択に対応
- ・CreateCluster / UpdateCluster API・AWS CLI・マネジメントコンソールから利用可能
影響
既存クラスタへの強制移行はなく、新しい柔軟なインスタンスグループを選択的に作成可能。EKSオーケストレーター構成のクラスタのみが対象。
対象ユーザー
SageMaker HyperPod(EKS構成)で大規模な学習・推論ワークロードを運用するMLエンジニア・プラットフォームエンジニア
まとめ
SageMaker HyperPodに柔軟なインスタンスグループが追加され、複数インスタンスタイプ・サブネットを1グループで管理できるようになった。
原文タイトル
Amazon SageMaker HyperPod now supports flexible instance groups
AWS公式アナウンスを読む →