Amazon SageMaker HyperPodが制限付きインスタンスグループの包括的な可観測性を提供
Amazon SageMaker HyperPodが、Restricted Instance Groupsの監視機能を大幅に強化し、GPU利用率やNVLink帯域幅、CPU負荷、FSx for Lustre使用状況、Podライフサイクルなどを単一のAmazon Managed Grafanaダッシュボードで一元監視できるようになりました。トレーニングログも自動的に利用可能になり、新規クラスタ作成時に自動有効化されるため、導入の手間が最小限に抑えられます。これにより、複数のインフラリソースにわたるメトリクスの手動収集が不要になり、Foundation Modelのトレーニング時に計算リソースと学習ワークロードの可視性が大幅に向上します。
Amazon SageMaker Unified Studioがサードパーティカタログとのメタデータ同期機能を追加
Amazon SageMaker Unified StudioがAtlan、Collibra、Alationなどのサードパーティカタログとのメタデータ同期機能を新たに追加しました。この機能により、SageMaker CatalogとこれらのパートナープラットフォームおよびAIアセットのメタデータが自動的に同期され、チームは使用するツールに関わらず一貫したデータビューを保つことができます。複数プラットフォーム間でのメタデータ管理が効率化されることで、手動での調整が不要になり、組織全体でデータ資産の情報を統一してデータガバナンスを向上させることができます。
Amazon SageMaker Unified Studioがデータ処理ジョブでAWS Glue 5.1をサポート
Amazon SageMaker Unified StudioがAWS Glue 5.1に対応し、Apache Spark 3.5.6やPython 3.11、Apache Iceberg、Apache Hudi、Delta Lakeなどの最新ライブラリが利用できるようになりました。ジョブ設定のバージョンドロップダウンからGlue 5.1を選択するだけで、Visual ETLやノートブック、コードベースのすべてのデータ処理ジョブで最新のランタイム環境を活用できます。これにより、データエンジニアとデータサイエンティストは統一された最新環境で効率的かつスケーラブルなデータ処理を実行でき、データ処理ワークフロー全体の現代化が実現します。
Amazon SageMaker Unified Studioが Kiro IDEからのリモート接続のサポートを開始
Amazon SageMaker Unified StudioがKiro IDEからのリモート接続に対応し、AWS Toolkitエクステンション経由でIAM認証による安全な接続が実現されました。データサイエンティストやMLエンジニアは、ローカルのKiro IDEの仕様駆動開発や会話型コーディング機能を活用しながら、SageMakerのスケーラブルなコンピュートリソースにシームレスにアクセスできます。ローカル環境とクラウドインフラ間のコンテキスト切り替えが不要になり、単一環境でAWSの分析・AI/MLサービス全体をエンタープライズグレードのセキュリティのもとで利用できるようになります。
Amazon SageMaker HyperPodがAPIドリブンのSlurm設定に対応しました
Amazon SageMaker HyperPodはAPI駆動のSlurm設定に対応し、クラスター作成・更新APIまたはAWSコンソールからSlurmトポロジーと共有ファイルシステム設定を直接定義できるようになりました。Managed、Overwrite、Mergeの3つのSlurmConfigStrategyオプションにより、パーティション・ノードマッピングのドリフトを自動検出・管理し、スケール操作時の設定ズレを防ぐことができます。この改善により、大規模MLクラスターの運用効率が向上し、LLMや基盤モデルのような複雑なワークロード実行時のリソース割り当てを柔軟かつ安全に制御できます。