Amazon EC2 Capacity Blocks for ML がAWS GovCloud (US) リージョンで利用可能に
Amazon EC2 Capacity Blocks for MLがAWS GovCloud (US-West) とAWS GovCloud (US-East) で利用可能になり、政府機関および規制対象業種の顧客がML ワークロード向けのGPU 容量を予約できるようになりました。このサービスはUltraCluster内の低遅延・高スループット接続により、事前学習、ファインチューニング、迅速なプロトタイピング、推論需要の急増に対応するGPU インスタンスの確実なアクセスを提供します。最大8週間前までに予約でき、最長6ヶ月間、1〜64インスタンスのクラスタサイズで予約が可能です。
AWS PCS、本番環境対応のディープラーニングAMIを提供開始
AWS Parallel Computing Service(AWS PCS)がPCS対応のディープラーニングAMI(Deep Learning Base GPU AMI on Ubuntu 24.04ベース)を提供開始しました。このAMIには、AI/MLトレーニングとHPC向けのコアインフラストラクチャコンポーネントが事前インストール・テスト済みで、本番環境での利用に対応しています。x86_64とarm64の両アーキテクチャに対応し、AWS PCS利用可能なすべてのリージョンで追加料金なく利用できます。
SageMaker Notebook InstancesでP5.48xlインスタンスがアジア太平洋(東京)リージョンで利用可能に
Amazon EC2 P5.48xlインスタンスがSageMaker Notebook Instancesでアジア太平洋(東京)リージョンにおいて一般提供開始されました。このインスタンスはNVIDIA H100 Tensor Core GPUを搭載し、前世代GPU系EC2インスタンス比で最大4倍の処理速度向上とML モデルの学習コスト最大40%削減を実現します。大規模言語モデル(LLM)や拡散モデルなどの生成AI アプリケーションの学習とデプロイに対応できます。
SageMaker Notebook InstancesでのP4deインスタンスのアジア太平洋(東京)リージョン対応
AWS SageMaker Notebook InstancesでAmazon EC2 P4deインスタンスがアジア太平洋(東京)リージョンで利用可能になりました。P4deインスタンスは8個のNVIDIA A100 GPU(各80GB HBM2eメモリ)を搭載し、合計640GBのGPUメモリを提供します。P4dインスタンスと比べてML学習パフォーマンスが最大60%向上し、学習コストは20%低下します。
SageMaker Notebook InstancesがP5.4xlインスタンスタイプに対応
Amazon EC2 P5.4xlインスタンスがSageMaker Notebook Instancesで一般利用可能になりました。P5.4xlはNVIDIA H100 Tensor Core GPUを搭載し、前世代GPU比で最大4倍高速化、機械学習モデル訓練コストを最大40%削減できます。大規模言語モデルや拡散モデルなどの生成AI応用に利用できます。
Amazon SageMaker StudioがSageMaker Flexible Training PlansによるGPU容量予約に対応
Amazon SageMaker StudioのJupyterLabおよびCode EditorがSageMaker Flexible Training Plans(FTP)を通じたGPU容量予約に対応しました。FTPにより、オンデマンドインスタンスと比較して最大65%のコスト削減を実現しながら、ML ワークフローを実行できるようになります。ユーザーは予測可能かつ予算内での高性能計算リソースへのアクセスが可能になります。
SageMaker Studio ノートブックでP5.48xlインスタンスの対応リージョンを拡大
Amazon EC2 P5.48xlインスタンスがSageMaker Studio notebooksで米国西部(サンフランシスコ)、アジア太平洋(東京、ムンバイ、シドニー、ジャカルタ)、ヨーロッパ(ロンドン、ストックホルム)リージョンで利用可能になった。P5.48xlはNVIDIA H100 Tensor Core GPUを搭載し、前世代GPU比で最大4倍高速化と最大40%のコスト削減を実現する。大規模言語モデルや拡散モデルの学習・デプロイが可能で、質問応答、コード生成、動画・画像生成、音声認識などの生成AIアプリケーションに対応する。
SageMaker Studio NotebooksでのG6インスタンスの中東・アジア太平洋地域への拡大
AWS は Amazon EC2 G6 インスタンスを SageMaker Studio notebooks で中東(ドバイ)とアジア太平洋(マレーシア)リージョンで一般提供開始した。G6 インスタンスは最大 8 個の NVIDIA L4 Tensor Core GPU(各 24 GB メモリ)を搭載し、G4dn インスタンスと比べディープラーニング推論で 2 倍のパフォーマンスを実現する。ユーザーは生成 AI ファインチューニング、自然言語処理、コンピュータビジョン、推奨エンジンなどのモデル学習と推論をインタラクティブにテストできる。
SageMaker Studio notebooks上のP4deインスタンスがアジア太平洋・ヨーロッパリージョンに拡大
AWS EC2 P4deインスタンスがSageMaker Studio notebooksで東京、シンガポール、フランクフルトリージョンで一般利用可能になりました。P4deインスタンスは8個のNVIDIA A100 GPU(各80GB HBM2eメモリ)搭載で、既存P4dインスタンスの2倍のGPUメモリ容量(合計640GB)を提供します。P4dと比較してML学習パフォーマンスが最大60%向上し、学習コスト20%削減が実現します。
Amazon SageMaker Studio notebooksがP5.4xlインスタンスタイプに対応
Amazon SageMaker Studio notebooksでNVIDIA H100 Tensor Core GPU搭載のAmazon EC2 P5.4xlインスタンスが一般利用可能になりました。このインスタンスは前世代のGPUベースEC2インスタンスと比べて深層学習処理を最大4倍高速化でき、MLモデルの学習コストを最大40%削減できます。大規模言語モデル(LLM)や拡散モデルなどの生成AIアプリケーションの開発と展開に利用できます。
Amazon EC2 G7eインスタンスがロンドンリージョンで利用可能に
NVIDIA RTX PRO 6000 Blackwell Server Edition GPUで加速されたAmazon EC2 G7eインスタンスがEurope (London)リージョンで利用開始されました。G7eインスタンスはG6eと比較して推論性能が最大2.3倍向上し、大規模言語モデル(LLM)やエージェントAI、マルチモーダル生成AI、物理AIなどのワークロードに対応します。最大8個のGPU(各96GB メモリ)、192仮想CPU、1600 Gbpsのネットワーク帯域幅をサポートしており、オンデマンド、スポット、または割引プランで購入できます。
Amazon EC2 P6-B300インスタンスが米国東部(N. バージニア)リージョンで利用可能に
Amazon EC2 P6-B300インスタンスが米国東部(N. バージニア)リージョンで利用開始された。本インスタンスは8個のNVIDIA Blackwell Ultra GPU、2.1TB の高帯域幅GPU メモリ、6.4Tbps EFAネットワーク機能を備えている。P6-B200と比較してネットワーク帯域幅が2倍、GPU メモリが1.5倍、GPU TFLOPS(FP4、スパーシティなし)が1.5倍の性能を提供する。
Amazon SageMaker HyperPodが自動Slumトポロジー管理に対応
Amazon SageMaker HyperPodは、GPU インスタンスタイプに基づいてSlumクラスタの最適なネットワークトポロジー構成を自動選択・管理する機能を開始しました。クラスタのスケーリングやノード置換時にトポロジーが自動的に更新されるため、手動での設定変更が不要になります。ml.p5.48xlarge、ml.p5e.48xlarge、ml.p5en.48xlarge、ml.p6e-gb200.NVL72などのGPUインスタンスタイプに対応しており、全AWSリージョンで利用可能です。
Amazon EC2 G7eインスタンスがロサンゼルスのAWS Local Zonesで利用可能に
AWSはロサンゼルスのLocal ZonesでAmazon EC2 G7eインスタンスの一般提供を開始しました。G7eインスタンスはNVIDIA RTX PRO 6000 Blackwell Server Edition GPUと第5世代Intel Xeon Scalable(Emerald Rapids)プロセッサを搭載しており、ロサンゼルスのエンドユーザーに高性能なGPUコンピュートを低レイテンシで提供します。クリエイティブワークロード(VFX編集、カラーコレクション、VFX仕上げ)とAIワークロード(LLM推論、エージェンティックAI)の実行が可能になります。
Amazon SageMaker HyperPod のオンデマンド深度ヘルスチェック機能
Amazon SageMaker HyperPodが、Amazon EKSおよびSlurm構成のクラスタに対するオンデマンド深度ヘルスチェック機能をサポート開始しました。実行中のインスタンスのGPUアクセラレータのヘルスをいつでも事前に検証できるようになります。Slurm構成のクラスタではクラスタ作成時のノードプロビジョニング中に深度ヘルスチェックを実施することも可能です。
Amazon EC2 P6-B300インスタンス、AWS GovCloud(US-East)で利用可能に
NVIDIA Blackwell Ultra GPU×8基搭載のEC2 P6-B300インスタンスがAWS GovCloud(US-East)で利用可能になった。2.1TBの高帯域GPUメモリ、6.4Tbps EFAネットワーキング、4TBシステムメモリを備える。P6-B200比でネットワーク帯域2倍、GPUメモリ1.5倍、GPU TFLOPS 1.5倍の性能向上。
Amazon EC2 G7eインスタンス、アジア太平洋(ソウル)と欧州(スペイン)で利用可能に
NVIDIA RTX PRO 6000 Blackwell Server Edition GPU搭載のEC2 G7eインスタンスが、アジア太平洋(ソウル)と欧州(スペイン)に拡大された。G6e比で最大2.3倍の推論パフォーマンスを提供する。GPU1基あたり96GBメモリ、最大8GPU・192vCPU・1600Gbpsネットワーキングに対応。