Amazon EC2 Capacity Blocks for MLがAWS GovCloud (US-West) とAWS GovCloud (US-East) で利用可能になり、政府機関および規制対象業種の顧客がML ワークロード向けのGPU 容量を予約できるようになりました。このサービスはUltraCluster内の低遅延・高スループット接続により、事前学習、ファインチューニング、迅速なプロトタイピング、推論需要の急増に対応するGPU インスタンスの確実なアクセスを提供します。最大8週間前までに予約でき、最長6ヶ月間、1〜64インスタンスのクラスタサイズで予約が可能です。

#EC2 #GPU #ML #GovCloud #容量予約 #Capacity Blocks

SageMaker2026年5月12日

SageMaker Studio ノートブックでP5.48xlインスタンスの対応リージョンを拡大

Amazon EC2 P5.48xlインスタンスがSageMaker Studio notebooksで米国西部（サンフランシスコ）、アジア太平洋（東京、ムンバイ、シドニー、ジャカルタ）、ヨーロッパ（ロンドン、ストックホルム）リージョンで利用可能になった。P5.48xlはNVIDIA H100 Tensor Core GPUを搭載し、前世代GPU比で最大4倍高速化と最大40%のコスト削減を実現する。大規模言語モデルや拡散モデルの学習・デプロイが可能で、質問応答、コード生成、動画・画像生成、音声認識などの生成AIアプリケーションに対応する。

#SageMaker #EC2 #P5.48xl #GPU #生成AI #リージョン拡大

詳細を見る →

SageMaker2026年5月11日

SageMaker Studio notebooks上のP4deインスタンスがアジア太平洋・ヨーロッパリージョンに拡大

AWS EC2 P4deインスタンスがSageMaker Studio notebooksで東京、シンガポール、フランクフルトリージョンで一般利用可能になりました。P4deインスタンスは8個のNVIDIA A100 GPU（各80GB HBM2eメモリ）搭載で、既存P4dインスタンスの2倍のGPUメモリ容量（合計640GB）を提供します。P4dと比較してML学習パフォーマンスが最大60%向上し、学習コスト20%削減が実現します。

#SageMaker #P4de #EC2 #GPU #リージョン拡大 #機械学習 #トレーニング

詳細を見る →

AWS AI2026年5月7日

Amazon EC2 G7eインスタンスがロンドンリージョンで利用可能に

NVIDIA RTX PRO 6000 Blackwell Server Edition GPUで加速されたAmazon EC2 G7eインスタンスがEurope (London)リージョンで利用開始されました。G7eインスタンスはG6eと比較して推論性能が最大2.3倍向上し、大規模言語モデル（LLM）やエージェントAI、マルチモーダル生成AI、物理AIなどのワークロードに対応します。最大8個のGPU（各96GB メモリ）、192仮想CPU、1600 Gbpsのネットワーク帯域幅をサポートしており、オンデマンド、スポット、または割引プランで購入できます。

#EC2 #G7e #GPU #AI/ML #推論 #ロンドンリージョン #NVIDIA Blackwell

詳細を見る →

AWS AI2026年5月6日

Amazon EC2 P6-B300インスタンスが米国東部（N. バージニア）リージョンで利用可能に

Amazon EC2 P6-B300インスタンスが米国東部（N. バージニア）リージョンで利用開始された。本インスタンスは8個のNVIDIA Blackwell Ultra GPU、2.1TB の高帯域幅GPU メモリ、6.4Tbps EFAネットワーク機能を備えている。P6-B200と比較してネットワーク帯域幅が2倍、GPU メモリが1.5倍、GPU TFLOPS（FP4、スパーシティなし）が1.5倍の性能を提供する。

#EC2 #GPU #P6-B300 #Blackwell #大規模言語モデル #機械学習

詳細を見る →

AWS AI2026年4月28日

Amazon EC2 C8gn インスタンスがミラノとホンコン地域で利用可能に

AWS Graviton4プロセッサ搭載のAmazon EC2 C8gnインスタンスが、欧州（ミラノ）とアジア太平洋（ホンコン）地域で利用可能になりました。Graviton3ベースのC7gnと比較して最大30%の計算性能向上と、ネットワーク最適化EC2インスタンス中最高の600 Gbpsネットワーク帯域幅を提供します。ネットワーク集約的なワークロード向けに拡張性の高い構成を提供します。

#EC2 #Graviton4 #ネットワーク最適化 #ミラノ #ホンコン #リージョン拡大

詳細を見る →

AWS AI2026年4月21日

Amazon EC2 G7eインスタンスがロサンゼルスのAWS Local Zonesで利用可能に

AWSはロサンゼルスのLocal ZonesでAmazon EC2 G7eインスタンスの一般提供を開始しました。G7eインスタンスはNVIDIA RTX PRO 6000 Blackwell Server Edition GPUと第5世代Intel Xeon Scalable（Emerald Rapids）プロセッサを搭載しており、ロサンゼルスのエンドユーザーに高性能なGPUコンピュートを低レイテンシで提供します。クリエイティブワークロード（VFX編集、カラーコレクション、VFX仕上げ）とAIワークロード（LLM推論、エージェンティックAI）の実行が可能になります。

#EC2 #G7eインスタンス #Local Zones #GPU #ロサンゼルス #NVIDIA Blackwell #VFX #LLM推論

詳細を見る →

AWS AI2026年3月19日

AWSがNIXLとEFAのサポートを追加し、大規模LLM推論を加速

AWSはNVIDIA Inference Xfer Library（NIXL）とElastic Fabric Adapter（EFA）の統合サポートを発表しました。この統合により、Amazon EC2上で分散型の大規模言語モデル推論を高速化できます。KVキャッシュのスループット向上、トークン間遅延の削減、メモリ利用の最適化が実現され、追加費用なく利用可能です。

#AWS #LLM #推論最適化 #NIXL #EFA #EC2 #高性能計算

詳細を見る →

AWS AI2026年3月19日

Amazon EC2 C8gn インスタンスが追加リージョンで利用可能に

AWS Graviton4プロセッサを搭載したAmazon EC2 C8gnインスタンスが、アジア太平洋（ジャカルタ、ハイデラバード、東京）、南米（サンパウロ）、ヨーロッパ（チューリッヒ）の新しいリージョンで利用開始されました。Graviton3ベースのC7gnインスタンスと比較して最大30%のコンピュート性能向上と、ネットワーク最適化インスタンスの中で最高の600Gbps のネットワーク帯域幅を提供します。ネットワーク集約的なワークロードや高性能AIML推論の運用コスト最適化に活用できます。

#EC2 #Graviton4 #ネットワーク最適化 #AI/ML推論 #リージョン拡張

詳細を見る →

AWS AI2026年3月12日

Amazon EC2 M8i/M8i-flexインスタンスがアイルランドとロンドンリージョンで利用可能に

Amazon EC2のM8iおよびM8i-flexインスタンスが、欧州（アイルランド）と欧州（ロンドン）リージョンで利用開始されました。カスタムIntel Xeon 6プロセッサを搭載し、前世代比で最大20%のパフォーマンス向上と2.5倍のメモリ帯域幅を提供します。汎用ワークロード向けのコスト効率的な選択肢として活用できます。

#EC2 #汎用インスタンス #パフォーマンス向上 #ヨーロッパリージョン #Intel Xeon 6 #コスト効率化

詳細を見る →

AWS AI2026年3月10日

Amazon EC2 C8i/C8i-flex インスタンスがケープタウンとハイデラバードリージョンで利用可能に

Amazon EC2の最新コンピュート最適化インスタンスであるC8iおよびC8i-flexが、アフリカ（ケープタウン）およびアジア太平洋（ハイデラバード）リージョンで新たに利用可能になりました。インテル Xeon 6プロセッサを搭載し、前世代比で最大20%の性能向上と15%の価格性能比改善を実現します。Web サーバー、データベース、キャッシュなど多様なワークロードに対応しており、特定のアプリケーションではより大幅なパフォーマンス向上が期待できます。

#EC2 #コンピュート最適化 #インスタンスタイプ #アフリカ #アジア太平洋 #パフォーマンス #コスト最適化

詳細を見る →

タグ:

Amazon EC2 Capacity Blocks for ML がAWS GovCloud (US) リージョンで利用可能に

SageMaker Studio ノートブックでP5.48xlインスタンスの対応リージョンを拡大

SageMaker Studio notebooks上のP4deインスタンスがアジア太平洋・ヨーロッパリージョンに拡大

Amazon EC2 G7eインスタンスがロンドンリージョンで利用可能に

Amazon EC2 P6-B300インスタンスが米国東部（N. バージニア）リージョンで利用可能に

Amazon EC2 C8gn インスタンスがミラノとホンコン地域で利用可能に

Amazon EC2 G7eインスタンスがロサンゼルスのAWS Local Zonesで利用可能に

AWSがNIXLとEFAのサポートを追加し、大規模LLM推論を加速

Amazon EC2 C8gn インスタンスが追加リージョンで利用可能に

Amazon EC2 M8i/M8i-flexインスタンスがアイルランドとロンドンリージョンで利用可能に

Amazon EC2 C8i/C8i-flex インスタンスがケープタウンとハイデラバードリージョンで利用可能に

タグ:

Amazon EC2 Capacity Blocks for ML がAWS GovCloud (US) リージョンで利用可能に

SageMaker Studio ノートブックでP5.48xlインスタンスの対応リージョンを拡大

SageMaker Studio notebooks上のP4deインスタンスがアジア太平洋・ヨーロッパリージョンに拡大

Amazon EC2 G7eインスタンスがロンドンリージョンで利用可能に

Amazon EC2 P6-B300インスタンスが米国東部（N. バージニア）リージョンで利用可能に

Amazon EC2 C8gn インスタンスがミラノとホンコン地域で利用可能に

Amazon EC2 G7eインスタンスがロサンゼルスのAWS Local Zonesで利用可能に

AWSがNIXLとEFAのサポートを追加し、大規模LLM推論を加速

Amazon EC2 C8gn インスタンスが追加リージョンで利用可能に

Amazon EC2 M8i/M8i-flexインスタンスがアイルランドとロンドンリージョンで利用可能に

Amazon EC2 C8i/C8i-flex インスタンスがケープタウンとハイデラバード リージョンで利用可能に

Amazon EC2 C8i/C8i-flex インスタンスがケープタウンとハイデラバードリージョンで利用可能に