AWS

タグ:

#EC2

11件のアップデート

AWS AI2026年6月12日

Amazon EC2 Capacity Blocks for ML がAWS GovCloud (US) リージョンで利用可能に

Amazon EC2 Capacity Blocks for MLがAWS GovCloud (US-West) とAWS GovCloud (US-East) で利用可能になり、政府機関および規制対象業種の顧客がML ワークロード向けのGPU 容量を予約できるようになりました。このサービスはUltraCluster内の低遅延・高スループット接続により、事前学習、ファインチューニング、迅速なプロトタイピング、推論需要の急増に対応するGPU インスタンスの確実なアクセスを提供します。最大8週間前までに予約でき、最長6ヶ月間、1〜64インスタンスのクラスタサイズで予約が可能です。

SageMaker2026年5月12日

SageMaker Studio ノートブックでP5.48xlインスタンスの対応リージョンを拡大

Amazon EC2 P5.48xlインスタンスがSageMaker Studio notebooksで米国西部(サンフランシスコ)、アジア太平洋(東京、ムンバイ、シドニー、ジャカルタ)、ヨーロッパ(ロンドン、ストックホルム)リージョンで利用可能になった。P5.48xlはNVIDIA H100 Tensor Core GPUを搭載し、前世代GPU比で最大4倍高速化と最大40%のコスト削減を実現する。大規模言語モデルや拡散モデルの学習・デプロイが可能で、質問応答、コード生成、動画・画像生成、音声認識などの生成AIアプリケーションに対応する。

SageMaker2026年5月11日

SageMaker Studio notebooks上のP4deインスタンスがアジア太平洋・ヨーロッパリージョンに拡大

AWS EC2 P4deインスタンスがSageMaker Studio notebooksで東京、シンガポール、フランクフルトリージョンで一般利用可能になりました。P4deインスタンスは8個のNVIDIA A100 GPU(各80GB HBM2eメモリ)搭載で、既存P4dインスタンスの2倍のGPUメモリ容量(合計640GB)を提供します。P4dと比較してML学習パフォーマンスが最大60%向上し、学習コスト20%削減が実現します。

AWS AI2026年5月7日

Amazon EC2 G7eインスタンスがロンドンリージョンで利用可能に

NVIDIA RTX PRO 6000 Blackwell Server Edition GPUで加速されたAmazon EC2 G7eインスタンスがEurope (London)リージョンで利用開始されました。G7eインスタンスはG6eと比較して推論性能が最大2.3倍向上し、大規模言語モデル(LLM)やエージェントAI、マルチモーダル生成AI、物理AIなどのワークロードに対応します。最大8個のGPU(各96GB メモリ)、192仮想CPU、1600 Gbpsのネットワーク帯域幅をサポートしており、オンデマンド、スポット、または割引プランで購入できます。

AWS AI2026年5月6日

Amazon EC2 P6-B300インスタンスが米国東部(N. バージニア)リージョンで利用可能に

Amazon EC2 P6-B300インスタンスが米国東部(N. バージニア)リージョンで利用開始された。本インスタンスは8個のNVIDIA Blackwell Ultra GPU、2.1TB の高帯域幅GPU メモリ、6.4Tbps EFAネットワーク機能を備えている。P6-B200と比較してネットワーク帯域幅が2倍、GPU メモリが1.5倍、GPU TFLOPS(FP4、スパーシティなし)が1.5倍の性能を提供する。

AWS AI2026年4月28日

Amazon EC2 C8gn インスタンスがミラノとホンコン地域で利用可能に

AWS Graviton4プロセッサ搭載のAmazon EC2 C8gnインスタンスが、欧州(ミラノ)とアジア太平洋(ホンコン)地域で利用可能になりました。Graviton3ベースのC7gnと比較して最大30%の計算性能向上と、ネットワーク最適化EC2インスタンス中最高の600 Gbpsネットワーク帯域幅を提供します。ネットワーク集約的なワークロード向けに拡張性の高い構成を提供します。

AWS AI2026年4月21日

Amazon EC2 G7eインスタンスがロサンゼルスのAWS Local Zonesで利用可能に

AWSはロサンゼルスのLocal ZonesでAmazon EC2 G7eインスタンスの一般提供を開始しました。G7eインスタンスはNVIDIA RTX PRO 6000 Blackwell Server Edition GPUと第5世代Intel Xeon Scalable(Emerald Rapids)プロセッサを搭載しており、ロサンゼルスのエンドユーザーに高性能なGPUコンピュートを低レイテンシで提供します。クリエイティブワークロード(VFX編集、カラーコレクション、VFX仕上げ)とAIワークロード(LLM推論、エージェンティックAI)の実行が可能になります。

AWS AI2026年3月19日

AWSがNIXLとEFAのサポートを追加し、大規模LLM推論を加速

AWSはNVIDIA Inference Xfer Library(NIXL)とElastic Fabric Adapter(EFA)の統合サポートを発表しました。この統合により、Amazon EC2上で分散型の大規模言語モデル推論を高速化できます。KVキャッシュのスループット向上、トークン間遅延の削減、メモリ利用の最適化が実現され、追加費用なく利用可能です。

AWS AI2026年3月19日

Amazon EC2 C8gn インスタンスが追加リージョンで利用可能に

AWS Graviton4プロセッサを搭載したAmazon EC2 C8gnインスタンスが、アジア太平洋(ジャカルタ、ハイデラバード、東京)、南米(サンパウロ)、ヨーロッパ(チューリッヒ)の新しいリージョンで利用開始されました。Graviton3ベースのC7gnインスタンスと比較して最大30%のコンピュート性能向上と、ネットワーク最適化インスタンスの中で最高の600Gbps のネットワーク帯域幅を提供します。ネットワーク集約的なワークロードや高性能AIML推論の運用コスト最適化に活用できます。

AWS AI2026年3月12日

Amazon EC2 M8i/M8i-flexインスタンスがアイルランドとロンドンリージョンで利用可能に

Amazon EC2のM8iおよびM8i-flexインスタンスが、欧州(アイルランド)と欧州(ロンドン)リージョンで利用開始されました。カスタムIntel Xeon 6プロセッサを搭載し、前世代比で最大20%のパフォーマンス向上と2.5倍のメモリ帯域幅を提供します。汎用ワークロード向けのコスト効率的な選択肢として活用できます。

AWS AI2026年3月10日

Amazon EC2 C8i/C8i-flex インスタンスがケープタウンとハイデラバード リージョンで利用可能に

Amazon EC2の最新コンピュート最適化インスタンスであるC8iおよびC8i-flexが、アフリカ(ケープタウン)およびアジア太平洋(ハイデラバード)リージョンで新たに利用可能になりました。インテル Xeon 6プロセッサを搭載し、前世代比で最大20%の性能向上と15%の価格性能比改善を実現します。Web サーバー、データベース、キャッシュなど多様なワークロードに対応しており、特定のアプリケーションではより大幅なパフォーマンス向上が期待できます。