SageMaker AIがNVIDIA Nemotron 3モデルのサーバーレス微調整に対応
Amazon SageMaker AIは、NVIDIA Nemotron 3 Nanoモデル(30Bパラメータ)に対してサーバーレス微調整機能を提供開始しました。Supervised Fine-Tuning(SFT)とReinforcement Fine-Tuning(RFT)の両方に対応しており、ユーザーは独自データを使用してモデルをカスタマイズできます。US East(N. Virginia)、US West(Oregon)、Asia Pacific(Tokyo)、Europe(Ireland)の4リージョンで利用可能です。
Amazon SageMaker Unified Studio NotebooksがEMR Serverlessに対応
Amazon SageMaker Unified Studio NotebooksがApache Spark ConnectによるAmazon EMR Serverlessに対応し、データエンジニアとアナリストがSparkランタイムを柔軟に選択できるようになりました。Athena Sparkに加えてEMR Serverlessをランタイムとして利用でき、要件に応じて最適なエンジンを選択できます。NotebookのサイドパネルからSparkランタイムを選択でき、PySpark及びSpark SQLの実行が可能になります。
Amazon EMR ServerlessがSpark Connectで対話型ワークロードに対応
Amazon EMR ServerlessがSpark Connectをサポートし、SageMaker Unified StudioやJupyter、Visual Studio Codeなどのノートブック環境からApache Sparkアプリケーションを対話的に開発・実行できるようになりました。Spark Connectのクライアント・サーバーアーキテクチャにより、開発環境とSpark基盤が分離され、ローカルのPythonコード実行とリモートのSpark操作をシームレスに統合できます。EMR Serverlessが利用可能なすべてのAWSリージョンでEMRリリース7.13以降で利用可能です。
AWS Compute Optimizer、6つの追加リソースタイプのアイドル推奨事項に対応
AWS Compute OptimizerがDynamoDB、ElastiCache、MemoryDB、DocumentDB、WorkSpaces、SageMaker endpointsのアイドルリソース検出に対応しました。利用率メトリクスを分析して未使用リソースを特定し、コスト削減の機会を提供します。Cost Optimization Hubで組織全体のアカウント横断的に推奨事項を確認できます。
Amazon SageMaker Data Agent がビジネスコンテキスト統合に対応
Amazon SageMaker Data Agent が SageMaker Catalog のビジネスコンテキストとメタデータと統合され、データ実践者が技術的なテーブル名ではなくビジネス用語を使用してデータセットを検出し、より正確な SQL および Python コードを生成できるようになりました。この統合により、Collibra、Atlan、Alation から同期されたカタログを含む SageMaker Catalog に保存されているビジネスコンテキストを活用して、データ検出とコード生成の精度が向上します。SageMaker Unified Studio ノートブックおよびクエリエディタで利用可能で、Amazon SageMaker Unified Studio が提供されているすべての AWS リージョンで使用できます。
Amazon SageMaker Data Agent が会話履歴機能に対応
Amazon SageMaker Data Agent がSageMaker Unified Studio で会話履歴機能をサポートするようになりました。データ分析者やデータサイエンティストは、過去のエージェント生成コード、複数ステップの分析、トラブルシューティング内容をノートブックとQuery Editorワークフロー内で参照できるようになります。すべてのAmazon SageMaker Data Agentが利用可能なAWSリージョンでこの機能が提供されます。
Amazon SageMaker Unified Studioが12言語のローカライズに対応
Amazon SageMaker Unified Studioが12言語でのローカライズされたユーザーインターフェースをサポートするようになりました。英語(米国)、中国語(簡体字・繁体字)、フランス語、ドイツ語、インドネシア語、イタリア語、日本語、韓国語、ポルトガル語(ブラジル)、スペイン語、トルコ語に対応しています。ブラウザの言語設定から自動検出されるか、プロファイル設定の言語セレクターから選択できます。
Amazon SageMaker HyperPodがEFA専用ネットワークインターフェイスに対応
Amazon SageMaker HyperPodがEFA専用(EFA-only)ネットワークインターフェイスをサポートするようになりました。これにより、IP アドレッシング用の Elastic Network Adapter (ENA) を接続せず、Elastic Fabric Adapter (EFA) デバイスを専用で構成できます。VPC内のIPアドレス枯渇のリスクなしに、AI/MLクラスタをさらに大規模に拡張できるようになります。
Amazon SageMaker HyperPodがAIコーディングアシスタント向けトラブルシューティング機能を提供開始
Amazon SageMaker HyperPodは、Claude Code、Cursor、KiroなどのAIコーディングアシスタントに統合できるトラブルシューティング機能を提供開始しました。この機能により、ユーザーは自然言語を通じてGPUハードウェア障害、NCCL通信障害、パフォーマンスボトルネックを診断・解決できるようになります。HyperPodの既存インフラストラクチャに対する変更は不要で、SageMaker AIスキルプラグイン経由でオープンソースとして利用可能です。
SageMaker Notebook InstancesでP5.48xlインスタンスがアジア太平洋(東京)リージョンで利用可能に
Amazon EC2 P5.48xlインスタンスがSageMaker Notebook Instancesでアジア太平洋(東京)リージョンにおいて一般提供開始されました。このインスタンスはNVIDIA H100 Tensor Core GPUを搭載し、前世代GPU系EC2インスタンス比で最大4倍の処理速度向上とML モデルの学習コスト最大40%削減を実現します。大規模言語モデル(LLM)や拡散モデルなどの生成AI アプリケーションの学習とデプロイに対応できます。
SageMaker Notebook InstancesでのP4deインスタンスのアジア太平洋(東京)リージョン対応
AWS SageMaker Notebook InstancesでAmazon EC2 P4deインスタンスがアジア太平洋(東京)リージョンで利用可能になりました。P4deインスタンスは8個のNVIDIA A100 GPU(各80GB HBM2eメモリ)を搭載し、合計640GBのGPUメモリを提供します。P4dインスタンスと比べてML学習パフォーマンスが最大60%向上し、学習コストは20%低下します。
Announcing Region Expansion of P6-B200 instances on SageMaker Notebook Instances
<p>We are pleased to announce general availability of Amazon EC2 P6-B200 instances in AWS US East (N. Virginia) on SageMaker notebook instances.</p>
<p><u><a href="https://aws.amazon.com/ec2/instance
SageMaker Notebook InstancesがP5.4xlインスタンスタイプに対応
Amazon EC2 P5.4xlインスタンスがSageMaker Notebook Instancesで一般利用可能になりました。P5.4xlはNVIDIA H100 Tensor Core GPUを搭載し、前世代GPU比で最大4倍高速化、機械学習モデル訓練コストを最大40%削減できます。大規模言語モデルや拡散モデルなどの生成AI応用に利用できます。
SageMaker Notebook InstancesがP5en.48xlインスタンスタイプに対応
Amazon EC2 P5en.48xlインスタンスがSageMaker Notebook Instancesで一般利用可能になりました。P5en.48xlは8個のH200 GPUを搭載し、H100 GPUと比べてGPUメモリが1.7倍、メモリ帯域幅が1.4倍になっています。米国東部(バージニア、オハイオ)、米国西部(オレゴン)、アジアパシフィック(東京)リージョンで利用可能です。
Amazon SageMaker HyperPod Slurm クラスターで最小容量要件(MinCount)による継続的プロビジョニングをサポート
Amazon SageMaker HyperPod Slurm クラスターで、最小容量要件(MinCount)を指定する機能が追加されました。この機能により、分散トレーニングジョブ開始前に必要最小限のインスタンス数が確実にプロビジョニングされるよう制御できます。MinCount はすべてのAWSリージョンで利用可能です。
Amazon SageMaker Unified Studio、IAM Domainsでの Feature Store管理の対話的インターフェース追加
Amazon SageMaker Unified Studio IAM Domainsに、SageMaker Feature Storeのフィーチャーグループを作成・管理するための対話的インターフェースが追加されました。これまでAPIコールの記述が必要だった一般的なフィーチャー管理タスクが、コード無しで実行可能になります。データサイエンティスト、MLエンジニア、ビジネスアナリストが単一の共同作業環境からアクセスできます。
Amazon SageMaker Unified Studio、Identity Center ベースのドメインでドメイン管理機能を拡大
Amazon SageMaker Unified Studio が Identity Center ベースのドメインに対してドメイン管理機能を提供するようになりました。これまで IAM ベースのドメインのみで利用できていたプロジェクト作成、ユーザー・権限管理、ネットワーク設定などの機能が、Identity Center ベースのドメインでも AWS コンソール外から利用可能になります。SageMaker Unified Studio が利用可能なすべての AWS リージョンでこれらの機能が提供されます。
Amazon SageMaker adds business metadata and governance in IAM-based domains
<p><a href="https://aws.amazon.com/sagemaker/unified-studio/">Amazon SageMaker Unified Studio</a> now supports business context, metadata and data governance capabilities in IAM-based domains. With th
SageMaker Unified Studio、Glueコネクタのサブネット間自動プロビジョニング機能を追加
Amazon SageMaker Unified Studioが、Glueジョブの失敗時にサブネット間での自動リトライ機能に対応するコネクタの自動プロビジョニングをサポートしました。ドメインのVPC設定で複数のプライベートサブネットを定義すると、システムが全新規プロジェクト用のコネクタを自動的にプロビジョニングし、プライマリサブネットが利用不可の場合は別のサブネット上で自動的にジョブをリトライします。この機能はAmazon SageMaker Unified Studioが利用可能な全AWSリージョンで提供されます。
Amazon SageMaker InferenceがOpenAI互換APIに対応
Amazon SageMaker Inferenceは、OpenAI互換APIをサポートするようになり、OpenAI SDK、LangChain、Strands Agentsなどの既存ツールをSageMakerエンドポイントに直接接続できるようになりました。エンドポイントURLを変更するだけで、カスタム統合コード、SDKラッパー、またはコードの書き換えは不要です。この機能は米国東部(バージニア北部)、米国西部(オレゴン)、米国東部(オハイオ)、アジアパシフィック(ムンバイ)、アジアパシフィック(ジャカルタ)、欧州(アイルランド)、欧州(フランクフルト)、南米(サンパウロ)、アジアパシフィック(東京)、アジアパシフィック(ソウル)、欧州(ロンドン)、アジアパシフィック(シンガポール)、アジアパシフィック(シドニー)、カナダ(中央)の14リージョンで利用可能です。
Amazon SageMaker Unified Studioがデータ品質ルールの作成と評価に対応
Amazon SageMaker Unified StudioがAWS Glue Data Qualityを活用したデータ品質ルールの作成と評価機能をサポートしました。データエンジニア、アナリスト、データサイエンティストがカタログテーブルの静止データと Visual ETL ジョブ内の動的データの両方に対して、データ品質ルールを定義し、ルールセット評価を実行して結果を確認できます。SageMaker Unified Studio が利用可能なすべての AWS リージョンで、IAM Identity Center ベースおよび IAM ベースのドメインの両方で利用可能です。
Amazon SageMaker HyperPodで推論ワークロードのデータキャプチャに対応
Amazon SageMaker HyperPodが推論リクエスト・レスポンスペイロードを記録するデータキャプチャ機能をサポートしました。SageMakerエンドポイント、ロードバランサー、またはモデルポッドのいずれかのレベルでキャプチャを選択でき、複数オプションの組み合わせで階層化された可視性を実現できます。キャプチャされたデータはAmazon S3に非同期で配信され、カスタマー管理のAWS KMSキーによる暗号化とサンプリング設定に対応しています。
Amazon SageMaker StudioがSageMaker Flexible Training PlansによるGPU容量予約に対応
Amazon SageMaker StudioのJupyterLabおよびCode EditorがSageMaker Flexible Training Plans(FTP)を通じたGPU容量予約に対応しました。FTPにより、オンデマンドインスタンスと比較して最大65%のコスト削減を実現しながら、ML ワークフローを実行できるようになります。ユーザーは予測可能かつ予算内での高性能計算リソースへのアクセスが可能になります。
SageMaker AIがQwen3.6のサーバーレスモデルカスタマイズに対応
Amazon SageMaker AIは、Alibaba CloudのQwen3.6 27Bパラメータモデルに対してサーバーレスモデルカスタマイズ機能を新たにサポートしました。教師あり微調整(SFT)と強化学習微調整(RFT)の両方に対応しており、ユーザーは独自データを使用してQwen3.6を特定のドメインや業務フローに適応させることが可能になりました。このサービスは米国東部(バージニア州)、米国西部(オレゴン州)、アジア太平洋(東京)、欧州(アイルランド)の4リージョンで利用可能です。
Amazon SageMaker JumpStartで画像生成と テキスト埋め込みの新モデルが利用可能に
AWSはAmazon SageMaker JumpStartでFLUX.2-klein-base-4BとQwen3-Embedding-0.6Bの2つの新しいファンデーションモデルの提供を開始しました。FLUX.2-klein-base-4Bはわずか13GB VRAMで動作し、リアルタイム画像生成と複数参照編集が可能です。Qwen3-Embedding-0.6Bは100以上の言語に対応し、テキスト埋め込みの検索、分類、クラスタリング機能を提供します。
Amazon SageMaker JumpStartで音声認識と音声合成の3つの新モデルが利用可能に
AWS は Qwen3 シリーズの3つの音声処理モデルを Amazon SageMaker JumpStart で利用可能にしました。カスタマイズ可能な音声スタイルの多言語テキスト音声合成、3秒の高速音声クローニング、52言語対応の自動音声認識の機能が提供されます。これらのモデルは10言語以上をサポートし、AWS インフラストラクチャ上でインテリジェントな音声駆動アプリケーションを構築できます。
Amazon SageMaker JumpStartで2つの新しいモデル(GLM-5.1-FP8とPhi-4-mini-instruct)が利用可能に
AWSはSageMaker JumpStartでGLM-5.1-FP8とPhi-4-mini-instructの2つのモデルを新たに提供開始しました。GLM-5.1-FP8はエージェント型ソフトウェアエンジニアリング機能を備えており、リポジトリレベルのコード生成や複雑なデバッグワークフローに対応しています。Phi-4-mini-instructは24言語対応の軽量なモデルで、推論性能が高く、メモリ制約と低レイテンシー環境での使用に最適化されています。
Amazon SageMaker Data AgentがIAM Identity Center ドメインで利用可能に
Amazon SageMaker Data AgentがIAM Identity Center対応のSageMaker Unified Studioドメインで利用可能になりました。データアナリストとエンジニアは、自然言語での説明からPythonまたはSQLコードを自動生成でき、複雑なSQL結合や集計、Pythonコーディングを手動で記述する必要がなくなります。Amazon Athena、Amazon Redshift、Amazon S3、AWS Glue Data Catalogなどの接続データソースに対応しています。
Amazon SageMaker Feature Store が SageMaker Python SDK V3 に対応
Amazon SageMaker Feature Store が SageMaker Python SDK v3 に対応し、Lake Formation によるアクセス制御と Apache Iceberg テーブルプロパティの設定機能が追加されました。データサイエンティストは SDK v3 の最新インターフェースを使用して、フィーチャーグループを細粒度のアクセス制御とストレージ最適化で管理できるようになりました。SageMaker Python SDK v3.8.0 以降をインストールすることで、SageMaker Feature Store が利用可能なすべての AWS リージョンでこの機能を使用できます。
SageMaker Studio ノートブックでP5.48xlインスタンスの対応リージョンを拡大
Amazon EC2 P5.48xlインスタンスがSageMaker Studio notebooksで米国西部(サンフランシスコ)、アジア太平洋(東京、ムンバイ、シドニー、ジャカルタ)、ヨーロッパ(ロンドン、ストックホルム)リージョンで利用可能になった。P5.48xlはNVIDIA H100 Tensor Core GPUを搭載し、前世代GPU比で最大4倍高速化と最大40%のコスト削減を実現する。大規模言語モデルや拡散モデルの学習・デプロイが可能で、質問応答、コード生成、動画・画像生成、音声認識などの生成AIアプリケーションに対応する。
Announcing Region Expansion of G6 instances on SageMaker Notebook Instances
<p>We are pleased to announce general availability of Amazon EC2 G6 instances in Asia Pacific (Tokyo, Mumbai, Sydney) and Europe (London, Paris, Frankfurt, Stockholm, Zurich) on SageMaker notebook ins
Announcing Region Expansion of P6-B200 instances on SageMaker Studio notebooks
<p>We are pleased to announce general availability of Amazon EC2 P6-B200 instances in AWS US East (N. Virginia) on SageMaker Studio notebooks.</p>
<p><a href="https://aws.amazon.com/ec2/instance-type
Announcing Region Expansion of G6e instances on SageMaker Studio notebooks
<p>We are pleased to announce general availability of Amazon EC2 G6e instances in the Middle East (Dubai), Asia Pacific (Tokyo, Seoul) and Europe (Frankfurt, Stockholm, Spain) on SageMaker Studio note
SageMaker Studio NotebooksでのG6インスタンスの中東・アジア太平洋地域への拡大
AWS は Amazon EC2 G6 インスタンスを SageMaker Studio notebooks で中東(ドバイ)とアジア太平洋(マレーシア)リージョンで一般提供開始した。G6 インスタンスは最大 8 個の NVIDIA L4 Tensor Core GPU(各 24 GB メモリ)を搭載し、G4dn インスタンスと比べディープラーニング推論で 2 倍のパフォーマンスを実現する。ユーザーは生成 AI ファインチューニング、自然言語処理、コンピュータビジョン、推奨エンジンなどのモデル学習と推論をインタラクティブにテストできる。
SageMaker Studio notebooks上のP4deインスタンスがアジア太平洋・ヨーロッパリージョンに拡大
AWS EC2 P4deインスタンスがSageMaker Studio notebooksで東京、シンガポール、フランクフルトリージョンで一般利用可能になりました。P4deインスタンスは8個のNVIDIA A100 GPU(各80GB HBM2eメモリ)搭載で、既存P4dインスタンスの2倍のGPUメモリ容量(合計640GB)を提供します。P4dと比較してML学習パフォーマンスが最大60%向上し、学習コスト20%削減が実現します。
Amazon SageMaker Studio notebooksがP5.4xlインスタンスタイプに対応
Amazon SageMaker Studio notebooksでNVIDIA H100 Tensor Core GPU搭載のAmazon EC2 P5.4xlインスタンスが一般利用可能になりました。このインスタンスは前世代のGPUベースEC2インスタンスと比べて深層学習処理を最大4倍高速化でき、MLモデルの学習コストを最大40%削減できます。大規模言語モデル(LLM)や拡散モデルなどの生成AIアプリケーションの開発と展開に利用できます。
Amazon SageMaker Unified Studioがチュートリアルと製品内リリースノートを追加
Amazon SageMaker Unified Studioに初心者向けのチュートリアルセクションが追加され、SQLクエリ実行、ノートブックでのデータ分析、Visual ETLによるパイプライン構築、MLモデル訓練などのコアワークフローを10分以下で学習できるようになりました。開発環境がOSの明暗モード設定に自動対応し、ユーザーの好みに合わせたインターフェース表示が可能になりました。製品内に「What's New」セクションが追加され、新機能の発表とリリースノートが直接確認できるようになりました。
Amazon SageMaker Unified Studioがアイデンティティとユーザー管理機能を追加
SageMaker Unified Studioが新しい管理機能を追加し、IAMドメインではAWS IAM Identity Centerを経由したシングルサインオンでユーザーをオンボードできるようになりました。Identity Centerドメインではフェデレーション経由のIAMロールアクセスが可能になり、同じロールを共有するユーザーの作業が相互に上書きされなくなりました。これらの機能は15のAWSリージョン(東京を含む)で利用可能です。
Amazon SageMaker HyperPod now supports AMI-based node lifecycle configuration for Slurm clusters
<p>Amazon SageMaker HyperPod now supports AMI-based configuration that provisions Slurm cluster nodes with the software and configurations needed for a production-ready environment to run AI/ML traini
Amazon SageMaker AI Now Supports Capacity-Aware Inference with Automatic Instance Fallback
<p>Amazon SageMaker AI inference endpoints now support flexible provisioning across a prioritized list of instance types. When your preferred instance type has insufficient capacity, SageMaker AI auto
Paraphrase-multilingual-MiniLM-L12-v2, Table Transformer Detection, and Bielik-11B-v3.0-Instruct are now available in Amazon SageMaker JumpStart
<p>Today, AWS announced the availability of paraphrase-multilingual-MiniLM-L12-v2, Microsoft Table Transformer Detection, and Bielik-11B-v3.0-Instruct in Amazon SageMaker JumpStart.</p>
<p><b>Paraphr
Amazon SageMaker JumpStartでGemma 4モデルが利用可能に
AWSがGoogle DeepMindのGemma 4 E4B、Gemma 4 26B-A4B、Gemma 4 31Bの3つのマルチモーダルモデルをAmazon SageMaker JumpStartで提供開始しました。これらのモデルは140言語以上の多言語対応、ネイティブ関数呼び出し、推論機能を備えており、数クリックでデプロイ可能です。Gemma 4 E4Bは追加でオーディオ入力による自動音声認識と多言語翻訳に対応しています。
Amazon SageMaker HyperPod now supports G7e and r5d.16xlarge instances
<p>Amazon SageMaker HyperPod now supports <a href="https://aws.amazon.com/ec2/instance-types/g7e/" target="_blank">G7e</a> and r5d.16xlarge instances. SageMaker HyperPod is a purpose-built infrastruct
Amazon SageMaker Training PlansがAmazon CloudWatchでのキャパシティ利用率監視に対応
Amazon SageMaker Training PlansがAmazon CloudWatchメトリクスに対応し、購入済みプランに関連するキャパシティ予約の利用率監視が可能になりました。管理者は個別プランレベルおよびアカウント全体のインスタンス使用状況について、履歴データとリアルタイムデータの両方にアクセスできます。これにより、キャパシティとコストに関する情報に基づいた意思決定が可能になります。
Amazon SageMaker HyperPodが自動Slumトポロジー管理に対応
Amazon SageMaker HyperPodは、GPU インスタンスタイプに基づいてSlumクラスタの最適なネットワークトポロジー構成を自動選択・管理する機能を開始しました。クラスタのスケーリングやノード置換時にトポロジーが自動的に更新されるため、手動での設定変更が不要になります。ml.p5.48xlarge、ml.p5e.48xlarge、ml.p5en.48xlarge、ml.p6e-gb200.NVL72などのGPUインスタンスタイプに対応しており、全AWSリージョンで利用可能です。
Amazon SageMaker Unified StudioがIdCドメイン向けにサーバーレスノートブックとデータエージェントをサポート
Amazon SageMaker Unified StudioがAWS IAM Identity Center(IdC)ドメインでサーバーレスノートブックと組み込みデータエージェント機能をサポートしました。これまでこれらの機能はIAMドメインのみで利用可能でしたが、IdCを使用する顧客も高性能なサーバーレスノートブック環境にアクセスできるようになりました。ノートブックはSQL、Python、自然言語を組み合わせて使用でき、Amazon Athena for Apache Sparkが支援し、ペタバイト規模のデータ処理に対応します。
Amazon SageMaker Unified StudioのノートブックカーネルがVPC対応に
Amazon SageMaker Unified StudioのノートブックカーネルがVPC(Virtual Private Cloud)に対応しました。ノートブックカーネルはドメインレベルで構成されたVPC内で実行され、企業向けにネットワーク分離を提供します。このアップデートにより、ノートブックコンピュート トラフィックをVPC境界内に保つことで、セキュリティとコンプライアンス要件を満たせます。
Amazon SageMaker Unified Studio、IAMドメインでプロジェクト内の複数コードスペース対応
Amazon SageMaker Unified Studioは、IAMドメイン向けに1つのプロジェクト内で複数のコードスペース(個別に設定された開発環境)の作成・管理に対応しました。従来はプロジェクトあたり1つのJupyterLabスペースと1つのCode Editorスペースに限定されていましたが、これにより異なるコンピュート・ストレージ構成で並行作業が可能になります。各スペースは独立したAmazon EBSボリュームを持ち、ファイル・データ・セッション状態を個別に保持でき、スケーリング・一時停止・再開が可能です。
Amazon SageMaker AIがQwen3.5モデルのサーバーレスモデルカスタマイズに対応
Amazon SageMaker AIがQwen3.5(4B、9B、27Bパラメータ)モデルのサーバーレスモデルカスタマイズに対応しました。監視付きファインチューニング(SFT)と強化学習ファインチューニング(RFT)の両方が利用可能です。米国東部(バージニア北部)、米国西部(オレゴン)、アジアパシフィック(東京)、EU(アイルランド)の4リージョンで提供されています。
Amazon SageMaker AIが生成AI向けの最適化された推論レコメンデーションを提供開始
SageMaker AIに、生成AIモデルの最適なデプロイ構成を推論レコメンデーション機能が追加された。モデルアーキテクチャを分析し、複数インスタンスタイプで最適化を適用。NVIDIA AIPerfを用いた実GPUインフラでのベンチマークにより、コスト・レイテンシ・スループットのいずれかを目標に設定して推奨構成を得られる。
SageMaker Unified Studioが IAM Identity Center のマルチリージョンレプリケーションに対応
Amazon SageMakerが IAM Identity Center(IdC)のマルチリージョンレプリケーションに対応し、IdCインスタンスとは別リージョンにSageMaker Unified Studioドメインをデプロイできるようになった。IdCの配置とデータ処理リージョンを分離でき、SSOアクセスはリージョンをまたいでシームレスに維持される。
Qwenの新モデル5種(コーディングエージェント・効率的推論向け)がSageMaker JumpStartで利用可能に
Qwen3-Coder-Next・Qwen3-30B-A3B・Qwen3-30B-A3B-Thinking-2507・Qwen3-Coder-30B-A3B-Instruct・Qwen3.5-4B の5モデルが SageMaker JumpStart で利用可能になった。エージェンティックコーディング・数学・科学・マルチモーダル(201言語対応の Qwen3.5-4B)など、用途に応じて選択できる。
Amazon SageMaker HyperPodが柔軟なインスタンスグループに対応
SageMaker HyperPodで、1つのインスタンスグループ内に複数のインスタンスタイプ・複数サブネットを指定できる「柔軟なインスタンスグループ」が追加された。従来はタイプ・AZごとに別グループで管理する必要があったが、優先順位付きリストで指定でき、高優先のタイプで確保できない場合は自動で下位にフォールバックする。
Amazon SageMaker HyperPod のオンデマンド深度ヘルスチェック機能
Amazon SageMaker HyperPodが、Amazon EKSおよびSlurm構成のクラスタに対するオンデマンド深度ヘルスチェック機能をサポート開始しました。実行中のインスタンスのGPUアクセラレータのヘルスをいつでも事前に検証できるようになります。Slurm構成のクラスタではクラスタ作成時のノードプロビジョニング中に深度ヘルスチェックを実施することも可能です。
SageMaker JumpStartが基盤モデルの最適化デプロイに対応
SageMaker JumpStartで、基盤モデルを用途別の最適化設定でデプロイできる機能が追加された。コスト最適・スループット最適・レイテンシ最適・バランスの4つのターゲットから選択でき、デプロイ前にP50レイテンシ・TTFT・スループットを確認できる。30以上のモデル(Llama 3.1/3.2、Phi-3、Mistral、Qwen、Gemma、Falcon3など)に対応する。
NVIDIA Nemotron-3-Super-120B・Qwen3.5-9B/27BがSageMaker JumpStartで利用可能に
NVIDIA Nemotron-3-Super-120B、Qwen3.5-9B、Qwen3.5-27B の3モデルが Amazon SageMaker JumpStart で利用可能になった。Nemotron-3-Super-120B はMamba-2とMoEを組み合わせたハイブリッドLatentMoEアーキテクチャで、エージェンティック推論に最適化。Qwen3.5 は多言語コーディング・指示追従から、拡張されたコンテキスト理解・複雑な推論まで幅広く対応する。
Amazon SageMaker HyperPod、分散トレーニング向けギャングスケジューリングに対応
Amazon SageMaker HyperPodのタスクガバナンスにギャングスケジューリング機能が追加された。分散トレーニングジョブに必要なすべてのPodが準備完了してから訓練を開始することで、部分的なジョブ実行によるリソース浪費やデッドロックを防止する。EKSオーケストレーターベースのHyperPodクラスターで、15のAWSリージョンで利用可能。
Amazon SageMaker Unified Studio、Identity Centerドメインでサーバーレスワークフローに対応
Amazon SageMaker Unified StudioがIdentity Centerドメインでサーバーレスワークフローをサポートするようになりました。これまでサーバーレスワークフローはIAMベースのドメインのみの対応でしたが、Identity Centerドメインユーザーも利用可能になります。Airflowインフラストラクチャのプロビジョニングと管理なしに、Apache Airflowを使用してデータ処理タスクをオーケストレーションできます。
Amazon SageMaker Unified Studioがノートブックのインポート/エクスポート機能と開発者向け加速機能を追加
Amazon SageMaker Unified Studioがノートブックのインポート/エクスポート機能を追加し、JupyterLabなどの他のプラットフォームからの移行が容易になりました。.ipynb、.json、.pyの形式に対応し、セルタイプとメタデータが保持されます。同時に開発者向けの加速機能として、セルの並び替え、カスタム名の付与、キーボードショートカット、マルチラインSQL実行に対応しました。
Amazon SageMaker Data Agentがチャート機能と具体化ビュー対応を追加
Amazon SageMaker Data Agentがインタラクティブなチャート生成機能、Snowflakeデータソースに対するSQL分析、具体化ビュー管理に対応しました。自然言語プロンプトのみで、データ探索、結果の可視化、クエリパフォーマンスの最適化を実現し、コード作成なしで完全な分析ワークフローが可能になります。
Partner Revenue Measurement が AWS Marketplace Metering に対応
AWSはPartner Revenue MeasurementがAWS Marketplace MeteringでAMIおよびML製品に対応したことを発表しました。パートナーは顧客がAWS Marketplace経由でAMIやML製品を購入・利用する際のAmazon ECおよびAmazon SageMakerのサービス消費を自動的に測定できるようになります。追加実装なしに、パートナーが自社ソリューションのAWSサービス利用への影響を正確に可視化できます。
Amazon SageMaker Unified StudioでAWS Glueジョブ向けのCloudWatchメトリクス監視が利用可能に
Amazon SageMaker Unified StudioがAWS Glueジョブの監視機能を強化し、CloudWatchメトリクスをジョブログと同じインターフェース内で表示できるようになりました。DPU使用率、メモリ消費、CPU負荷、データ移動サイズなどのリソース利用パターンをログ出力と相関させることで、ETLパイプラインの問題診断が高速化します。メトリクスとログを統合することで、問題解決時間(MTTR)を大幅に削減し、運用効率が向上します。
Amazon SageMaker Data AgentがQuery Editorで利用可能に
Amazon SageMaker Unified StudioのQuery Editorで、Data Agentが新たに利用できるようになりました。自然言語からSQL クエリを生成したり、失敗したクエリをデバッグしたり、データを対話的に探索できます。これにより、複雑なJOINや集計を手動で記述することなく、質問から実行可能なSQLまで素早く生成できるようになります。
Amazon SageMaker StudioがKiroとCursor IDEのリモート接続に対応
AWSは、KiroとCursor IDEからAmazon SageMaker Studioへのリモート接続機能を新たに提供開始しました。データサイエンティストやMLエンジニアは、自分好みのローカルIDE環境(仕様駆動開発、会話型コーディング、自動機能生成機能を含む)を使いながら、SageMaker Studioのスケーラブルなコンピュートリソースにアクセスできます。AWS Toolkitエクステンションを使って認証し、数クリックで接続するだけで、ローカルとクラウドの間での頻繁な切り替え(コンテキストスイッチ)を排除でき、単一環境で統合的なAI/ML開発が可能になります。
Amazon SageMaker Unified StudioがCursor IDEのリモート接続に対応
AWS Toolkitを使用して、Cursor IDEからAmazon SageMaker Unified Studioへのリモート接続が可能になりました。ローカルのCursorのカスタマイズ設定やAI機能を保ったまま、SageMakerのスケーラブルなクラウドコンピュートリソースにアクセスできます。ローカル開発環境とクラウドインフラの間の行き来がなくなり、AI支援開発ワークフローを1つの統合環境で実現できるようになります。
AWS Batch、SageMaker Training ジョブのクォータ管理とプリエンプション機能をサポート
AWS Batch は SageMaker Training ジョブに対してクォータ管理とジョブプリエンプション機能を追加しました。これにより、チームやプロジェクト間で計算リソースを効率的に割り当て・共有できます。GPU容量を使用する場合、優先度の高いトレーニングジョブを優先し、低優先度のワークロードを自動的に中断することが可能になります。
Amazon SageMaker AIが12個の追加モデルに対応したサーバーレス強化学習ファインチューニング
Amazon SageMaker AIが12個の新しいオープンウェイトモデルに対応し、インフラ構築・管理なしでモデルのカスタマイズと強化学習ファインチューニングが可能になりました。Qwen、DeepSeek、Meta Llamaなどの最新モデルが対応され、SFT、DPO、RLVR、RLAIFなど複数のファインチューニング手法が利用できます。使用量に応じた従量課金で、複雑なドメイン固有タスクへのモデル適応が容易になります。
Amazon SageMaker HyperPod、Slurm対応クラスターの継続的プロビジョニングに対応
Amazon SageMaker HyperPodがSlumオーケストレーターを使用するクラスターに対して継続的プロビジョニング機能を拡張しました。これにより、インスタンスグループの一部が完全にプロビジョニングされなくても、利用可能なインスタンスでトレーニングジョブをすぐに開始できるようになりました。複数インスタンスグループの同時スケーリングが可能になり、マニュアル介入なしでクラスターが目標規模に到達することを保証します。
AWS Config、75個の新しいマネージドルールを発表
AWS Configが、セキュリティ、耐久性、運用などの様々なユースケースに対応した75個の新しいマネージドルールをリリースしました。AWS Amplify、Amazon SageMaker、Amazon Route 53などのサービスを含む、より広範なAWS環境のガバナンスが可能になります。これらのルールはConformance Packsを使用してアカウント全体または組織全体にデプロイでき、複数アカウントのガバナンスが簡素化されます。
Amazon SageMaker Unified Studioがカスタムメタデータフィルター機能を追加
Amazon SageMaker Unified Studioにカスタムメタデータ検索フィルターが追加されました。組織固有の属性(ビジネス地域、データ分類、研究名など)を使用してカタログ検索結果を絞り込むことができるようになりました。複数フィルターの組み合わせやセッション間でのフィルター選択の保持も可能で、必要なデータアセットをより迅速に発見できます。
Amazon SageMaker Unified Studioがデータ系統の集約ビューに対応
Amazon SageMaker Unified Studioにデータ系統(データリネージ)の集約ビューが追加されました。これにより、データセットに貢献するすべてのジョブを一つの画面で確認でき、データ変換と依存関係の全体像を把握できます。新しいQueryGraph APIを使用することで、メタデータとビジネスコンテキストを含むリネージ情報をプログラムから取得することも可能になりました。
SageMaker Training Plansで既存の容量コミットメント延長が可能に
SageMaker Training Plansで予約したGPU容量を、ワークロードの再設定なしに延長できるようになりました。1日単位で最大14日間、または7日単位で最大182日間の延長が可能で、APIまたはSageMaker コンソールから簡単に申し込めます。延長購入後、ワークロードは中断なく継続実行されるため、長期化したAIトレーニングに対応できます。
SageMaker HyperPodがアイドルリソース共有による動的クラスタ利用をサポート
Amazon SageMaker HyperPodのタスク統治機能が、保証されたクォータを超える未割り当てコンピュートリソースの動的共有をサポートするようになりました。管理者はアクセラレータ、vCPU、メモリなどのリソースタイプごとに借用制限を設定できます。高額なコンピュートインスタンスのアイドル化を自動的に検出して効率的に再配置することで、クラスタ利用率の向上と公平なリソース分配が実現します。
Amazon SageMaker Unified StudioのVisual ETLでデータプレビュー高速化
Amazon SageMaker Unified StudioはVisual ETLに新しいデータプレビューv2.0を導入し、ほぼ瞬時の結果表示を実現しました。ブラウザ内クエリエンジンを使用してデータをローカル処理することで、サーバー側のSparkセッション起動が不要になり、追加コスト無しで約1秒で各変換の出力を確認できます。S3、Redshift、Snowflakeなど多数のデータソースに対応し、開発者はより迅速にETLジョブを反復開発できるようになります。
Amazon SageMaker Unified Studio、IAMベースドメインのライトモード対応を発表
Amazon SageMaker Unified Studioでライトモードのサポートが追加されました。ユーザーはプロフィール設定の「customize appearance」からダークモードとライトモードを自由に切り替えられます。ブラウザとデバイス間で設定が保持されるため、一貫した開発環境を実現できます。