AWS

タグ:

#Qwen

2件のアップデート

SageMaker2026年4月17日

SageMaker JumpStartが基盤モデルの最適化デプロイに対応

SageMaker JumpStartで、基盤モデルを用途別の最適化設定でデプロイできる機能が追加された。コスト最適・スループット最適・レイテンシ最適・バランスの4つのターゲットから選択でき、デプロイ前にP50レイテンシ・TTFT・スループットを確認できる。30以上のモデル(Llama 3.1/3.2、Phi-3、Mistral、Qwen、Gemma、Falcon3など)に対応する。

SageMaker2026年4月13日

NVIDIA Nemotron-3-Super-120B・Qwen3.5-9B/27BがSageMaker JumpStartで利用可能に

NVIDIA Nemotron-3-Super-120B、Qwen3.5-9B、Qwen3.5-27B の3モデルが Amazon SageMaker JumpStart で利用可能になった。Nemotron-3-Super-120B はMamba-2とMoEを組み合わせたハイブリッドLatentMoEアーキテクチャで、エージェンティック推論に最適化。Qwen3.5 は多言語コーディング・指示追従から、拡張されたコンテキスト理解・複雑な推論まで幅広く対応する。