Amazon SageMaker AIが12個の追加モデルに対応したサーバーレス強化学習ファインチューニング
Amazon SageMaker AI now supports serverless reinforcement fine-tuning for 12 additional models
概要
Amazon SageMaker AIが12個の新しいオープンウェイトモデルに対応し、インフラ構築・管理なしでモデルのカスタマイズと強化学習ファインチューニングが可能になりました。Qwen、DeepSeek、Meta Llamaなどの最新モデルが対応され、SFT、DPO、RLVR、RLAIFなど複数のファインチューニング手法が利用できます。使用量に応じた従量課金で、複雑なドメイン固有タスクへのモデル適応が容易になります。
何が変わったか
- ・12個の新しいオープンウェイトモデル(gpt-oss-120b、Qwen2.5 72B/14B、DeepSeek-R1系、Meta Llama 3.2 3Bなど)がサポート対象に追加
- ・強化学習ファインチューニング手法としてRLVR(報酬ベース)とRLAIF(AI生成フィードバック)が利用可能
- ・サーバーレスでのモデルカスタマイズ実行に対応し、クラスタ構築や分散学習専門知識が不要
影響
MLエンジニアやデータサイエンティストは複雑な基盤構築なしに最新AIモデルのカスタマイズに集中でき、開発サイクルが大幅に短縮されます。エンタープライズユーザーは検証可能タスクの精度向上と安全性・品質の向上を同時に実現できるようになります。
対象ユーザー
MLエンジニアデータサイエンティスト開発者AI/機械学習エンジニアエンタープライズAIユーザー
まとめ
AWSが提供するサーバーレスモデルカスタマイズサービスの対応モデル・手法の大幅拡充により、AIモデル適応の民主化と運用負荷削減が実現されたといえます。
原文タイトル
Amazon SageMaker AI now supports serverless reinforcement fine-tuning for 12 additional models
AWS公式アナウンスを読む →