Amazon SageMaker Unified Studio NotebooksがEMR Serverlessに対応
Amazon SageMaker Unified Studio Notebooks now support EMR Serverless
概要
Amazon SageMaker Unified Studio NotebooksがApache Spark ConnectによるAmazon EMR Serverlessに対応し、データエンジニアとアナリストがSparkランタイムを柔軟に選択できるようになりました。Athena Sparkに加えてEMR Serverlessをランタイムとして利用でき、要件に応じて最適なエンジンを選択できます。NotebookのサイドパネルからSparkランタイムを選択でき、PySpark及びSpark SQLの実行が可能になります。
何が変わったか
- ・SageMaker Unified Studio NotebooksでAmazon EMR Serverlessを新たにSparkランタイムとしてサポート
- ・NotebookサイドパネルからSparkランタイムを選択可能で、PythonセルとSQLセルの両方に同一ランタイムが適用される
- ・SageMaker Data AgentがEMR Serverlessに対応し、自然言語プロンプトからコードと実行計画を生成可能
- ・事前初期化容量(pre-initialized capacity)によるセッション開始時間の改善
- ・全対応エンジンの統合Spark UIで統一的な監視が可能
- ・VPC接続サポートによるネットワーク分離が必要なワークロードへの対応
影響
既存のSageMaker Unified Studioユーザーにとって新しい選択肢が追加されるため、移行の必要性はありませんが、EMR Serverlessの利点を活用する場合はランタイム選択を検討する必要があります。
対象ユーザー
SageMaker Unified Studioを使用するデータエンジニアとデータアナリスト、インタラクティブ分析とデータエンジニアリングワークロードを実行するユーザー
まとめ
SageMaker Unified Studio NotebooksでEMR Serverlessが新たにサポートされ、Apache Spark Connectを通じてPySpark及びSpark SQLの実行と統合監視が可能になった。
原文タイトル
Amazon SageMaker Unified Studio Notebooks now support EMR Serverless
AWS公式アナウンスを読む →