Azure

Azure Synapse Analytics で分析を行う - ①ワークスペースの作成

はじめに

Azure Synapse Analyticsはデータ分析基盤のひとつとして利用できます。そこで分析を何回かに分けてチュートリアルを行っていきます。

チュートリアル:Azure Synapse Analytics の使用を開始する - Azure Synapse Analytics | Microsoft Learn
チュートリアル:Azure Synapse Analytics の使用を開始する - Azure Synapse Analytics | Microsoft Learn

このチュートリアルでは、Azure Synapse Analytics を設定して使用する基本的な手順について説明します。

docs.microsoft.com

最初に行うのはワークスペースの作成を行っていきます。これはデータ、分析の種類に関わらず最初に行う作業です。

ワークスペースの作成

ワークスペースの作成は非常に簡単に行えます。

クイックスタート: 概要 - Synapse ワークスペースを作成する - Azure Synapse Analytics | Microsoft Learn
クイックスタート: 概要 - Synapse ワークスペースを作成する - Azure Synapse Analytics | Microsoft Learn

このチュートリアルでは、Synapse ワークスペース、専用 SQL プール、サーバーレス Apache Spark プールを作成する方法について説明します。

docs.microsoft.com

本稿ではワークスペースの作成とサンプルデータの配置を行います。

ワークスペースの作成を行います。情報を入力します。

  • リソースグループ:任意
  • マネージドリソースグループ:空白
  • ワークスペース名:一意
  • 地域:任意
  • Data lake Storage Gen2を選択する:サブスクリプションから
    • アカウント名:一意
    • ファイルシステム名:users(任意)

以上で作成します。

作成後にSynapse Studioを立ち上げます。

基本的にSynapse Studioで操作します。

Synapse Studioの起動画面

 

サンプルデータをストレージアカウントに配置します。

サンプルデータはドキュメント内にあるものを利用します。

https://azuresynapsestorage.blob.core.windows.net/sampledata/NYCTaxiSmall/NYCTripSmall.parquet

ストレージアカウントのコンテナーのusersに配置します。

あとはSynapse Studioで確認します。

データからリンク済みを開きます。その中にストレージアカウントがあるのでコンテナーを開きます。アップロードしたファイルが確認できます。

以上でSynapseワークスペースの完了です。ワークスペースの作成は非常に簡単だったと思います。

まとめ

Synapse Analyticsを利用するためにワークスペースを作成しました。次回は実際に分析を行っていきます。

-Azure
-