Skip to main content

Microsoft Azure Data Lake Store

接続タイプ

Alteryxツール。最新のバージョンは、 Alteryx Marketplace から入手できます。

ドライバーの詳細

選択したログイン方法によっては、Alteryx Azure Data Lakeツールを使用して接続を確立する前に、管理者がAzure Data LakeとAzure Active Directoryへのアクセスを設定することが必要な場合があります。

サポートのタイプ

読み取り、書き込み

バージョン

説明

v2.5.0

  • Alteryx DesignerおよびServer 2021.4.2パッチ6、2022.1パッチ4以降と互換性があります。

  • AMP Engineが必要です。

  • Alteryx Serverでワークフローを実行するにはDCMに保存された資格情報が必要です。

  • 後で処理するファイルをローカルにダウンロードするオプションが追加されました。

  • Gen1認証のサポートは終了しました。

  • DCM認証に関連する問題は修正されました。(TPM-2462、TPM-2176)

  • ADLS入力がNull値を正しく読み取れない問題は修正されました。(TPM-3098、TPM-2659、TPM-2229)

  • ADLSツールで、1以外の行でデータの処理を開始するよう設定されているとき、ワークフローを実行できない問題は修正されました。(TPM-2609、TPM-2277)

  • 単一ループのチャンクを処理すると、ADLS入力が他のデータを無視する問題は修正されました。 (TPM-2781)

  • ADLS入力で無効な形式のCSVファイルエラーが返される問題は修正されました。(TPM-2175)

  • ADLS出力で日付の値が変わる問題は修正されました。(TPM-1928)

v2.4.3

  • Alteryx DesignerおよびServer 2021.4.2パッチ4、2022.1パッチ2以降と互換性があります。

  • AMP Engineとのみ互換性があります。

  • DCM のサポートを追加しました。

    • このコネクタをAlteryx Serverで実行するには、DCMが必要です。

  • FIPS対応。

  • Windows証明書ストアに対して、SSL/TLS検証が実行されるようになりました。

  • 書き込みパフォーマンスと安定性が向上しました。

  • 可変アップロードチャンクサイズを変更してメモリ消費量とパフォーマンスを調整するオプションを追加しました。

  • セルの文字数が255を超える場合にXLSXデータが切り捨てられる問題を修正しました。

  • SSL証明書の非Unicode文字に関する問題を修正しました。

  • 引用文字フィールドが [ なし ] に設定されているにもかかわらず、ADLS出力ツールで二重引用符文字が追加される問題を修正しました。 (TPM-1964)

  • セキュリティの向上。

v2.2.0

  • 出力でカスタムCSV区切り文字を指定できるようになりました。

  • XXEの潜在的な脆弱性を修正しました。

v2.1.0

  • ユーザーインターフェースを新たに改良しました。

  • 軽微な問題を修正しました。

  • Alteryx DesignerおよびServerバージョン2021.2以降と互換性があります。

v2.0

  • UIのアップグレードとエラー処理の改善

  • Gen2ストレージのサポートを追加しました

  • Azure Government、China Cloud、カスタムエンドポイントのサポートを追加しました

  • 共有キー認証をサポート

  • パブリックアプリケーションのサポート(独自およびAlteryx)

  • マルチテナントのサポート

  • Excel入出力のサポート

  • .csvファイルの読み取りと書き込みにカスタム区切り文字を使用する機能を追加しました

  • Alteryx DesignerおよびServerバージョン2019.3以降と互換性があります。

v1.1.0

  • エンドユーザー認証エラーを修正しました

  • ユーザーがエンドユーザー認証用のリダイレクトURIを指定できるようにしました

v1.0.2

  • コードページオプションを更新しました。

  • 同じ言語のエンコーディング(例: 「言語」 -> 「言語(特定のコード)」)とアルファベット順のエンコーディングを区別するようにしました。

  • ユーザーが出力ツールでCSVファイルのエンコーディングを指定できるようになりました。

  • 無効なストア名が指定された時のエラーメッセージを改善しました。

  • データ変換処理を改善し、フィールドに値がない場合にエラーではなく警告が表示されるという問題を解決しました。

  • ユーザーがストア名を変更した後に、表示されるファイル/フォルダーが更新されないエラーを修正しました。

  • 既定値の設定が優先されないことがある問題を修正しました。

  • Designer の異なるインストール/設定に対する権限の問題を回避し、スケジュールされたワークフロー機能をサポートするために、本番環境のログを無効にしました

v1.0.1

  • パッケージが正常にインストールされない問題を修正しました

v1.0.0

  • Microsoft Azure Data Lakeファイル入力とAzure Data Lakeファイル出力の初期リリース

接続に使用する Alteryx ツール

データ接続マネージャー

Azure Data Lake Storeツールのバージョン2.3.0以降は データ接続マネージャー をサポートしているため、資格情報を簡単かつ安全に保存できます。Azure Data Lake Storeへの接続を作成し、Azure Data Lake Storeツールを含むワークフローで保存された資格情報を簡単に再利用できます。Alteryx Serverで公開されたワークフローを正常に実行するには、保存された資格情報が必要です。

AMP Engineを有効にする

Azure Data Lake Storeツールのバージョン2.3.0以降を含むワークフローに対して AMP Engine が有効になっていることを確認します。

認証と権限

Gen1ストレージとGen2ストレージのAzure Data Lakeエンドポイントは異なり、認証中に、接続するストレージの種類を指定する必要があります。使用しているストレージの種類がわからない場合は、Azure管理者に問い合わせるか、 Microsoft Azureポータル で確認してください。

ヒント

  • ワークフローをサーバーまたはAAHに公開するには、サービス間認証タイプまたは共有キー認証タイプを使用します。こうすれば、リフレッシュトークンの有効期限が切れた後にワークフローを再アップロードする必要はありません。

  • メタデータのロードには時間がかかる場合があるため、詳細ユーザー設定([オプション] > [ユーザー設定] > [ユーザー設定の編集] > [詳細])で [自動設定を無効にする] を選択して、メタデータのロードを無効にすることができます。

Azure Data Lake Storeアカウント内のデータの読み取りと書き込みを行うための権限が付与されている必要があります。これらの権限がどのように割り当てられ、適用されるかについての詳細は、Microsoftの公式ドキュメントを参照してください。

シングルテナントとマルチテナント

シングルテナントアプリケーションは、登録したテナント (ホームテナントとも呼ばれます) でのみ使用できます。お客様または Azure 管理者は、Designer での認証時に使用するアカウントで、シングルテナント Azure アプリケーションとストレージを作成できます。マルチテナントアプリケーションは、ホームテナントと他のテナントの両方のユーザーが使用できます。

エンドユーザー (基本)

基本的なエンドユーザー認証は、DesignerでADLSデータにアクセスするための最も便利な方法です。Azure管理者に連絡して、組織のAzureテナントでパブリックAlteryxアプリケーションを許可してください。手順については、 Microsoftのドキュメント を参照してください。

テナント: 共通

Gen2 AlteryxアプリケーションのADLSクライアントID: 2584cace-63ff-47cb-96d2-d153704f4d75

このセットアップ後、通常のMicrosoft資格情報を使用してADLSデータにアクセスできるようになります。

エンドユーザー (上級)

高度なエンドユーザー認証は、シングルテナント認証とマルチテナント認証をサポートしており、パブリックアプリケーションとプライベートアプリケーションの両方で使用できます。

資格情報のセットアップについては Microsoftのドキュメント の説明を参照してください。

認証の設定

  • テナントID: AzureポータルからテナントIDを取得することも、[テナントID] フィールドに「common」と入力してAzureの自動検出メカニズムを利用することもできます。複数のテナントにアクセスする場合は、テナントIDを指定できます。マルチテナントの詳細については、「シングルテナントとマルチテナント」セクションを参照してください。

  • クライアントID: Azureアプリケーションの固有識別子。クライアントIDフィールドは必須です。

  • クライアントシークレット: アプリケーションがプライベートである場合は、クライアントシークレットの指定は必須です。パブリックアプリケーションを使用している場合は、フィールドを空白のままにしてください。

サービス間

サービス間認証は、サーバーとハブでのワークフローの公開に適しています。

資格情報のセットアップについては Microsoftのドキュメント の説明を参照してください。

共有キー

注記

  • 共有キー認証は、Gen2ストレージでのみ使用できます。

  • この認証方法は2020.4リリースから導入されたため、サーバーへの公開は、DesignerおよびServerのバージョン2020.4以降でのみ使用できます。

Azure ストレージアカウントを使用すると、マイクロソフトは 2 つのアクセスキーを生成します。これらのアクセスキーを使用して、共有キーの承認を介した Azure Data Lake へのアクセスを承認できます。共有キーとその使用方法の詳細については、 Microsoftのドキュメント を参照してください。

Azureナショナルクラウドとカスタムエンドポイント

v2.0リリース以降、ADLSコネクタはカスタムエンドポイントへのアクセスをサポートします。米国と中国のナショナルクラウドのURLは、[認証局オーソリティエンドポイント] フィールドのコネクタの認証画面で選択できます。

カスタムMicrosoft Azure APIアプリケーションのセットアップ

このツールのカスタムAPIアプリケーションを設定するには、ガイドを参照してください。Microsoft Azure APIアプリケーションのセットアップ

データの選択と設定オプション

[データ] タブでは、使用するデータを指定できます。

  1. [ ストレージアカウント名 ] を指定します。このストレージは、[認証] ページで選択したものと同じタイプ(Gen1、Gen2)である必要があります。

  2. Gen2 ストレージの場合は、 ファイルシステム名 を指定します。

  3. Gen2のストレージとファイルシステムを選択したら、読み取りまたは書き込みを行うファイルのパスを設定できます。[ファイルパス] フィールドに直接入力するか、ファイルブラウザを使用することで、パスを指定できます。Azure Data Lakeファイル出力ツールでは、同じ仕組みを使用して新しいファイルを作成できます。

  4. Excelファイルの場合、ファイルブラウザ下にある [シート] フィールドでシート名を指定できます。空のままにすると、自動的に最初のシートが選択されます。新規ファイルの場合、シート名は既定の「Sheet」になります。

ファイル形式と設定

ADLSツールは、.csv、.avro、.json、.xlsxのデータ形式をサポートします。

  • CSVファイル

    • 読み込み

    • 書き込み: 既存のCSVファイルに上書きまたは追加できます。

ヒント

データ入力ツールやデータ出力ツールとの互換性のために、エンコードは UTF-8 SIG にする必要があります。

  • JSONファイル

    • 読み込み: JSONファイルを正しく読み込むには、 BOMなしのUTF-8エンコード を使用する必要があります。

    • 書き込み: JSONファイルに書き込む場合のデータ型変換には、制限があります。10進数、日時、時刻のセルは 文字列 として出力されます。

  • Avroファイル

    • 読み込み

    • 書き込み

  • Excelファイル

    • 読み取り : すべてのデータはV_Wstringとして読み取られます。

    • 書き込み

追加の詳細

  • 別のアカウントで作成したフォルダーにアクセス(読み取り/書き込み)できない場合は、権限の問題があります。

  • トークンが取り消された可能性があることを示すエラーが発生した場合は、ログアウトしてから設定パネルに再度ログインし、再認証を行う必要があります。

注記

トークンの有効期間プロパティは、システム管理者が設定できます。

Azure Data Lake Explorerは、Azure Data Lake Storeアカウント内のデータの読み取りと書き込みの権限を付与する必要があります。これらの権限がどのように割り当てられ、適用されるかについての詳細は、Microsoftの公式ドキュメントを参照してください。

制限事項

Azure Data Lake Storeツールのバージョン2.5.0以降、Gen1認証はサポートされません。

JSONとAvroは、UTF-8のみです。

JSONでは、データ型に対して大きすぎる数値を保存しようとすると、サイレント変換エラーが発生します。

現在、Excelファイルへの書き込みは、ファイル全体の上書きのみに制限されています。

バイト型のフィールドを持つAvroファイルはサポートされていないため、インポート時に失敗します。

Alteryxワークフローの浮動小数点数フィールド値は、出力先のAvroファイルでは倍精度浮動小数点数値型に変換されます。

Microsoft Azure Data Lake、OneDrive、Dynamics CRMコネクタは、EメールやパスワードなどのMicrosoftユーザー資格情報による認証をサポートしています。対話型ワークフローでは、現時点では、これらのコネクタ間で異なるMicrosoftユーザーアカウントを使用して認証することはできません。この制限は、スケジュールされたワークフローには影響しません。これらのいずれかのコネクタに対してMicrosoftユーザーアカウントで認証されており、別のコネクタに対して別のMicrosoftユーザーアカウントで認証しようとすると、エラーメッセージが表示されます。この問題を解決するには、次のいずれかの推奨事項に従ってください。

  • Azure Active Directory管理者は、1つのユーザーアカウントに必要な権限を付与します。これで、ワークフローを構築するユーザーが、そのワークフロー内の必要なサービスにアクセスできる1つのユーザーアカウントを持つことができます。

  • ログインする前に、別のMicrosoftユーザーアカウントで認証されているコネクタからログアウトしてください。

  • エンドユーザー認証は、できるだけ使用しないでください。Azure Data Lakeのコネクタでサービス間認証を使用し、Dynamics CRMのコネクタでアプリケーションログイン認証を使用してください。

Desktop Automation (Scheduler)は、このコネクタではサポートされていません。