Skip to main content

Blue icon with sigma. 集計In-DBツール

集計In-DBを使用すると、グループ化、合計、カウント、重複を除いたレコードのカウントなどによってデータベース内のデータを集計できます。出力には、計算結果のみが含まれます。

インデータベースは、データベースからデータを移動することなく大きなデータセットに対してブレンディングと分析を可能にし、従来の分析メソッドに比べて大幅なパフォーマンス向上を実現します。インデータベースツールカテゴリの詳細については、 インデータベースの概要 を参照してください。

ツールの設定

入力からのデータフィールドがフィールドセクションに表示されます。集計を実行するフィールドを選択します (Shiftキーを押しながらクリックして複数のフィールドを選択し、同じ集計を実行します)。

  1. 複数のフィールドを選択するには、右にある 選択 メニューを使用します。選択肢には、次のものが含まれます。

    • すべて : アクション に適用するすべてのフィールドを選択します。

    • なし : すべてのフィールドを解除します。

    • 数値 : アクション に適用する数値フィールド(整数、固定小数点、単精度浮動小数点数、倍精度浮動小数点数)のみを選択します。

    • 文字列 : アクション に適用する文字列フィールドのみを選択します。

    • 空間 : アクション に適用する空間フィールドのみを選択します。

  2. フィールドを選択した状態で、[ 追加 ] ボタンを選択します。選択を行うと、 アクション セクションに表示されます。選択されたデータフィールドのタイプに応じて、異なる要約関数を使用できます。集計関数は..

    • グループ 化 : 指定したフィールドの同じ値を持つデータベース レコードを 1 つのレコードに結合します。次に、グループ内のレコードから得られたすべてのデータが集計されます。(非BLOB または空間オブジェクトには、このオプションがあります) グループ化 フィールドを指定しない場合は、ファイル全体が要約されます。

    • カウント : グループ内のレコードをカウントします。

    • 重複を除いてカウント : グループ内の一意のレコードをカウントします。

    • Null以外のカウント : グループ内の [Null] 以外のレコードをカウントします。Nullフィールドは、このフィールドに値が設定されていないことを意味します。これは、0または空の文字列を持つこととは異なります。

    • Nullをカウント : グループ内の [Null] のレコードをカウントします。

    • 最小 : 最小値を返します。

    • 最大 : 最大値を返します。

    • 数値 集計関数には..

      • 合計 : グループの合計値を返します。合計は、グループのすべての値を加算することで計算されます。

      • 平均 : グループの平均値を計算します。平均は、すべての値の合計を値の総数で割って計算されます。

      • 標準偏差 : グループの標準偏差を計算します。標準偏差は、統計で使用されるデータの散らばり具合 (ばらつき) の大きさを表す指標です。

      • 分散 : グループのバリエンス (分散) を計算します。分散は、標準偏差を取り込み、それ自体に時間 (StdDev ^ 2) を掛けることによって計算されます。

  3. アクション セクションから、フィールドを選択し、[上へ]、[下へ]、および [削除] ボタンを使用して、出力のフィールドの順序を指定できます。

  4. フィールドの名前を変更するには、 出力フィールド名 列に新しいフィールド名を入力します。