データウェアハウスにおけるスライスとダイスの主な違いは、スライスが与えられたデータキューブから特定の 1 つのディメンションを選択して新しいサブキューブを提供する操作であるのに対して、ダイスは与えられたデータキューブから 2 つ以上のディメンションを選択して新しいサブキューブを提供する操作である点です。
データウェアハウスは、意思決定を支援するレポーティングやデータ分析に使用されるシステムです。
まず、複数のソースからデータを抽出し、変換してウェアハウスにロードします。
次に、多次元データモデルに基づくオンライン分析処理サーバー(OLAP)を使用して分析を行う。
OLAPには、ロールアップ、ドリルダウン、スライス&ダイス、ピボット(回転)など、さまざまな操作があります。
ロールアップはデータキューブの集計に、ドリルダウンはロールアップの逆の操作に、ピボットはデータ軸を回転させて別の表現にするために使用される。
この記事では、スライスとダイスについて説明します。
データウェアハウスにおけるスライスとは?
OLAP キューブとは、データの多次元配列です。
階層的な次元を持つキューブとしてのデータは、分析に役立つ。
整列されたデータは可視化しやすく、生産性が向上する。
図1:OLAPスライシング
スライシングは、ディメンションの1つの値を選択し、キューブのサブセットを構築する。
上の図では、2005 年と 2006 年の販売地域と製品がデータキューブからスライスされています。
データウェアハウスにおけるダイスとは?
ダイスは、複数のディメンジョンの特定の値を選択し、新しいサブキューブを生成します。
以下に例を示します。
図 2: OLAP ダイシング
上の図によると、元の範囲をカバーする限られた数の製品カテゴリ、時間、および地域ディメンジョンの売上高を使用して、新しいキューブが形成されます。
データウェアハウスにおけるスライスとダイスの違い
定義
スライスとは、キューブの 1 つのディメンジョンに 1 つの値を選択することで、キューブの長方形のサブセットを選択 し、より少ないディメンジョンで新しいキューブを作成する操作です。
ダイスとは、アナリストが複数のディメンジョンの特定の値を選択することで、サブキューブを作成する操作です。
このように、データウェアハウスにおけるスライスとダイスの主な違いについて説明します。
使用方法
データウェアハウスにおけるスライスとダイスのもう一つの違いは、その使用方法です。
スライスは、指定されたキューブから 1 つの特定のディメンジョンを選択し、新しいサブキューブを提供するために使用されま す。
ダイスは、指定されたキューブから 2 つ以上のディメンジョンを選択し、新しいサブキューブを提供するために使用されま す。
結論
スライスとダイスは、データウェアハウスのOLAP戦略で使用される2つの操作です。
データウェアハウスにおけるスライスとダイスの主な違いは、スライスが与えられたデータキューブから特定の 1 つのディメンションを選択して新しいサブキューブを提供する操作であるのに対して、ダイスは与えられたデータキューブから 2 つ以上のディメンションを選択して新しいサブキューブを提供する操作であることです。