データサイエンスに必須!豊富なデータの加工・分別ツール

 
データシートの色分け表示

・ 連続変量⇒ データバー、

              仕切り値の登録で色分け表示。

・ 段階型変数⇒ 段階色分け。 

・ カテゴリ変数⇒ 色分け。

変数組み換え機能

カテゴリ数の多い変数の調整、仕切り値登録後の

連続変量を段階型・カテゴリ型に変換。

行・列フィルタ機能

・ 列フィルタで、分析対象の変数や群を

   選択・配置順を設定

・ 行フィルタで特定の値を除外、

   仕切り値の登録があれば群別除外に対応

・ フィルタ指定列の先頭をマウスで

   ポイントすると除外値一覧を表示。

行データの縦表示機能

変数が多い場合に見通しが

悪かった行データ(レコード)を、

見やすく縦表示。

自動グラフが連動する
データシートのマーキング

データを選択してマークボタンを押せば、

グラフ上にマーク

・データ編集操作のUndo, Redo対応

・数値変数の仕切り値登録

・ダミー変数作成

・四捨五入 

・ブロック入力

・簡易表計算機能

・データ形式の強制変更

・データシートの行列入れ換え

・データシートのインポート、

    エキスポート

・ べき乗変換の登録と、それに対応した

   度数分布図・正規確率紙の作成

・ 正規性検定機能

・ べき乗変換対応の95%信頼区間の算出

・ 極端値の判定(mean±SD法、Smirnov-Grubbs法、

   Tukey法)と除外設定

分布型分析パネルで変数変換指定、
極端値を判定
入力ミスの 自動判定と修正

貼り付け時に数値変数内に、文字の混入があれば警告。修正・削除に対応。

(但し、ミス比率が高いと機能しません)

その他の便利ツール
 
 
 
 
 
 

データ予備分析ツール

 
汎用クロス集計機能

・ 異なる変数型が混在しても、全変数に対しクロス集計と群間差検定を

   一括して自動実行。

・ 分類用変数は3段階まで指定可。

一括クロス集計

ビジュアルクロス集計

行分類には性別を、列分類には3分割指定したBMI(肥満度)を、そして集計変数に脂質(HDL-C)をとって得た2次元クロス集計図です。左下には対応するクロス集計表(平均値)が表示されています。

エクセルのピボット機能を自動グラフに連動させました。行要因による分類(複数要因を指定可)、列要因による分類、頁要因による分類の指定により3次元のクロス集計図を作成できます。さらには、集計変数を指定すると、その変数の分布を分類毎にグラフ化して提示します。もちろん、通常のクロス集計表の作成や集計後の検定にも対応しています。数値型変数の場合も、仕切値の登録で簡単にクロス集計を行えます。

行分類として4分割した年齢を、列分類に喫煙度を指定すると2次元クロス集計図で表示されます。この例では、対応するクロス集計表を表示し、直接検定処理を行っています。

 
ビッグデータ分析支援ツール

・ ビックデータを全スキャンし、変数別にデータをマッピングしてグラフ化。

・ データ・クリーニングのため、欠測値比率やSD=0に基づく無効変数の除外、

   行フィルタによる入力ミスや極端値の除外に対応。

・ 調整後データから一定数をランダム抽出(サンプリング)し、統計分析をStatFlex上で高速実行。

 

(注)テキスト形式のソースデータにのみ対応。データ数は無制限。全スキャン時間はデータ数に比例して増加。

変数の最大数は65530、遺伝子解析情報など“ビッグ・パラメータ”タイプのビッグデータでは利用不可。

BigDataツールの使い