データサイエンスに必須!豊富なデータの加工・分別ツール
データシートの色分け表示
・ 連続変量⇒ データバー、
仕切り値の登録で色分け表示。
・ 段階型変数⇒ 段階色分け。
・ カテゴリ変数⇒ 色分け。
変数組み換え機能
カテゴリ数の多い変数の調整、仕切り値登録後の
連続変量を段階型・カテゴリ型に変換。
行データの縦表示機能
変数が多い場合に
見通しが悪かった
行データ(レコード)を、
見やすく縦表示。
自動グラフが連動する
データシートのマーキング
データを選択してマークボタンを押せば、
グラフ上にマーク
行・列フィルタ機能
・ 列フィルタで、分析対象の変数や群を
選択・配置順を設定
・ 行フィルタで特定の値を除外、
仕切り値の登録があれば群別除外に対応
・ フィルタ指定列の先頭をマウスで
ポイントすると除外値一覧を表示。
分布型分析パネルで変数変換指定、
極端値を判定
・ べき乗変換の登録と、それに対応した
度数分布図・正規確率紙の作成
・ 正規性検定機能
・ べき乗変換対応の95%信頼区間の算出
・ 極端値の判定(mean±SD法、Smirnov-Grubbs法、
Tukey法)と除外設定
貼り付け時に数値変数内に、文字の混入があれば警告。修正・削除に対応。
(但し、ミス比率が高いと機能しません)
入力ミスの 自動判定と修正
その他の便利ツール
・データ編集操作のUndo, Redo対応
・数値変数の仕切り値登録
・ダミー変数作成
・四捨五入
・ブロック入力
・簡易表計算機能
・データ形式の強制変更
・データシートの行列入れ換え
・データシートのインポート、
エキスポート
ビジュアルクロス集計
エクセルのピボット機能を自動グラフに連動させました。行要因による分類(複数要因を指定可)、列要因による分類、頁要因による分類の指定により3次元のクロス集計図を作成できます。さらには、集計変数を指定すると、その変数の分布を分類毎にグラフ化して提示します。もちろん、通常のクロス集計表の作成や集計後の検定にも対応しています。数値型変数の場合も、仕切値の登録で簡単にクロス集計を行えます。
行分類には性別を、列分類には3分割指定したBMI(肥満度)を、そして集計変数に脂質(HDL-C)をとって得た2次元クロス集計図です。左下には対応するクロス集計表(平均値)が表示されています。
行分類として4分割した年齢を、列分類に喫煙度を指定すると2次元クロス集計図で表示されます。この例では、対応するクロス集計表を表示し、直接検定処理を行っています。
・ ビックデータを全スキャンし、変数別にデータをマッピングしてグラフ化。
・ データ・クリーニングのため、欠測値比率やSD=0に基づく無効変数の除外、
行フィルタによる入力ミスや極端値の除外に対応。
・ 調整後データから一定数をランダム抽出(サンプリング)し、統計分析をStatFlex上で高速実行。
(注)テキスト形式のソースデータにのみ対応。データ数は無制限。全スキャン時間はデータ数に比例して増加。
変数の最大数は65530、遺伝子解析情報など“ビッグ・パラメータ”タイプのビッグデータでは利用不可。