フリーのデータ分析ツールとして Gretl というのがあるが、「いかにも学者向け」という感じで、いまいちやる気がおきなかった。
2018/9 に新刊発行されていた
を読んでいたら、KNIME Analytics Platform | KNIME というノードベースのデータ分析ツールが紹介されていて、これなら片手間で自分にもできそうだと思った。
ダウンロードすると、ローカルにサンプルの分析ワークフローが10種類含まれていた。
- 基本 Basic が3種類
- 顧客分析 Customer Intelligence が4種類
- 小売 Retail が2種類
- ソーシャルメディア Socail Media
1つめのワークフローのノードはこんな感じに定義されていた。
- データ読み込み
欠測値の補完、異常時の削除などの前処理ルールも定義できる - 色でデータ行にラベルを付ける
- データを学習用と検証用に分割し、学習し予測する
- 予測の精度を検証する
という分析の基本がワークフロー・ノードベースでグラフィカルに定義できて、実行できるという一貫性が素晴らしい。
それぞれは Excel でもがんばればできるが、試行錯誤も考えると、全体としてはこちらのほうが便利だ。
入力データについての記述統計量、生データのダンプ、可視化も出せる。
可視化については、常識的なグラフは大体ある。
- 画面上に説明があるとはいえ、すべて英語
- 分析手法についての細かい説明や、分析手法ごとの使い方説明なども Learning-hub にはあるものの英語
なので、
で、典型的な分析パターン別の基本的な定義手順を予習(もちろん日本語)しておいたほうがいいだろう。