そういう、モデルなんです。

ビジネスモデル、3Dモデル、設計図、模型などの現状と動向を考察、関連書籍の紹介

ノードベースのデータ分析ツール KNIME(ナイム)

フリーのデータ分析ツールとして Gretl というのがあるが、「いかにも学者向け」という感じで、いまいちやる気がおきなかった。

2018/9 に新刊発行されていた 

AI、IoTを成功に導く データ前処理の極意

AI、IoTを成功に導く データ前処理の極意

 

を読んでいたら、KNIME Analytics Platform | KNIME というノードベースのデータ分析ツールが紹介されていて、これなら片手間で自分にもできそうだと思った。

ダウンロードすると、ローカルにサンプルの分析ワークフローが10種類含まれていた。

  • 基本 Basic が3種類
  • 顧客分析 Customer Intelligence が4種類
  • 小売 Retail が2種類
  • ソーシャルメディア Socail Media 

f:id:tombi-aburage:20190126110044p:plain

1つめのワークフローのノードはこんな感じに定義されていた。

  • データ読み込み
    欠測値の補完、異常時の削除などの前処理ルールも定義できる
  • 色でデータ行にラベルを付ける
  • データを学習用と検証用に分割し、学習し予測する
  • 予測の精度を検証する

という分析の基本がワークフロー・ノードベースでグラフィカルに定義できて、実行できるという一貫性が素晴らしい。

それぞれは Excel でもがんばればできるが、試行錯誤も考えると、全体としてはこちらのほうが便利だ。

f:id:tombi-aburage:20190126105814p:plain

入力データについての記述統計量、生データのダンプ、可視化も出せる。

f:id:tombi-aburage:20190126111046p:plain

可視化については、常識的なグラフは大体ある。

f:id:tombi-aburage:20190126112854p:plain

  • 画面上に説明があるとはいえ、すべて英語
  • 分析手法についての細かい説明や、分析手法ごとの使い方説明なども Learning-hub にはあるものの英語

    www.knime.com

なので、

AI、IoTを成功に導く データ前処理の極意

AI、IoTを成功に導く データ前処理の極意

 

で、典型的な分析パターン別の基本的な定義手順を予習(もちろん日本語)しておいたほうがいいだろう。