野村総研のアナリティクス研修の内容
野村総研のアナリティクス研修を書籍化した本を読む
これは統計から入った人で、機会学習にいこうとしている人に良いと思った。
データ分析とは、モデリングとは(予測のための数式化、クラスタリング、因子分析や主成分分析、GLMやロジスティック回帰)、モデルの評価(有意差検定や決定係数、残差や説明変数同士の相関)、データ加工、そして機会学習とは、を統計側の視点や用語を中心に説明してくれている。
機会学習を中心とした書籍の前に一度読んでおくと、機会学習に入っていきやすいと思う。また、機会学習にどっぷりつかった後に読むと、また新たな視点をもってデータ分析に取り組めるのではないかと思う。
例えば「機械学習における学習とは、判断の根拠とするための統計的なモデルを作っていく過程」「機械学習の主な目的は予測であり、データに含まれる変数同士の関係(多くは相関関係)を抽出し、その関係を新しいデータに当てはめることで、特定の変数の値を推定すること」と説明されている。非常に腹落ちしやすい表現である。
あとPythonだけでなくRも使えるようになりたい人にも良いと思う。