Pythonを学びデータサイエンチストになりたい

データサイエンティストになりたい、と夢想しながら読書記録を書くブログです。

野村総研のアナリティクス研修の内容

野村総研のアナリティクス研修を書籍化した本を読む

 

RとPythonで学ぶ[実践的]データサイエンス&機械学習

RとPythonで学ぶ[実践的]データサイエンス&機械学習

 

 

これは統計から入った人で、機会学習にいこうとしている人に良いと思った。

 

データ分析とは、モデリングとは(予測のための数式化、クラスタリング、因子分析や主成分分析、GLMやロジスティック回帰)、モデルの評価(有意差検定や決定係数、残差や説明変数同士の相関)、データ加工、そして機会学習とは、を統計側の視点や用語を中心に説明してくれている。

 

機会学習を中心とした書籍の前に一度読んでおくと、機会学習に入っていきやすいと思う。また、機会学習にどっぷりつかった後に読むと、また新たな視点をもってデータ分析に取り組めるのではないかと思う。

 

例えば「機械学習における学習とは、判断の根拠とするための統計的なモデルを作っていく過程」「機械学習の主な目的は予測であり、データに含まれる変数同士の関係(多くは相関関係)を抽出し、その関係を新しいデータに当てはめることで、特定の変数の値を推定すること」と説明されている。非常に腹落ちしやすい表現である。

 

あとPythonだけでなくRも使えるようになりたい人にも良いと思う。