Pythonを学びデータサイエンチストになりたい

データサイエンティストになりたい、と夢想しながら読書記録を書くブログです。

Kaggleで勝つデータ分析について学習するも難しい

先日、Kaggleに参戦することを誓った私。

 

trq.hatenablog.com

 

いざ準備をするため、Kaggleに登録し、以下の本を読みました。

Kaggleで勝つデータ分析の技術

Kaggleで勝つデータ分析の技術

 

 

第1章はわかるのですが、第2章から早速チンプンカンプンになってしまいました…。なんとなく言っていることは分かるのですが、非常にあさーいレベルで理解していることが分かります。まあ初心者向けの本ではないとは分かっているのですが。

 

とりあえずデータに欠損値があった場合、数値の規模感が異なり変換した方が良い場合、カテゴリ変数を返還する場合など、また参照するようにしたいです。

 

これはレファレンス本として位置づけられ、自分がKaggleに対して何かしら提出するようになった際に、新たな視点で改良する上で、役に立つものだと考えます。 

 

とはいえこういう新分野の学習、まずは一通り終わらせることが肝要。何も学んでいないと思っても、ある程度用語なんかは理解しつつあるので、薄い理解を、何重にも何重にも重ねて厚みを増やしていきたいと思います。