Pythonを学びデータサイエンチストになりたい

データサイエンティストになりたい、と夢想しながら読書記録を書くブログです。

Kaggleで勝つデータ分析の技術本を読み終わって感じるところ

Kaggle本を読み終わりました。

 

Kaggleで勝つデータ分析の技術

Kaggleで勝つデータ分析の技術

 

 

Kaggleについて体系的に学べて非常によかった。このため、400ページくらいのボリュームがあったけれども、2日とかからず読み終えた。無論、意味がわからずすっ飛ばすところが多かったからである。

 

だが、分析コンペにおけるタスクの種類(回帰タスクや分類タスク)、評価指標の最適化、特徴量とは何か、特徴量の作成(調整)、モデルの作成(GBDTやニューラルネット、線形モデル)など、モデルの評価(バリデーション)、モデルのチューニング、などについて知ることができた。これは大きい。

 

ではなぜ理解できなかったか、というと。おそらく「機械学習の勉強」をすっとばしていたからである。私はこれまで、2か月間Pythonの勉強をしてきた。学習量としても少ないが、そもそもPythonの使い方を学んだだけである。機械学習はほぼやっていない。そりゃー分からないわけである。

 

ということで、次にやるべきことは「機械学習の勉強」であるが、ここまできてKaggleに参加しないのももったいないので、Kaggleni参加して他の人のコードをみながら、機械学習の勉強もするようにしたい。分量としては、1:1くらいかな。

 

ただぼんやりとしていたKaggleも、まあ参加できるかな、というイメージはもてるようになってきた。しっかりと手を動かして、順位を上げる活動をしていきたい。

 

trq.hatenablog.com