Pythonを学びデータサイエンチストになりたい

データサイエンティストになりたい、と夢想しながら読書記録を書くブログです。

機械学習ガイドブックを読むとRとPythonの垣根を超えたくなる

機械学習ガイドブック」を読む。表が多く、これまで得てきた機械学習の知識を整理するのにちょうどよかった。またディープラーニング強化学習についても少々学ぶことができたこと、今後RとPythonを連携して業務をしていく日も来るかもしれない…と感じられる本であった。Rstudioにもいつか手をだしてみたい。

 

機械学習ガイドブック: RとPythonを使いこなす

機械学習ガイドブック: RとPythonを使いこなす

 

 

機械学習を実践するポイントについてはうまくまとまっていたので、備忘録もかねてメモしておきたい。

 

1 データの事前処理

  ・データの型、構造の確認

  ・欠損値、異常値の除去

  ・データの正規化

2 学習時の留意点と過学習防止

  ・データの分割とテスト

  ・次元削減(特徴量の選別)

  ・適度な正則化

  ・その他過学習の抑制策

  ・適切な学習データ量の把握

3 より性能を向上させるための工夫

  ・アプローチの選択

  ・パラメータの選択

  ・特徴量の加工

  ・特徴量の選択

 

 

いやーそれにしても機械学習に関する知識は十分に入ったという感じもするので、いい加減アウトプットせねば。12月はさすがに機械学習を使ったデータ分析をもう少しやるようにします。

 

 

trq.hatenablog.com