Pythonを学びデータサイエンチストになりたい

データサイエンティストになりたい、と夢想しながら読書記録を書くブログです。

Pythonプロフェッショナルプログラミングを読んで

いやー読みました。Pythonプロフェッショナルプログラミング。

 

書評とか目にしても、既にエンジニアとしてお金を稼いでいる人向け、玄人向け、とかなり難易度が高いのかなあと予想していた。

 

Pythonプロフェッショナルプログラミング 第3版

Pythonプロフェッショナルプログラミング 第3版

 

 

で、実際に読んでみたら、まあ分かるところと分からないところがハッキリした内容だった。ファーストエンジニアブックの次に読んでもいいくらいの本なのかなあ。Ubuntuやvenvは当たり前のように使われていたし。

 

そして個人の開発に加え、チーム開発のやり方が細かく書いてあった。チーム開発のための環境整備や、課題管理(Redmine)とレビュー、ソースコード管理(GitとGitHub)、ドキュメント(Sphinx)、モジュール設計と単体テストなど。開発したサービスを公開するノウハウやパフォーマンス改善など、正直第2部と第3部はよくわからないところが多かった。

 

おそらく実際にチーム開発に入れると学びやすいのだろうけど、もはや異業種未経験の自分としてはなかなか難しかろう、とも感じた。であれば、Djangoを使って個人レベルのWebアプリを開発すること、機会学習を学び個人でデータ分析などを行うのが良かろう。チーム開発のところは、万が一チームに入ることがあれば読み直せば良い。

 

事実、Django開発のパートはなかなか参考になった。Django入門の次に読むとよくわかると思う。①自分の知っている情報、技術で作れるか確認すること(ここため常に最新技術には触れる、DjangoPackageやJazzBandから探す)、②何を作りたいか明確にする、③小さく作って徐々に成長させることが肝要である。これでアプリの種を作って、htmlやcss、DBなどをこしらえていくこととなる。モデルを作って、どんな依存関係があるか明らかにし、さらに肉付けして開発を進めていく。

 

また機械学習についても基礎本を読んでいたのでよくわかった。またレコメンドや売り上げ予測などは、プロジェクトとしてWebに実装できるというイメージも持てた。とくにPDCA(仮説→前処理・実装・実行→分析→次のアクション)を回すことが重要である。一度で完璧なものを出すのでなく、試行錯誤を繰り返して精度を上げていくこととなる。

 

ということで、基礎編を読んだ人にはお勧めの一冊である。