Pythonを学びデータサイエンチストになりたい

データサイエンティストになりたい、と夢想しながら読書記録を書くブログです。

プログラミング

Pythonによるスクレイピングでイベント情報を収集できるようにする

以下の本を読みつつ、現在頑張ってプログラミングしています。 Pythonによるクローラー&スクレイピング入門 設計・開発から収集データの解析・運用まで 作者:加藤 勝也,横山 裕季 発売日: 2017/10/23 メディア: 単行本(ソフトカバー) " data-en-clipboard=…

ニートでもアラフィフでもプログラミング(React)で成り上がった人の話を見て勇気づけられる

アラフィフであろうとも、プログラミングを使うことで成り上がれる。非常に勇気づけられる記事であった。 10年引きこもりニートしてた就職氷河期直撃アラフィフでも社会復帰してReactで成り上がれるよ|erukiti|note 詳しくは本文を見ていただきたいが、こ…

「Pythonの知識」と「仕事への応用」の間にある崖を越える方法

Pythonの知識を活用して、実際の仕事へ応用する。なかなか難しいですよね。 私も最初は、「日々、手間と感じている業務(課題)」と「Pythonの知識」が揃えば、自然と応用できるものかと思っていました。 知識について身に着ける本は今、たくさん出ています…

自走プログラマー Pythonの先輩が教えるプロジェクト開発のベストプラクティス120

中級向けの本。ちょっとした便利なコードを書ける人が、中~大規模のシステムを上手に作れるようになる段階を目指せる本。 これを読むことで、ソフトウェア開発の全体像について掴めて、かつ効率性や質を上げるポイントについてよく学ぶことができる。順番と…

Pythonプログラミングパーフェクトマスター/問題解決のためのデータ分析基礎講座

Pythonやデータ分析について最近読んだ本を少々。 ■Pythonプログラミングパーフェクトマスター[Python3/Anaconda対応最新版] 最新版が2020年4月に出ていたので、あらためて読む。 忘れていたところも多く、改めて読んでよかったという感じ。Kaggleで他の人の…

■Python学習で使った参考書と学習履歴(2月25日更新 随時更新)

現在、Pythonを学習中です。使用している書籍と学んだこと、所感を記します。 ■9月下旬 独習Python入門――1日でプログラミングに強くなる! 作者: 湯本堅隆 出版社/メーカー: 技術評論社 発売日: 2016/08/05 メディア: 単行本(ソフトカバー) この商品を含む…

KaggleとSignateそれぞれに参加してみても

データ分析の国際コンペといえばKaggleですが、国内コンペとしてSignateがあります。 最近、それぞれ参加してみました。というのも、機械学習の知識はまだまだ乏しいということもあり、各コンペにそこまで時間がかからない、というか。自分でコードを調べて…

ウサギの戦力は、速い脚より大きな耳~「大本営参謀の情報戦記/堀栄三」の備忘録

大本営参謀の情報戦記を読む。第二次世界大戦中の、日本における情報収集・解析専門家の記録である。とあるサイトでデータサイエンティストとしてバイブルと記載されていたので、読んでみた…名著であった。 情報なき国家の悲劇 大本営参謀の情報戦記 (文春文…

Kaggleで自然言語処理分析の勉強をはじめる

相変わらずKaggleをやっています。 最近発売された以下の本を参照しつつ、Kaggleのtwitter分析コンペにも参加中。災害を伝えているtweetと、伝えていないtweetを分析するコンペです。 現場で使える!Python自然言語処理入門 (AI & TECHNOLOGY) 作者:赤石 雅…

データサイエンティストの職について転職エージェントから連絡がきた

Kaggleに参加して、Discussionなんかを見て、時間をみては順位を上げるようがんばってコードを修正しています。が、まだメダルにはほど遠い状況…。 そんな中、転職エージェントから一度話をしませんか、という連絡が来ました。 データサイエンティストになり…

機械学習の学習に天井を感じています。メンターが欲しい…ブレイクスルーを迎えたい…  

Pythonを使った機械学習をモリモリとやっております。 最近は、Kaggleでデータをいじる→本を読んで勉強、の繰り返しをやっとります。 が、正直頭打ちな感じもしています。あまり実力が伸びている気がしない。 その理由を考えてみると、以下があるのかな、と…

Kaggleに参加していますが、思った以上に時間がかかる

KaggleからデータをDLしてしばらく経ち格闘していますが、 なかなか提出できるデータまで仕上げられていません。 これまで読んだ本を参照しながらデータをいじっているものの、 なかなか思った通りに行かないことも多く…。 やはり本を読むのとはわけが違い…

機械学習ガイドブックを読むとRとPythonの垣根を超えたくなる

「機械学習ガイドブック」を読む。表が多く、これまで得てきた機械学習の知識を整理するのにちょうどよかった。またディープラーニングや強化学習についても少々学ぶことができたこと、今後RとPythonを連携して業務をしていく日も来るかもしれない…と感じら…

仕事ではじめる機械学習はPythonの基礎を身につけた後、Kaggleの前に読みと良い

本格的に機械学習を基礎から学習しています。 ということでまず読んだのは以下の本。 仕事ではじめる機械学習 作者: 有賀康顕,中山心太,西林孝 出版社/メーカー: オライリージャパン 発売日: 2018/01/16 メディア: 単行本(ソフトカバー) この商品を含むブ…

Pythonプロフェッショナルプログラミングを読んで

いやー読みました。Pythonプロフェッショナルプログラミング。 書評とか目にしても、既にエンジニアとしてお金を稼いでいる人向け、玄人向け、とかなり難易度が高いのかなあと予想していた。 Pythonプロフェッショナルプログラミング 第3版 作者: 株式会社ビ…

野村総研のアナリティクス研修の内容

野村総研のアナリティクス研修を書籍化した本を読む RとPythonで学ぶ[実践的]データサイエンス&機械学習 作者: 有賀友紀,大橋俊介 出版社/メーカー: 技術評論社 発売日: 2019/03/26 メディア: 単行本(ソフトカバー) この商品を含むブログを見る これは統計…

Kaggleと座学の繰り返しで、機械学習の知識を深め定着を狙う

データサイエンティストに向けて勉強も、佳境に入ってきました。 いよいよ、やっていることが難しい。内容に理解できないところも増えてきています。嗚呼メンター欲しい。てなもんです。 今はKaggleで優秀な人のコードを見て修正する→本を読んで知識を深める…

前処理大全で改めて基礎を固める

前処理大全という本で学習している。 既に知っているものも多いのだが、自分でなにも見ずにコードも書けないため、基礎固めに読み写経する。 前処理大全[データ分析のためのSQL/R/Python実践テクニック] 作者: 本橋智光 出版社/メーカー: 技術評論社 発売日:…

Kaggleに参加して他の人のNotebookをまねているものの

Kaggle本も読んで、Kaggleについてあさーい知識を得ることができました。 ということで以下のサイトを参考にしつつ、早速Kaggleに参加し、他の人のNotebookをCopy&Editしています。 qiita.com が、Copy&Editが難しい…。 書いてあるコードのうち、理解できる…

Kaggleで勝つデータ分析の技術本を読み終わって感じるところ

Kaggle本を読み終わりました。 Kaggleで勝つデータ分析の技術 作者: 門脇大輔,阪田隆司,保坂桂佑,平松雄司 出版社/メーカー: 技術評論社 発売日: 2019/10/09 メディア: 単行本(ソフトカバー) この商品を含むブログを見る Kaggleについて体系的に学べて非常…

Kaggleで勝つデータ分析について学習するも難しい

先日、Kaggleに参戦することを誓った私。 trq.hatenablog.com いざ準備をするため、Kaggleに登録し、以下の本を読みました。 Kaggleで勝つデータ分析の技術 作者: 門脇大輔,阪田隆司,保坂桂佑,平松雄司 出版社/メーカー: 技術評論社 発売日: 2019/10/09 メデ…

未経験からPython学習2ヶ月でKaggleに参戦するための戦略

Python学習を始めて2ヶ月弱。 Jupyter Notebookも多少は分かってきたので、時期尚早と理解しながらもKaggleへの入門をしてみたいと考えています。機械学習の勉強をある程度進めてからでも良いかと思っていましたが、まあ参加する分には問題あるまい。 以下…

「GBDT」は日本語wikipediaの解説ページがなくて理解するのが大変

GBDT。Grandient Boosting Decision Treesの略で、勾配ブースティング木という。 学習データに前処理を行い、学習できる形に変換する、そのためのモデルのようである。分かるような分からんような。Kaggleのテーブルデータ分析では大体使われているようなの…

Kagglerを目指す私のこれからの機械学習の学習計画

さてKagglerを目指している私ですが、そのためには機械学習の知識も必要な模様。 (↑後から見返すと恥ずかしくなりそうな初心者丸出しの一文である) それに向け、Pythonも触った時間は増えてきたので、次は機械学習の勉強を進めたいと思います。なんだか目…

Pythonを使って作業効率化するイメージが湧く「退屈なことはPythonにやらせよう」

Pythonで自動化。仕事がはかどる。 Python関連の書籍を見ると、そういった言葉とセットとなったタイトルの本もよく見る。 というわけで以下の書籍を一冊読んでみました。 退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミン…

45日経って、改めて「みんなのPython」を読む

「みんなのPython」。 Python学習をする上で、たびたび勧められている本である。 みんなのPython 第4版 作者: 柴田淳 出版社/メーカー: SBクリエイティブ 発売日: 2016/12/22 メディア: 単行本 この商品を含むブログ (2件) を見る これを久々に読んでみる。…

いよいよPythonを使って会社のデータを分析しようと思えた本

Pythonを学習し、今日も今日とで写経をしています。我ながら勤勉である。 さて現在使っている学習書は合同会社アイキュベータの方が執筆した、以下のものである。 Python実践データ分析100本ノック 作者: 下山輝昌,松田雄馬,三木孝行 出版社/メーカー: 秀和…

データサイエンティストになるキャリアパスの一例

Python学習の進め方の参考にさせていただいている中川伸一さんですが、以下の雑誌にデータサイエンティストになる方法、という記事があったのでメモとして残しておきます。 ソフトウェアデザイン 2018年9月号 作者: 中西崇文,中川伸一,橘慎太郎,安部晃生,横…

Pythonを学びはじめて1か月が経った後の気付き

Python学習をはじめて約1か月が経ちました。 trq.hatenablog.com 1か月の間に使った参考書 1か月の間に、以下の本を使って学習しました。全部が全部くまなく見たわけではないですが、どれも一通りは目を通したものです(理解できない箇所も多かったですが…

PatoさんがNoteで述べたライターになる方法は、プログラマーにも当てはまるのでは

データサイエンティストを目指しているこのブログ。 ですが、先日ライターのPatoさんが書いていた「ブログなんか書くな」を読み色々と考えさせられました。 note.mu ようは目的もなく毎日書くだけのブログや、成果物としての土俵にも立てていない記事は、書…