Pythonを学びデータサイエンチストになりたい

データサイエンティストになりたい、と夢想しながら読書記録を書くブログです。

2019-01-01から1年間の記事一覧

機械学習の学習に天井を感じています。メンターが欲しい…ブレイクスルーを迎えたい…  

Pythonを使った機械学習をモリモリとやっております。 最近は、Kaggleでデータをいじる→本を読んで勉強、の繰り返しをやっとります。 が、正直頭打ちな感じもしています。あまり実力が伸びている気がしない。 その理由を考えてみると、以下があるのかな、と…

有休を使っていくスーパー銭湯:横須賀温泉 湯楽の里

有休をとって、うっかり何も予定がないことがある。 会社からメールは飛び交うので、仕事をするということもありなのだが、それはそれで味気ない。そこでちょっとした小旅行をするのにハマっている。 小旅行といっても、そんな遠出ができる訳でもない。せい…

Kaggleに参加していますが、思った以上に時間がかかる

KaggleからデータをDLしてしばらく経ち格闘していますが、 なかなか提出できるデータまで仕上げられていません。 これまで読んだ本を参照しながらデータをいじっているものの、 なかなか思った通りに行かないことも多く…。 やはり本を読むのとはわけが違い…

機械学習ガイドブックを読むとRとPythonの垣根を超えたくなる

「機械学習ガイドブック」を読む。表が多く、これまで得てきた機械学習の知識を整理するのにちょうどよかった。またディープラーニングや強化学習についても少々学ぶことができたこと、今後RとPythonを連携して業務をしていく日も来るかもしれない…と感じら…

エンジニアでない普通の社会人がPythonを学ぶことで得られそうなベネフィット

エンジニアでもないのにプログラミングを勉強していて、何がしたいの?と聞かれることがある。実際にまだ何もできていないからである。 だが、Pythonは勉強していてポテンシャルを感じる。いわゆるエンジニアでない社会人にとっても、日々の業務を改善させる…

仕事ではじめる機械学習はPythonの基礎を身につけた後、Kaggleの前に読みと良い

本格的に機械学習を基礎から学習しています。 ということでまず読んだのは以下の本。 仕事ではじめる機械学習 作者: 有賀康顕,中山心太,西林孝 出版社/メーカー: オライリージャパン 発売日: 2018/01/16 メディア: 単行本(ソフトカバー) この商品を含むブ…

Pythonプロフェッショナルプログラミングを読んで

いやー読みました。Pythonプロフェッショナルプログラミング。 書評とか目にしても、既にエンジニアとしてお金を稼いでいる人向け、玄人向け、とかなり難易度が高いのかなあと予想していた。 Pythonプロフェッショナルプログラミング 第3版 作者: 株式会社ビ…

野村総研のアナリティクス研修の内容

野村総研のアナリティクス研修を書籍化した本を読む RとPythonで学ぶ[実践的]データサイエンス&機械学習 作者: 有賀友紀,大橋俊介 出版社/メーカー: 技術評論社 発売日: 2019/03/26 メディア: 単行本(ソフトカバー) この商品を含むブログを見る これは統計…

Kaggleと座学の繰り返しで、機械学習の知識を深め定着を狙う

データサイエンティストに向けて勉強も、佳境に入ってきました。 いよいよ、やっていることが難しい。内容に理解できないところも増えてきています。嗚呼メンター欲しい。てなもんです。 今はKaggleで優秀な人のコードを見て修正する→本を読んで知識を深める…

前処理大全で改めて基礎を固める

前処理大全という本で学習している。 既に知っているものも多いのだが、自分でなにも見ずにコードも書けないため、基礎固めに読み写経する。 前処理大全[データ分析のためのSQL/R/Python実践テクニック] 作者: 本橋智光 出版社/メーカー: 技術評論社 発売日:…

Kaggleに参加して他の人のNotebookをまねているものの

Kaggle本も読んで、Kaggleについてあさーい知識を得ることができました。 ということで以下のサイトを参考にしつつ、早速Kaggleに参加し、他の人のNotebookをCopy&Editしています。 qiita.com が、Copy&Editが難しい…。 書いてあるコードのうち、理解できる…

Kaggleで勝つデータ分析の技術本を読み終わって感じるところ

Kaggle本を読み終わりました。 Kaggleで勝つデータ分析の技術 作者: 門脇大輔,阪田隆司,保坂桂佑,平松雄司 出版社/メーカー: 技術評論社 発売日: 2019/10/09 メディア: 単行本(ソフトカバー) この商品を含むブログを見る Kaggleについて体系的に学べて非常…

Kaggleで勝つデータ分析について学習するも難しい

先日、Kaggleに参戦することを誓った私。 trq.hatenablog.com いざ準備をするため、Kaggleに登録し、以下の本を読みました。 Kaggleで勝つデータ分析の技術 作者: 門脇大輔,阪田隆司,保坂桂佑,平松雄司 出版社/メーカー: 技術評論社 発売日: 2019/10/09 メデ…

未経験からPython学習2ヶ月でKaggleに参戦するための戦略

Python学習を始めて2ヶ月弱。 Jupyter Notebookも多少は分かってきたので、時期尚早と理解しながらもKaggleへの入門をしてみたいと考えています。機械学習の勉強をある程度進めてからでも良いかと思っていましたが、まあ参加する分には問題あるまい。 以下…

「GBDT」は日本語wikipediaの解説ページがなくて理解するのが大変

GBDT。Grandient Boosting Decision Treesの略で、勾配ブースティング木という。 学習データに前処理を行い、学習できる形に変換する、そのためのモデルのようである。分かるような分からんような。Kaggleのテーブルデータ分析では大体使われているようなの…

Kagglerを目指す私のこれからの機械学習の学習計画

さてKagglerを目指している私ですが、そのためには機械学習の知識も必要な模様。 (↑後から見返すと恥ずかしくなりそうな初心者丸出しの一文である) それに向け、Pythonも触った時間は増えてきたので、次は機械学習の勉強を進めたいと思います。なんだか目…

Pythonを使って作業効率化するイメージが湧く「退屈なことはPythonにやらせよう」

Pythonで自動化。仕事がはかどる。 Python関連の書籍を見ると、そういった言葉とセットとなったタイトルの本もよく見る。 というわけで以下の書籍を一冊読んでみました。 退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミン…

45日経って、改めて「みんなのPython」を読む

「みんなのPython」。 Python学習をする上で、たびたび勧められている本である。 みんなのPython 第4版 作者: 柴田淳 出版社/メーカー: SBクリエイティブ 発売日: 2016/12/22 メディア: 単行本 この商品を含むブログ (2件) を見る これを久々に読んでみる。…

いよいよPythonを使って会社のデータを分析しようと思えた本

Pythonを学習し、今日も今日とで写経をしています。我ながら勤勉である。 さて現在使っている学習書は合同会社アイキュベータの方が執筆した、以下のものである。 Python実践データ分析100本ノック 作者: 下山輝昌,松田雄馬,三木孝行 出版社/メーカー: 秀和…

データサイエンティストになるキャリアパスの一例

Python学習の進め方の参考にさせていただいている中川伸一さんですが、以下の雑誌にデータサイエンティストになる方法、という記事があったのでメモとして残しておきます。 ソフトウェアデザイン 2018年9月号 作者: 中西崇文,中川伸一,橘慎太郎,安部晃生,横…

Pythonを学びはじめて1か月が経った後の気付き

Python学習をはじめて約1か月が経ちました。 trq.hatenablog.com 1か月の間に使った参考書 1か月の間に、以下の本を使って学習しました。全部が全部くまなく見たわけではないですが、どれも一通りは目を通したものです(理解できない箇所も多かったですが…

PatoさんがNoteで述べたライターになる方法は、プログラマーにも当てはまるのでは

データサイエンティストを目指しているこのブログ。 ですが、先日ライターのPatoさんが書いていた「ブログなんか書くな」を読み色々と考えさせられました。 note.mu ようは目的もなく毎日書くだけのブログや、成果物としての土俵にも立てていない記事は、書…

Djangoを使ってデータベースの基礎、そしてミニSNSの作成について理解

Python Django超入門の学習が終わりました。 Python Django 超入門 作者: 掌田津耶乃 出版社/メーカー: 秀和システム 発売日: 2018/06/09 メディア: 単行本 この商品を含むブログを見る これによって、簡単なアプリの作り方の一通りの流れが分かった、と言え…

「Webを支える技術」を読み理解できなかったので応用情報技術者試験でも受けようか

プログラミングの学習だけでなく、Webサービス全体の事を知らなければならない、ということで以下の本を読みました。 Webを支える技術 -HTTP、URI、HTML、そしてREST (WEB+DB PRESS plus) 作者: 山本陽平 出版社/メーカー: 技術評論社 発売日: 2010/04/08 メ…

プログラミングスクールに行くことも考えたが独学で進めることにした

Python学習を進めていますが、ちょっと前にプログラミングスクールがネットで話題になっていた。要はスクール関係者による著作権に関する発言が、物議を醸しだしたのである。 そのような中、プログラミングスクール全体の話にも及び、以下のような記事が投稿…

Pythonで統計分析をやる上で重要な心構えと姿勢

Pythonでデータ分析をやるには、少なからず統計分析の知識も必要となる。 ということで以下の本を使って学習も進める。 データサイエンス教本 Pythonで学ぶ統計分析・パターン認識・深層学習・信号処理・時系列データ分析 作者: 橋本洋志,牧野浩二 出版社/メ…

Pythonを使ってフォームページとか作れるようになりました

秋っぽい日々が続いていますが、飽きもせずPython学習しています。 最近はHTMLやらCSSと組み合わせてWebページを作っています。そこにSpyderを使ってviews.pyやらurls.pyやらを修正し、関数を使ってビューの処理を用意してやっています。あとはtemplatesフォ…

趣味としてのPython学習を、海釣りと比較した場合のメリット・デメリット

私は、趣味を探していた。本当は、釣りをしたかった。 前日の夜は釣りの仕掛けをつくり、当日の朝は早くに出かけ、太陽がギラつく中、屋根の下で波に揺られて魚を釣る。釣った魚を家でさばいて、一杯やる。そういう趣味をしたかった。自然の中過ごす時間はリ…

Python学習から1か月、本格的にDjangoの勉強を始める

Djangの勉強を始める。 Python Django 超入門 作者: 掌田津耶乃 出版社/メーカー: 秀和システム 発売日: 2018/06/09 メディア: 単行本 この商品を含むブログを見る AnacondaをDLし、myspaceを作ってDjangoをDLし、そしてSpyderもDLした。仮想空間の中にpyフ…

Pythonでデータ分析する練習として参考にするオープンデータのリスト

これからPythonを使ってデータ分析をドシドシ進めていきます。 その際、以下のサイトが参考にできるかなー、と今は考えています。 archive.ics.uci.edu statsmodels.org scikit-learn.org www.kaggle.com www.e-stat.go.jp www.jma.go.jp