Pythonを学びデータサイエンチストになりたい

データサイエンティストになりたい、と夢想しながら読書記録を書くブログです。

Pythonで統計分析をやる上で重要な心構えと姿勢

Pythonでデータ分析をやるには、少なからず統計分析の知識も必要となる。

ということで以下の本を使って学習も進める。

データサイエンス教本 Pythonで学ぶ統計分析・パターン認識・深層学習・信号処理・時系列データ分析

データサイエンス教本 Pythonで学ぶ統計分析・パターン認識・深層学習・信号処理・時系列データ分析

 

 

補足説明をする以下のサイトもなかなか役立つ。https://sites.google.com/site/datasciencehiro/

 

本書籍は、Python(というかJupyter Notebook)を使って統計分析をどのように行うかについて述べたものである。

 

f:id:trq:20191023065256p:plain

 

改めて統計分析について学んで感じるのは、やはり「統計知識があって、普段から統計分析を行っている人が道具として使う」のがJupyter Notebookということである。そもそもデータ分析を行う習慣がないと、Pythonを使えるようになっても使わぬままサビるだけである。それが私であった。

 

ということでまずは習慣づけるため、オープンソースのデータを使って、しっかりと分析するクセもつけていかねばならぬのである。

trq.hatenablog.com

 

そういう知識と意識があってこそ、例の食べログ問題でも率先してデータ分析しようとする姿勢が産まれたのであろう。

 

話をもどして本書籍、統計分析以外では以下のことも学ぶことができる。

パターン認識

・深層学習

・信号処理

・時系列データ分析

・スペクトル分析

・ディジタルフィルタ

・画像処理

 

時系列データ分析は株価データにも使えるもので、またGoogleの検索トレンドなども対象とできそう。スペクトル分析はデータ本来の信号成分と望ましくない信号成分を見極めることができるとのこと。ここはもう専門外なのでサッパリわからなかった。

 

また著者が最後に述べていた以下の言葉は身に染みる。しっかりと反復練習をしよう。

正しい直観力を養うには、正しい知識と正しい数多くの反復練習が必要である。