データ分析

ケース別データの可視化パターンとpythonによる実装

データが与えられた時、まずは可視化してデータの特徴を把握することが大切です。しかし、何を軸にしてどのように可視化するのかということに関しては、あまりルール化されていないのが現状だと思います。 データから何を知りたいのか?ということから、パタ…

データ分析を業務で1ヶ月間やってみて学んだ大原則

データ分析エンジニアになった 今までサーバーサイドエンジニア・インフラエンジニアとして仕事をしながら、簡単なデータ分析をして、施策に落としたり施策の効果を測定したりしていました。そして、ちょうど1ヶ月前からデータ分析エンジニアとして業務のほ…

window関数を使いこなす 〜分析のためのSQL〜

分析のためにSQLを使う際、window関数はとても便利です。一方でとっつきにくい考え方や、情報が少なかったりしてどうしても敬遠してしまいがちです。例を交えて簡単にまとめてみたいと思います。 window関数とは PostgreSQLの公式ドキュメントには以下のよう…

pythonでデータを可視化したいならseabornを使おう!

pythonでデータを可視化するのにmatplotlibを使う人は多いと思いますが、seaboarnというmatplotlibのラッパーが素晴らしく便利です。 インストール まずはseabornをインストールします。pipもしくはcondaでインストールできます。 pip install seaborn conda…

SQLでやるこの操作ってpandas.DataFrameではどうやるの!

pandasを触り始めた時に感じた思いをタイトルにしてみました。テーブル操作においてSQLを使うことに慣れすぎて、pandasのDataFrameを操作しようとした時どうやるのか戸惑うことが多かったです。 SQLの基本的な構文がpandasではどう実現するのかを1つ1つ並べ…