ぽころー– Author –
-
【Python】標準化する方法
今回は、標準化する方法を紹介します。 【標準化とは】 標準化(standardizing)は平均を0、標準偏差を1にする変換です。 標準化を式で表すと以下です。 \[ z = \frac{x - \mu}{\sigma} \] \( x \): 確率変数\( \mu \): 平均\( \sigma \): 標準偏差 標準化さ... -
【Python】正規分布を作成する方法
今回は、統計学で最も使用する分布図である正規分布について紹介します。 【正規分布とは】 正規分布(Normal Distribution)は統計学で最も使用される確率分布です。ガウス分布とも呼ばれます。 正規分布は以下の式で表されます。 \[ f(x) = \frac{1}{\sqrt... -
【Python】累積分布関数を作成する方法
今回は、累積分布関数をPythonで作成する方法を紹介します。 【累積分布関数(CDF)とは?】 累積分布関数(CDF: Cumulative Distribution Function)は確率密度関数を負の無限大からある値までを積分し、ある値以下になる確率を表した関数です。 累積分布関数... -
【Python】確率分布を作成する方法
今回は、Pythonで確率分布を作成する方法を紹介します。 【確率分布とは】 確率分布とは、ある事象で発生する確率がどのように分布しているかを表すものです。 確率分布には離散型確率分布と連続型確率分布があります。 離散型確率分布取りうる値が個別的... -
【Python】カテゴリカルなデータの関連性を測る方法
今回は、カテゴリカルなデータ間に対し、関連性を測る方法を紹介します。 連関係数という指標を用いて、カテゴリカルなデータの関連性を測ります。 【はじめに】 連関係数という指標を使用し、カテゴリカルなデータ間の関連性を測ります。 以下ステップで... -
【Python】共分散と相関係数で2変数間の相関を求める方法
今回は2変数間の関係性を表す共分散と相関係数をPythonで計算する方法を紹介します。 【)とは】 2変数の関係性を表す指標です。 共分散が大きいと、2変数間に関係性があることを示し、 共分散が0に近いと、2変数間に関係性がないことを示します。 共分散が... -
【Python】散布度を求める方法を解説
今回は、統計学の基本である範囲、四分位数、分散、標準偏差を Pythonで求める方法を紹介します。 【散布度とは】 データの散らばりを示す指標のことです。 平均値だけではみえてこないデータの散らばりを測定することで、 データの特性を知ることができま... -
【Python】SciPyとは?SciPyの基本的な使い方を紹介
今回はデータ分析の分野で頻出するSciPyについて紹介します。 【SciPy(サイパイ)とは】 SciPyは、科学技術計算を行うためのPythonのライブラリです。 最適化、線形代数、微分積分、統計学などの様々な分野で使用されます。 NumPyなど他のライブラリと合わ... -
【Python】seabornでheatmapを描画する方法
今回は、seabornで基本的なheatmapを作成する方法からカスタマイズする方法までを紹介します。 【heatmap(ヒートマップ)とは】 ヒートマップとはデータを色や濃淡の変化で視覚的に表現するグラフです。 地図上で温度を表現する際に使用されることが多いで... -
【Python】seabornで棒グラフ、箱ひげ図、バイオリン図を描画
今回はseabornで以下グラフを描画する方法を紹介します。 barplot: 棒グラフ boxplot: 箱ひげ図 violinplot: バイオリン図 バイオリン図は聞き馴染みないと思います。 分布の形状を把握するのに便利なので、以降で説明していきます。 【使用するデータ】 ...