今回は、pairplotの基本的な使い方から、カスタマイズ方法までを紹介し、Pythonコードの例を交えながら説明します。
pairplotの使い方
pairplotはデータをペアごとに散布図で出力し、データの相関関係を一目で把握できます。
基本的な使い方は以下の通りです。
# seabornをインポート
import seaborn as sns
# データセットをロード
iris = sns.load_dataset('iris')
# pairplotを作成
sns.pairplot(iris)まずはpairplotを使用するために、seabornをインポートします。
seabornについて詳しく知りたい方はこちら
続いて、pairplotで可視化したいデータセットをロードします。
今回は、irisのデータセットを使用します。
irisは、機械学習や統計学の分野でサンプルデータとして使用されるデータセットです。
データセットのあとは、実際にpairplotを作成します。
実行結果は以下です。

データ量が多いので、処理に時間がかかることがあります。
pairplotをカスタマイズ
pairplotの基本的な使い方の次は、pairplotをカスタマイズする方法を紹介します。
カテゴリごとに色分け
pairplotをカテゴリごとに色分けするには、hueパラメータを使用します。
hueパラメータにカテゴリを選択するだけで、簡単に色分けしてくれます。
今回の例だと、カテゴリにspeciesを指定すると、
species内のデータ(setosa、versicolor、virginica)ごとに色分けしてくれます。
サンプルコードは以下の通りです。
import seaborn as sns
# データセットをロード
iris = sns.load_dataset('iris')
# 種類(species)に基づいて色分け
sns.pairplot(iris, hue='species')実行結果

対角線上のグラフを変更する
対角線のグラフを変更するには、diag_kindパラメータを使用します。
diag_kindには以下のオプションがあります。
hist: ヒストグラム
kde: カーネル密度推定
サンプルコードはkdeを表示してみます。
import seaborn as sns
# データセット
iris = sns.load_dataset('iris')
# カーネル密度推定で対角要素を表示
sns.pairplot(iris, diag_kind='kde')実行結果

データの指定
これまではirisのデータフレームをすべて表示してきました。
必要なカラムだけをpairplotすることもできます。
import seaborn as sns
# データセット
iris = sns.load_dataset('iris')
# 必要なカラムだけをpairplot
sns.pairplot(iris[['sepal_length', 'sepal_width']]実行結果

sepal_lengthとsepal_widthのみを表示してみました!
まとめ
今回は、pairplotの基本的な使い方から、カスタマイズ方法までを紹介しました。
pairplotはデータ間の関係を可視化する非常に便利なツールです。
ぜひpairplotをマスターしてみてください!
ここまで読んでくださりありがとうございます。
参考
おすすめ教材
米国データサイエンティストがやさしく教えるデータサイエンスのためのPython講座他のUdemyの講座が気になる方はこちら


