【Python】seabornのpairplotでデータを可視化する方法

  • URLをコピーしました!

今回は、pairplotの基本的な使い方から、カスタマイズ方法までを紹介し、Pythonコードの例を交えながら説明します。

目次

pairplotの使い方

pairplotはデータをペアごとに散布図で出力し、データの相関関係を一目で把握できます。

基本的な使い方は以下の通りです。

# seabornをインポート
import seaborn as sns

# データセットをロード
iris = sns.load_dataset('iris')

# pairplotを作成
sns.pairplot(iris)

まずはpairplotを使用するために、seabornをインポートします。

seabornについて詳しく知りたい方はこちら

続いて、pairplotで可視化したいデータセットをロードします。

今回は、irisのデータセットを使用します。

irisは、機械学習や統計学の分野でサンプルデータとして使用されるデータセットです。

データセットのあとは、実際にpairplotを作成します。

実行結果は以下です。

データ量が多いので、処理に時間がかかることがあります。

pairplotをカスタマイズ

pairplotの基本的な使い方の次は、pairplotをカスタマイズする方法を紹介します。

カテゴリごとに色分け

pairplotをカテゴリごとに色分けするには、hueパラメータを使用します。

hueパラメータにカテゴリを選択するだけで、簡単に色分けしてくれます。

今回の例だと、カテゴリにspeciesを指定すると、

species内のデータ(setosa、versicolor、virginica)ごとに色分けしてくれます。

サンプルコードは以下の通りです。

import seaborn as sns

# データセットをロード
iris = sns.load_dataset('iris')

# 種類(species)に基づいて色分け
sns.pairplot(iris, hue='species')

実行結果

対角線上のグラフを変更する

対角線のグラフを変更するには、diag_kindパラメータを使用します。

diag_kindには以下のオプションがあります。

hist: ヒストグラム

kde: カーネル密度推定

サンプルコードはkdeを表示してみます。

import seaborn as sns

# データセット
iris = sns.load_dataset('iris')

# カーネル密度推定で対角要素を表示
sns.pairplot(iris, diag_kind='kde')

実行結果

データの指定

これまではirisのデータフレームをすべて表示してきました。

必要なカラムだけをpairplotすることもできます。

import seaborn as sns

# データセット
iris = sns.load_dataset('iris')

# 必要なカラムだけをpairplot
sns.pairplot(iris[['sepal_length', 'sepal_width']]

実行結果

sepal_lengthsepal_widthのみを表示してみました!

まとめ

今回は、pairplotの基本的な使い方から、カスタマイズ方法までを紹介しました。

pairplotはデータ間の関係を可視化する非常に便利なツールです。

ぜひpairplotをマスターしてみてください!

ここまで読んでくださりありがとうございます。

参考

おすすめ教材

米国データサイエンティストがやさしく教えるデータサイエンスのためのPython講座 icon 【世界で55万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜 icon

他のUdemyの講座が気になる方はこちら

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

エンジニア。20代。組み込みエンジニアとして働き始めるも、働き方や業務内容に限界を感じ、 AI,Web3エンジニアを目指して勉強中。 エンジニアとして思うことや、学んだことを発信します。

目次