今回は、データ分析でかかせないseabornライブラリについて紹介します。
seabornとは
Pythonのデータ可視化ライブラリの1つです。
matplotlibをベースに作られており、matplotlibより見やすいデザインになっています。
seabornは、データ分析の分野で広く使用されています。
matplotlibについて詳しく知りたい方はこちら
seabornを使用すると、以下のようなグラフを簡単に作成できます。
インストール方法
はじめてseabornを使用する方は、インストールが必要です。
seabornのインストールには、pipを使用します。
コマンドラインで以下コマンドを実行します。
pip install seaborn
これでseabornを使用する準備ができました。
インポート方法
seabornをコードで使用するには、以下のようにインポートする必要があります。
sns
でインポートするのが一般的です。
import seaborn as sns
これでseabornをインポートでき、sns
で使用します。
seabornとmatplotlibの違い
seabornとmatplotlibの違いを実際のグラフ使用して紹介していきます。
まずはmatplotlibで棒グラフを出力してみましょう!
import matplotlib.pyplot as plt
import numpy as np
x = ['A', 'B', 'C', 'D', 'E']
y = np.random.randint(1, 10, size=5)
plt.bar(x, y)
plt.show()
実行結果
普通の棒グラフが作成できました。
一方、seabornで棒グラフを出力すると
import seaborn as sns
import numpy as np
x = ['A', 'B', 'C', 'D', 'E']
y = np.random.randint(1, 10, size=5)
sns.barplot(x=x, y=y)
plt.show()
実行結果
色を指定していませんが、データごとに配色されています。
Seabornでよく使用するメソッド
代表的なメソッドを簡単に紹介します。
- distplot
- pairplot
- jointplot
- violinplot
distplot
distplotは、ヒストグラムやカーネル密度推定を使用し、データの分布を描画します。
カーネル密度推定は、データの分布を滑らかな曲線で表現するために使用します。
pairplot
pairplotはデータをペアごとに関係を表すグラフを描画します。簡単に相関関係を可視化できます。
jointplot
jointplotは、散布図とヒストグラムを同時に描画します。
散布図だけではわかりにくいデータの分布を可視化できます。
violinplot
violinplotは、箱ひげ図とカーネル密度推定を使用し、データの分布を描画します。
データのばらつきを可視化できます。
まとめ
今回はseabornとはなにか?からseabornでよく使用する代表的なメソッドをまでを紹介しました。
matplotlibより簡単により良いデザインでグラフを表示できることがわかったと思います。
ぜひ、わかりやすいグラフ作成に役立ててください。
ここまで読んでくださりありがとうございます。
参考
おすすめ教材
米国データサイエンティストがやさしく教えるデータサイエンスのためのPython講座 【世界で55万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜他のUdemyの講座が気になる方はこちら