今回は、Pandasでデータフレームを作成する方法を紹介します。
DataFrameとは
DataFrameとは、行と列から構成されるデータ構造です。
行の先頭に付ける行名をインデックス名(index)、
列の先頭に付ける列名をカラム名(columns)と呼びます。
DataFrameを作成する方法は3通りあります。
- リストから作成
- 辞書から作成
- csvファイルを読み込む
それぞれについて詳しく紹介していきます!
リストからDataFrameを作成する方法
DataFrameはリストから作成することができます。
2次元のリストを使用し、DataFrameを作成します。
さっそくコードをみていきましょう!
import pandas as pd
# リストを作成
data = [['Tom', 32],
['Alice', 24],
['Bob', 26]]
# リストからDataFrameを作成
df = pd.DataFrame(data, columns=['Name', 'Age'])
# DataFrameを表示
print(df)
実行結果
Name Age
0 Tom 32
1 Alice 24
2 Bob 26
まずは、Name
,Age
を要素にもつリストdata
を作成します。
pd.DataFrameの引数にdataをいれ、columnsにName
,Age
を指定しています。
辞書からDataFrameを作成する方法
続いて、辞書型からDataFrameを作成する方法を紹介します。
実際のコードで説明していきます。
import pandas as pd
# 辞書型データを作成
data = {
'Name': ['Tom', 'Alice', 'Bob'],
'Age': [32, 24, 26]
}
# 辞書型データからDataFrameを作成
df = pd.DataFrame.from_dict(data)
# DataFrameを表示
print(df)
実行結果
Name Age
0 Tom 32
1 Alice 24
2 Bob 26
Name
,Age
をキーにもつ辞書data
を準備します。
pd.DataFrameの引数にdataをいれ、DataFrameを作成します。
辞書で作成した場合は、キーがcolumnsになるため、
columnsを指定する必要がありません。
csvファイルからDataFrameを作成する方法
csvファイルからDataFrameを作成できます。
DataFrameは、このcsvファイルから作成する方法を一番使用します。
csvファイルからDataFrameを作成するには、
pd.read_csv()
関数を使用します!
それではさっそくコードを紹介します!
import pandas as pd
# CSVファイルからDataFrameを作成
df = pd.read_csv('data.csv')
# DataFrameを表示
print(df)
実行結果
Name Age
0 Tom 32
1 Alice 24
2 Bob 26
pd.read_csv()
関数の引数にcsvファイルdata.csv
を指定しています。
ちなみに、実際のcsvファイルは以下です。
Name, Age
Tom, 32
Alice, 24
Bob, 26
自分自身で、csvファイルを変更して、
実際に読み込んだDataFrameが変化するのか確認してみてください!
まとめ
pandasでDataFrameを作成する方法を3通り紹介しました。
DataFrameは、データ分析で必要不可欠です。
ぜひ覚えていってください!
参考
おすすめ教材
米国データサイエンティストがやさしく教えるデータサイエンスのためのPython講座