Pythonによるデータの可視化
Data Visualization with Python


 pythonで読み込んだcsvデータを用いてグラフを作成する。csvデータとして、 NHKが作成したコロナのexcelデータ を用いる。まず、
NHK特設サイト 新型コロナウイルス
から、データをダウンロードする。
 次に、データの置いてあるのと同じディレクトリに以下のPythonプログラムを作成する。

import numpy as np
import pandas as pd
import numpy as np
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
import matplotlib.dates as mdates

covid = pd.read_csv('nhk_news_covid19_domestic_daily_data.csv')
df = DataFrame(covid)

ax=df.plot(x="日付", y="国内の感染者数_1日ごとの発表数", kind='bar', rot=90, fontsize=9)

ax.xaxis.set_major_locator(mdates.DayLocator(interval=30))

plt.xlabel("", fontname="MS Gothic") #これが無いとコンパイル時にwarning messageが出る。

plt.legend(prop={"family":"MS Gothic"})

plt.show()
 このプログラムをコンパイルすると、次のグラフが作成されます。
1日ごと

ax=df.plot(x="日付", y="国内の感染者数_1日ごとの発表数", kind='bar', rot=90, fontsize=9)

ax=df.plot(x="日付", y="国内の感染者数_累計", kind='bar', rot=90, fontsize=9)
で置き換えると、感染者数の累計が表示されます。 累計

 特定の期間について表示する場合には、次のようにします。

import numpy as np
import pandas as pd
import numpy as np
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
import matplotlib.dates as mdates

covid = pd.read_csv('nhk_news_covid19_domestic_daily_data.csv')
df = DataFrame(covid)

df_s=df.set_index("日付")["2021/3/15":"2021/9/2"]
df_r = df_s.reset_index()

ax=df_r.plot(x="日付", y="国内の感染者数_1日ごとの発表数", kind='bar', rot=45, fontsize=9)

ax.xaxis.set_major_locator(mdates.DayLocator(interval=10))

plt.xlabel("", fontname="MS Gothic") #これが無いとコンパイル時にwarning messageが出る。
plt.legend(prop={"family":"MS Gothic"})

plt.show()
ここでは、2021年3月15日から2021年9月2日までを表示します。結果は、以下の通りです。 累計