问题描述
这是我到目前为止的代码:
import numpy as np
import pandas as pd
import csv
file = r'C:\Users\Tiago Costa\Desktop\Senior Year - 2019.2020\ME 130\Coronovirus Datasets\time_series_2019-ncov-Confirmed.xlsx'
data = pd.ExcelFile(file)
print(data.sheet_names)
['Worksheet']
df = data.parse('Worksheet')
df.info
df.head(483)
我想知道如何才能仅提取中国、意大利、德国、伊朗和美国的确诊病例数,然后将这些数据绘制为时间的函数。
我打算使用这个: : 作为参考,当我到达那个点时创建我的图。
谢谢!
1楼
您不需要先将其转换为.xlsx
文件,因为我们可以使用 。
然后你可以使用来过滤你想要去的国家。
data = pd.read_csv('time_series_2019-ncov-Confirmed.csv')
countries = ['China', 'Italy', 'Germany', 'Iran', 'USA']
filtered_data = data[data['Country/Region'].isin(countries)]