第1章 - 从CSV文件读取数据#
有多种方法可以读取CSV文件中的数据。以下是最常见的方法
在本章中,您将学习如何使用pandas读取和过滤CSV数据。此外,您可以通过命令行选项将数据文件传递给脚本。
以下Python脚本main.py
展示了如何实现这一操作
1
2import argparse
3import pandas as pd
4
5
6def read_data(fname):
7 return pd.read_csv(fname)
8
9
10if __name__ == "__main__":
11 options = argparse.ArgumentParser()
12 options.add_argument("-f", "--file", type=str, required=True)
13 args = options.parse_args()
14 data = read_data(args.file)
15 print(data)
16
Python脚本使用argparse
模块接受并解析来自命令行的输入。然后它使用输入,在本例中是文件名,来读取并打印数据到提示符。
以以下方式尝试运行脚本,以检查您是否得到了期望的输出
$python datavisualize1/main.py -f all_hour.csv
time latitude longitude depth ... magNst status locationSource magSource
0 2019-01-10T12:11:24.810Z 34.128166 -117.775497 4.46 ... 6.0 automatic ci ci
1 2019-01-10T12:04:26.320Z 19.443333 -155.615997 0.72 ... 6.0 automatic hv hv
2 2019-01-10T11:57:48.980Z 33.322500 -116.393167 4.84 ... 11.0 automatic ci ci
3 2019-01-10T11:52:09.490Z 38.835667 -122.836670 1.28 ... 7.0 automatic nc nc
4 2019-01-10T11:25:44.854Z 65.108200 -149.370100 20.60 ... NaN automatic ak ak
5 2019-01-10T11:25:23.786Z 69.151800 -144.497700 10.40 ... NaN reviewed ak ak
6 2019-01-10T11:16:11.761Z 61.331800 -150.070800 20.10 ... NaN automatic ak ak
[7 rows x 22 columns]