第1章 - 从CSV文件读取数据#

有多种方法可以读取CSV文件中的数据。以下是最常见的方法

在本章中,您将学习如何使用pandas读取和过滤CSV数据。此外,您可以通过命令行选项将数据文件传递给脚本。

以下Python脚本main.py展示了如何实现这一操作

 1
 2import argparse
 3import pandas as pd
 4
 5
 6def read_data(fname):
 7    return pd.read_csv(fname)
 8
 9
10if __name__ == "__main__":
11    options = argparse.ArgumentParser()
12    options.add_argument("-f", "--file", type=str, required=True)
13    args = options.parse_args()
14    data = read_data(args.file)
15    print(data)
16

Python脚本使用argparse模块接受并解析来自命令行的输入。然后它使用输入,在本例中是文件名,来读取并打印数据到提示符。

以以下方式尝试运行脚本,以检查您是否得到了期望的输出

$python datavisualize1/main.py -f all_hour.csv
                          time   latitude   longitude  depth    ...      magNst     status  locationSource  magSource
0  2019-01-10T12:11:24.810Z  34.128166 -117.775497   4.46    ...         6.0  automatic              ci         ci
1  2019-01-10T12:04:26.320Z  19.443333 -155.615997   0.72    ...         6.0  automatic              hv         hv
2  2019-01-10T11:57:48.980Z  33.322500 -116.393167   4.84    ...        11.0  automatic              ci         ci
3  2019-01-10T11:52:09.490Z  38.835667 -122.836670   1.28    ...         7.0  automatic              nc         nc
4  2019-01-10T11:25:44.854Z  65.108200 -149.370100  20.60    ...         NaN  automatic              ak         ak
5  2019-01-10T11:25:23.786Z  69.151800 -144.497700  10.40    ...         NaN   reviewed              ak         ak
6  2019-01-10T11:16:11.761Z  61.331800 -150.070800  20.10    ...         NaN  automatic              ak         ak

[7 rows x 22 columns]