今天,我们学习read_csv函数的参数dtype。
dtype 参数用于指定某一列的数据类型。它通常接受一个字典作为输入,其中字典的键是列名,值是指定后这列的数据类型,可以指定一列或多列。
- 现实中可能用到的情形
使用read_csv函数读取csv文件的时候,有时会遇到这种情况,有一些以0开头的纯数字类型,比如公司员工的id一般是:00xxx,默认读取的时候,会将前面的0去掉,只显示后面的xxx,id为001就会显示成1。为了显示正确,我们这个时候要把这个字段转换为字符串类型,才能正常显示。
下面我们举例使用一下,先读入一个csv文档:
import pandas as pd
df=pd.read_csv("test.csv")
df
返回:
ID这一列,其实前面是带0的,结果默认读入的时候直接把0去掉了。现在我们设置一下dtype参数:
import pandas as pd
df=pd.read_csv("test.csv",dtype={'ID':str})
df
返回:
这下显示正确了。