[[pandas]] 中用于创建数据框的函数,可以指定数据、行索引、列索引、数据类型、是否复制数据等参数。
DataFrame
pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None)- data: 数据
- index: 行索引
- columns: 列索引
- dtype: 数据类型
- 默认:
float64 - 可选:
int64,float32,float16,complex64,complex128,object,bool,category,datetime64[ns],timedelta64[ns],uint8,uint16,uint32,uint64,int8,int16,int32,int64,float16,complex32,complex64,complex128
- 默认:
- copy: 是否复制数据
import pandas as pd
data = { "A": [1, 2, 3], "B": [4, 5, 6]}
df = pd.DataFrame(data=data)属性
index
index 属性可以访问或者修改索引,值可以是整数、字符串或者任何其他可哈希的类型。
df.index = [100, 200, 300]df Name Age Location100 Alice 25 Seattle200 Bob 30 New York300 Aritra 35 Kona方法
.rename(): 重命名指定键名 (rename(columns={"A": "a", "B": "c"}))
round()
round 方法可以指定要保留的位数。
df.round(2) Name Age Location100 Alice 25 Seattle200 Bob 30 New York300 Aritra 35 Konarename()
rename() 方法可以重命名指定键名。
DataFrame.rename(mapper=None, *, index=None, columns=None, axis=None, copy=None, inplace=False, level=None, errors='ignore')sort_values()
sort_values() 方法可以按指定键排序。
DataFrame.sort_values(by, *, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)to_csv()
to_csv 方法可以将 DataFrame 转换为 CSV 文件。
DataFrame.to_csv(path_or_buf=None, *, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', lineterminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict', storage_options=None)df.to_csv()to_dict()
to_dict 方法可以将 DataFrame 转换为字典。
(orient='dict', *, into=<class 'dict'>, index=True)- orient: 指定输出格式,可选值为 ‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’
- into: 指定输出类型,默认为 dict
- index: 是否包含索引
df.to_dict()to_json()
to_json 方法可以将 DataFrame 转换为 JSON 字符串。
DataFrame.to_json(path_or_buf=None, *, orient=None, date_format=None, double_precision=10, force_ascii=True, date_unit='ms', default_handler=None, lines=False, compression='infer', index=None, indent=None, storage_options=None, mode='w')df.to_json()