Pandas

DataFrame

2023-03-08

[[pandas]] 中用于创建数据框的函数,可以指定数据、行索引、列索引、数据类型、是否复制数据等参数。

DataFrame

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None)
  • data: 数据
  • index: 行索引
  • columns: 列索引
  • dtype: 数据类型
    • 默认: float64
    • 可选: int64, float32, float16, complex64, complex128, object, bool, category, datetime64[ns], timedelta64[ns], uint8, uint16, uint32, uint64, int8, int16, int32, int64, float16, complex32, complex64, complex128
  • copy: 是否复制数据
import pandas as pd
data = {
"A": [1, 2, 3],
"B": [4, 5, 6]
}
df = pd.DataFrame(data=data)

属性

index

index 属性可以访问或者修改索引,值可以是整数、字符串或者任何其他可哈希的类型。

df.index = [100, 200, 300]
df
Name Age Location
100 Alice 25 Seattle
200 Bob 30 New York
300 Aritra 35 Kona

方法

  • .rename(): 重命名指定键名 (rename(columns={"A": "a", "B": "c"}))

round()

round 方法可以指定要保留的位数。

df.round(2)
Name Age Location
100 Alice 25 Seattle
200 Bob 30 New York
300 Aritra 35 Kona

rename()

rename() 方法可以重命名指定键名。

DataFrame.rename(mapper=None, *, index=None, columns=None, axis=None, copy=None, inplace=False, level=None, errors='ignore')

sort_values()

sort_values() 方法可以按指定键排序。

DataFrame.sort_values(by, *, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)

to_csv()

to_csv 方法可以将 DataFrame 转换为 CSV 文件。

DataFrame.to_csv(path_or_buf=None, *, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', lineterminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict', storage_options=None)
df.to_csv()

to_dict()

to_dict 方法可以将 DataFrame 转换为字典。

(orient='dict', *, into=<class 'dict'>, index=True)
  • orient: 指定输出格式,可选值为 ‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’
  • into: 指定输出类型,默认为 dict
  • index: 是否包含索引
df.to_dict()

to_json()

to_json 方法可以将 DataFrame 转换为 JSON 字符串。

DataFrame.to_json(path_or_buf=None, *, orient=None, date_format=None, double_precision=10, force_ascii=True, date_unit='ms', default_handler=None, lines=False, compression='infer', index=None, indent=None, storage_options=None, mode='w')
df.to_json()

参考