Pandas 速查表

Pandas 是一个强大的 Python 数据分析和操作库。本速查表为 Pandas 初学者提供快速参考。

#入门

你需要导入 pandas 才能开始：

import pandas as pd

-	-
`df.dropna()`	删除包含任何缺失值的行
`df.dropna(axis=1)`	删除包含任何缺失值的列
`df.fillna(0)`	用 0 替换缺失值
`df.drop_duplicates()`	删除重复行
`df.rename(columns={'old_name': 'new_name'})`	重命名列
`df.astype('int')`	更改数据类型

-	-
`pd.concat([df1, df2])`	连接行
`pd.concat([df1, df2], axis=1)`	连接列
`pd.merge(df1, df2, on='key')`	根据键合并 DataFrame
`pd.merge(df1, df2, left_on='key1', right_on='key2')`	根据不同键合并
`df1.join(df2, lsuffix='_left', rsuffix='_right')`	连接 DataFrame

-	-
`df['date'] = pd.to_datetime(df['date'])`	转换为日期时间
`df['year'] = df['date'].dt.year`	提取年份
`df['month'] = df['date'].dt.month`	提取月份
`df['day'] = df['date'].dt.day`	提取日期
`df.set_index('date', inplace=True)`	设置日期为索引

-	-
`df.to_csv('file.csv')`	保存 DataFrame 到 CSV
`df = pd.read_csv('file.csv')`	从 CSV 加载 DataFrame
`df.to_excel('file.xlsx')`	保存 DataFrame 到 Excel
`df = pd.read_excel('file.xlsx')`	从 Excel 加载 DataFrame
`from sqlalchemy import create_engine`	导入 SQLAlchemy 进行 SQL 操作
`engine = create_engine('sqlite:///:memory:')`	创建 SQL 引擎
`df.to_sql('table_name', engine)`	保存到 SQL 表
`df = pd.read_sql('table_name', engine)`	从 SQL 表加载