失业程序员复习python笔记——dataframe基本图形展示
Pandas DataFrame 结合 Matplotlib 可以创建各种数据可视化图形。下面我将展示几个常见的 DataFrame 图形展示案例。
安装matplotlib库
执行pip install matplotlib 命令后,出现下面的错误:
pip._vendor.urllib3.exceptions.ReadTimeoutError:HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.
修改成通过国内的阿里云的镜像安装后,就安装成功了。
pip install matplotlib -i https://mirrors.aliyun.com/pypi/simple/
数据准备
首先,我们需要导入必要的库并创建一些示例数据:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 设置中文显示(如果需要)
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
# 创建示例数据
np.random.seed(42)
dates = pd.date_range('2023-01-01', periods=100)
df = pd.DataFrame({
'日期': dates,
'销售额': np.random.randint(100, 1000, size=100).cumsum(),
'访问量': np.random.randint(50, 200, size=100),
'产品A': np.random.normal(100, 20, 100),
'产品B': np.random.normal(150, 30, 100),
'产品C': np.random.normal(80, 15, 100),
'类别': np.random.choice(['类别1', '类别2', '类别3'], size=100)
})
numpy是python另一个数据处理库,在今天这个例子中只是为了获取随机数,以后再介绍更多详细处理的例子
基本折线图
# 绘制销售额趋势图
plt.figure(figsize=(10, 6))
plt.plot(df['日期'], df['销售额'], label='销售额', marker='o')
plt.title('销售额随时间变化趋势')
plt.xlabel('日期')
plt.ylabel('销售额')
plt.legend()
plt.grid(True)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
如图,上面展示了随机数据生成的销售数据趋势变化折线图
柱状图
# 按类别分组计算平均销售额
category_avg = df.groupby('类别')['销售额'].mean()
plt.figure(figsize=(8, 5))
category_avg.plot(kind='bar', color=['skyblue', 'salmon', 'lightgreen'])
plt.title('各类别平均销售额')
plt.xlabel('类别')
plt.ylabel('平均销售额')
plt.xticks(rotation=0)
plt.grid(axis='y')
plt.show()
如图,上面展示了随机数据生成的各个类别的平均销售额
总结
安装python库遇到的网络问题,以及我的解决方案
折线图和柱状图的展示