datawhale-动手学数据分析task4笔记

LPF05 / 2024-03-19 / 原文

动手学数据分析task4

数据可视化

  1. matplotlib的图像都位于figure对象中,创建新的对象用plt.figure

  2. plt.subplot()方法可以更方便地创建一个新figure,并返回一个含有以创建的subplot对象的numpy数组。

    '''
    参数说明:
    nrows=int,subplot的行数
    ncols=int,subplot的列数
    sharex=Bool/'none'/'all'/'row'/'col',所有subplot是否使用相同的x轴刻度(调节xlim将会影响所以的subplot)
    sharey=Bool/'none'/'all'/'row'/'col',所有subplot是否使用相同的x轴刻度(调节ylim将会影响所以的subplot)
    squeeze=Bool,是否返回生成图形的具体对象,如果False,则返回一个字图(numpy数组)
    subplot_kw=dict,用于创建各subplot的关键字字典
    gridspec_kw=dict,指定子图网格的大小和比例
    **fig_kw,创建figure时的其他关键字
    '''
    
    # 以下有具体值的为默认值
    plt.subplots(nrows=1, ncols=1, sharex=False, sharey=False, squeeze=True, subplot_kw=None, gridspec_kw=None, **fig_kw)
    
  3. pllt.bar()函数可以刻画竖直柱状图。

    '''
    参数说明:
    x=float/list,表示x坐标
    y=float/list,表示柱状图的高度(y坐标)
    width=float(0-1)/list,表示柱状图的宽度
    bottom=float/list,表示柱状图的起始位置
    align='center'/'edge',表示柱状图的中心位置
    label 表示标签
    color=color/color list 表示柱状图颜色,默认blue
    linewidth=None/float 表示边框宽度
    linestyle 表示线条样式
    '''
    
    # 以下有具体值的为默认值
    plt.bar(x, height, width=0.8, bottom=None, *, align='center', data=None, **kwargs)
    
  4. 可对Series、DataFrame对象直接使用.plot.bar()绘制柱形图。

    # 绘制柱形图
    Series.plot.bar()
    
    # 为柱形图添加title,并展示
    plt.title('...')
    plt.show()
    
  5. .plot()可直接将DF或series数据可视化。

    '''
    参数说明:
    x=label/position
    y=None/label/labels/positions
    kind=str,'line'折线图、'bar'竖直柱状图、'barh'水平柱状图、'hist'直方图、'box'箱线图、'kde''density'核密度估计图、'area'面积图、'pie'饼图、'scatter'散点图、'hexbin'六边形箱图
    stacked=Bool,是否堆叠图
    '''
    
    df.plot(*args, **kwargs)
    
  6. 可以先将MutiIndex通过.unstack()方法去掉多层索引然后再使用plot(kind='bar', stacked=True)创建堆叠图柱状图,如果去掉stcaked参数即可获得对比柱状图。