Skip to content

[译]Pyplot教程

原文地址:pyplot-tutorial

Pyplot介绍

matplotlib.pyplot是命令样式函数的集合,目的是让matplotlibMATLAB一样工作。每个pyplot函数都对图像做一些改变:比如,创建一张图像、在图形中创建绘图区域、在绘图区域中绘制一些线条、用标签装饰绘图,等等

matplotlib.pyplot中,不同的状态在函数调用之间被保留,这样它就可以跟踪当前图形和绘图区域,并且绘图功能被定向到当前轴(请注意,这里的“轴”以及文档中大多数地方指的是绘图区域,参考下图,而不是严格意义上的数学术语)

注意:Pyplot API通常不如面向对象的API灵活。您在这里看到的大多数函数调用也可以作为来自axes对象的方法调用。我们建议浏览教程和示例,以了解这是如何工作的

使用pyplot生成可视化非常便捷

import matplotlib.pyplot as plt
plt.plot([1, 2, 3, 4])
plt.ylabel('some numbers')
plt.show()

你肯定想知道为什么x轴取值为0-3y轴取值为1-4。如果你输入单个列表或者数组到命令plot()matplotlib假定它是y轴的序列值,同时自动生成x轴值。因为python0开始,生成的x轴向量和y轴向量长度相同,但是从0开始。因此x轴数据是[0,1,2,3]

plot()是一个通用的命令,可以接受任意数量的参数。例如,要绘制xy,可以发出以下命令:

plt.plot([1, 2, 3, 4], [1, 4, 9, 16])

格式化绘图样式

对于每对x,y参数,都有一个可选的第三个参数,它是指示绘图颜色和线条类型的格式字符串。格式字符串的字母和符号来自matlab,你可以将颜色字符串与线样式字符串连接起来。默认的格式字符串是 b-,表示一条实心蓝线。比如,用红色圆圈绘图,可以输入ro

plt.plot([1, 2, 3, 4], [1, 4, 9, 16], 'ro')
plt.axis([0, 6, 0, 20])
plt.show()

查看matplotlib.pyplot.plot文档关于完整的线类型和格式字符串的列表。上面的axis()命令输入一组[xmin, xmax, ymin, ymax],同时指定轴的视区

如果matplotlib仅限于使用列表,那么它对于数字处理将相当无用。通常,您将使用numpy数组。实际上,所有序列都在内部转换为numpy数组。下面的示例说明如何使用数组在一个命令中绘制具有不同格式样式的多条线

import numpy as np

# evenly sampled time at 200ms intervals
t = np.arange(0., 5., 0.2)

# red dashes, blue squares and green triangles
plt.plot(t, t, 'r--', t, t**2, 'bs', t, t**3, 'g^')
plt.show()

使用关键字字符串绘图

某些情况下允许您使用字符串访问特定变量。比如numpy.recarray或者pandas.DataFrame

matplotlib允许您为此类对象提供data关键字参数。如果提供,则可以使用与这些变量对应的字符串生成绘图

data = {'a': np.arange(50),
        'c': np.random.randint(0, 50, 50),
        'd': np.random.randn(50)}
data['b'] = data['a'] + 10 * np.random.randn(50)
data['d'] = np.abs(data['d']) * 100

plt.scatter('a', 'b', c='c', s='d', data=data)
plt.xlabel('entry a')
plt.ylabel('entry b')
plt.show()

使用分类变量绘图

也可以使用分类变量创建一个图。Matplotlib允许您将分类变量直接传递给许多绘图函数。例如:

names = ['group_a', 'group_b', 'group_c']
values = [1, 10, 100]

plt.figure(1, figsize=(9, 3))

plt.subplot(131)
plt.bar(names, values)
plt.subplot(132)
plt.scatter(names, values)
plt.subplot(133)
plt.plot(names, values)
plt.suptitle('Categorical Plotting')
plt.show()

控制线条属性

线条具有许多可以设置的属性:线条宽度、虚线样式、抗锯齿等;参见matplotlib.lines.line2D。有几种设置线条属性的方法

  • 使用关键字参数
plt.plot(x, y, linewidth=2.0)
  • 使用Line2D实例的setter方法。plot返回一列Line2D对象,比如line1, line2 = plot(x1, y1, x2, y2)。在下面的代码中,我们假设只有一行,因此返回的列表长度为1。我们使用元组解压的方式来获取该列表的第一个元素:
line, = plt.plot(x, y, '-')
line.set_antialiased(False) # turn off antialising
  • 使用setp()属性。下面示例使用matlab样式的命令在一个行列表上设置多个属性。setp透明地处理对象列表或单个对象。您可以使用python关键字参数或matlab样式的字符串/值对:
lines = plt.plot(x1, y1, x2, y2)
# use keyword args
plt.setp(lines, color='r', linewidth=2.0)
# or MATLAB style string value pairs
plt.setp(lines, 'color', 'r', 'linewidth', 2.0)

以下是有效的Line2D属性

要获取可设置行属性的列表,请使用linelines作为参数调用setp()函数

>>> import matplotlib.pyplot as plt
>>> lines = plt.plot([1, 2, 3])
>>> plt.setp(lines)
  agg_filter: a filter function, which takes a (m, n, 3) float array and a dpi value, and returns a (m, n, 3) array 
  alpha: float
  animated: bool
  ...
  ...

使用多个图形和轴

matlabpyplot都有当前图形和当前轴的概念。所有绘图命令都应用于当前轴。函数gca()返回当前轴(matplotlib.axes.Axes实例),gcf()返回当前图形(matplotlib.figure.figure实例)。通常情况下,你不必担心这件事,因为它都是在幕后处理的。下面是创建两个子图的脚本

def f(t):
    return np.exp(-t) * np.cos(2*np.pi*t)

t1 = np.arange(0.0, 5.0, 0.1)
t2 = np.arange(0.0, 5.0, 0.02)

plt.figure(1)
plt.subplot(211)
plt.plot(t1, f(t1), 'bo', t2, f(t2), 'k')

plt.subplot(212)
plt.plot(t2, np.cos(2*np.pi*t2), 'r--')
plt.show()

这里的figure()命令是可选的,因为默认情况下将创建figure(1),正如如果不手动指定任何轴,默认情况下将创建subplot(111)subplot()命令指定了数字行(numrows)、数字列(numcols)、绘图编号(plot_number),其中绘图编号的取值范围是[1, numrows*numcols]。如果numrows*numcols<10,那么subplot命令中可以不使用逗号(comma)隔开,所以subplot(211)等同于subplot(2, 1, 1)

你可以创建任意数量的子图和轴。如果你想要手动放置一个轴,比如,不是常规的网格,使用axes()命令,该命令允许您将位置指定为axes([左、下、宽、高]),其中所有值都以分数(01)坐标表示。参考一个手动放置实例Axes Demo以及一个放置许多子图的实例Basic Subplot Demo

可以使用带有递增数字的多个figure()调用来创建多个图像。当然,每个图形可以包含尽可能多的轴和子图:

import matplotlib.pyplot as plt
plt.figure(1)                # the first figure
plt.subplot(211)             # the first subplot in the first figure
plt.plot([1, 2, 3])
plt.subplot(212)             # the second subplot in the first figure
plt.plot([4, 5, 6])


plt.figure(2)                # a second figure
plt.plot([4, 5, 6])          # creates a subplot(111) by default

plt.figure(3)                # figure 1 current; subplot(212) still current
plt.subplot(211)             # make subplot(211) in figure1 current
plt.title('Easy as 1, 2, 3') # subplot 211 title

plt.show()

使用命令clf()可以清理当前图像,使用命令cla()清理当前轴。如果你觉得在幕后维护状态(特别是当前图像、图形和轴)很烦人,不要失望:这只是围绕面向对象API的一个薄的有状态包装器,您可以使用其他来代替(请参见艺术家教程

文本工作

text()命令可用于在任意位置添加文本,xlable()ylabel()title()用于在指定位置添加文本。

mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)

# the histogram of the data
n, bins, patches = plt.hist(x, 50, density=1, facecolor='g', alpha=0.75)


plt.xlabel('Smarts')
plt.ylabel('Probability')
plt.title('Histogram of IQ')
plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
plt.axis([40, 160, 0, 0.03])
plt.grid(True)
plt.show()

所有的text()命令都返回matplotlib.text.text实例。与上面的行一样,可以通过将关键字参数传递到文本函数或使用setp()自定义属性:

t = plt.xlabel('my data', fontsize=14, color='red')

更多详细属性在Text properties and layout

在文本中使用数学表达式

matplotlib接受任何文本表达式中的tex表达式。比如在标题中写入$\sigma_{i}=15$,可以写一个TeX表达式,用$符号括起来:

plt.title(r'$\sigma_i=15$')

标题字符串前面的r很重要——它表示该字符串是原始字符串,而不是将反斜杠视为python转义。matplotlib有一个内置的tex表达式解析器和布局引擎,并提供自己的数学字体——有关详细信息,请参阅Writing mathematical expressions。因此,您可以跨平台使用数学文本,而无需安装tex。对于安装了LaTexDvipng的用户,还可以使用LaTex来格式化文本,并将输出直接合并到显示图形或保存的PostScript中,参考Text rendering With LaTeX

注解文本

上面使用的基础text()命令将文本放置在轴上的任意位置。文本的一个常见用途是注释绘图的某些特征。annotate()方法提供了帮助器功能,使注释变得容易。在注释中,需要考虑两点:由参数xy表示的注释位置和文本xytext的位置。这两个参数都是(x,y)元组格式。

ax = plt.subplot(111)

t = np.arange(0.0, 5.0, 0.01)
s = np.cos(2*np.pi*t)
line, = plt.plot(t, s, lw=2)

plt.annotate('local max', xy=(2, 1), xytext=(3, 1.5),
             arrowprops=dict(facecolor='black', shrink=0.05),
             )

plt.ylim(-2, 2)
plt.show()

在这个基本示例中,xy(箭头尖端)和xytext位置(文本位置)都在数据坐标中。您可以选择其他各种坐标系——有关详细信息,请参见基本注释高级注释。更多的例子可以在注释图中找到

对数轴和其他非线性轴

pyplot不仅支持线性轴比例,还支持对数和逻辑比例。如果数据跨越多个数量级,则通常使用这种方法。更改轴的比例很容易:

plt.xscale('log')

下面是四个具有相同数据和不同比例的Y轴绘图的示例

from matplotlib.ticker import NullFormatter  # useful for `logit` scale

# Fixing random state for reproducibility
np.random.seed(19680801)

# make up some data in the interval ]0, 1[
y = np.random.normal(loc=0.5, scale=0.4, size=1000)
y = y[(y > 0) & (y < 1)]
y.sort()
x = np.arange(len(y))

# plot with various axes scales
plt.figure(1)

# linear
plt.subplot(221)
plt.plot(x, y)
plt.yscale('linear')
plt.title('linear')
plt.grid(True)


# log
plt.subplot(222)
plt.plot(x, y)
plt.yscale('log')
plt.title('log')
plt.grid(True)


# symmetric log
plt.subplot(223)
plt.plot(x, y - y.mean())
plt.yscale('symlog', linthreshy=0.01)
plt.title('symlog')
plt.grid(True)

# logit
plt.subplot(224)
plt.plot(x, y)
plt.yscale('logit')
plt.title('logit')
plt.grid(True)
# Format the minor tick labels of the y-axis into empty strings with
# `NullFormatter`, to avoid cumbering the axis with too many labels.
plt.gca().yaxis.set_minor_formatter(NullFormatter())
# Adjust the subplot layout, because the logit one may take more space
# than usual, due to y-tick labels like "1 - 10^{-3}"
plt.subplots_adjust(top=0.92, bottom=0.08, left=0.10, right=0.95, hspace=0.25,
                    wspace=0.35)

plt.show()

也可以添加自己的比例,有关详细信息,请参阅Developer's guide for creating scales and transformations

下载Python源码:pyplot.py

下载Jupyter notebookpyplot.ipynb