Linux中國

使用 Pandas 在 Python 中繪製數據

在有關基於 Python 的繪圖庫的系列文章中,我們將對使用 Pandas 這個非常流行的 Python 數據操作庫進行繪圖進行概念性的研究。Pandas 是 Python 中的標準工具,用於對進行數據可擴展的轉換,它也已成為從 CSV 和 Excel 格式導入和導出數據的流行方法。

除此之外,它還包含一個非常好的繪圖 API。這非常方便,你已將數據存儲在 Pandas DataFrame 中,那麼為什麼不使用相同的庫進行繪製呢?

在本系列中,我們將在每個庫中製作相同的多條形柱狀圖,以便我們可以比較它們的工作方式。我們使用的數據是 1966 年至 2020 年的英國大選結果:

![Matplotlib UK election results](/data/attachment/album/202006/19/231917tz6lbppeolgshe6z.png "Matplotlib UK election results")

自行繪製的數據

在繼續之前,請注意你可能需要調整 Python 環境來運行此代碼,包括:

  • 運行最新版本的 Python(用於 LinuxMacWindows 的說明)
  • 確認你運行的是與這些庫兼容的 Python 版本

數據可在線獲得,並可使用 Pandas 導入:

import pandas as pd
df = pd.read_csv('https://anvil.works/blog/img/plotting-in-python/uk-election-results.csv')

現在我們已經準備好了。在本系列文章中,我們已經看到了一些令人印象深刻的簡單 API,但是 Pandas 一定能奪冠。

要在 x 軸上繪製按年份和每個黨派分組的柱狀圖,我只需要這樣做:

import matplotlib.pyplot as plt
ax = df.plot.bar(x='year')
plt.show()

只有四行,這絕對是我們在本系列中創建的最棒的多條形柱狀圖。

我以寬格式使用數據,這意味著每個黨派都有一列:

        year  conservative  labour  liberal  others
0       1966           253     364       12       1
1       1970           330     287        6       7
2   Feb 1974           297     301       14      18
..       ...           ...     ...      ...     ...
12      2015           330     232        8      80
13      2017           317     262       12      59
14      2019           365     202       11      72

這意味著 Pandas 會自動知道我希望如何分組,如果我希望進行不同的分組,Pandas 可以很容易地重組 DataFrame

Seaborn 一樣,Pandas 的繪圖功能是 Matplotlib 之上的抽象,這就是為什麼要調用 Matplotlib 的 plt.show() 函數來實際生成繪圖的原因。

看起來是這樣的:

![pandas unstyled data plot](/data/attachment/album/202006/19/231923nyyhil6e9gmlzytw.png "pandas unstyled data plot")

看起來很棒,特別是它又這麼簡單!讓我們對它進行樣式設置,使其看起來像 Matplotlib 的例子。

調整樣式

我們可以通過訪問底層的 Matplotlib 方法輕鬆地調整樣式。

首先,我們可以通過將 Matplotlib 顏色表傳遞到繪圖函數來為柱狀圖著色:

from matplotlib.colors import ListedColormap
cmap = ListedColormap(['#0343df', '#e50000', '#ffff14', '#929591'])
ax = df.plot.bar(x='year', colormap=cmap)

我們可以使用繪圖函數的返回值設置坐標軸標籤和標題,它只是一個 Matplotlib 的 Axis 對象

ax.set_xlabel(None)
ax.set_ylabel('Seats')
ax.set_title('UK election results')

這是現在的樣子:

![pandas styled plot](/data/attachment/album/202006/19/231937jrk33kee4vzu51ud.png "pandas styled plot")

這與上面的 Matplotlib 版本幾乎相同,但是只用了 8 行代碼而不是 16 行!我內心的代碼高手非常高興。

抽象必須是可轉義的

與 Seaborn 一樣,向下訪問 Matplotlib API 進行細節調整的能力確實很有幫助。這是給出抽象緊急出口使其既強大又簡單的一個很好的例子。

via: https://opensource.com/article/20/6/pandas-python

作者:Shaun Taylor-Morgan 選題:lujun9972 譯者:geekpi 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國