使用這些 Python 工具可視化地探索數據
結合 Python、Pygwalker、Pandas 和 Jupyter Notebook,為你的數據提供一個動態的可視化界面。
開源工具在推動技術進步和使其更加普及方面發揮了重要作用。數據分析也不例外。隨著數據變得越來越豐富和複雜,數據科學家 始終在尋找簡化工作流程並創建互動式和吸引人的可視化的方式。PyGWalker 就是為解決此類問題而設計的。
PyGWalker(Graphic Walker 的 Python 綁定)將 Python Jupyter Notebook 的工作環境連接到 Graphic Walker,以創建開源數據可視化工具。你可以通過簡單的拖放操作將 Pandas 數據幀 轉化為精美的數據可視化。
開始使用 PyGWalker
使用 pip
安裝 PyGWalker:
$ python3 -m pip install pygwalker
導入 pygwalker
和 pandas
以在項目中使用它:
import pandas as pd
import pygwalker as pyg
將數據載入到 Pandas 數據報中並調用 PyGWalker:
df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)
你現在有一個圖形用戶界面來探索和可視化你的 Pandas 數據幀!
使用 Graphic Walker 探索數據
Graphic Walker 的主要功能之一是能夠更改標記類型以創建不同類型的圖表。例如,通過將標記類型更改為折線來創建折線圖。
你還可以通過創建 concat 視圖來比較不同的度量,該視圖將多個度量添加到行和列中。
將維度放入行或列中,以創建一個 facet 視圖,這個視圖包含多個子視圖,這些子視圖由一個維度中的值分隔開。
在 數據 選項卡中,你可以在表格中查看數據幀並配置分析和語義類型。
使用 PyGWalker 進行數據探索
你可以使用 PyGWalker 將 Pandas 數據轉換為高度可定製的圖形圖表。你也可以使用 PyGWalker 作為探索數據的強大工具,以發現潛在的模式、趨勢和洞察力。
數據探索選項可以在「 探索模式 」選項(工具欄中)中找到。它們可以設置為點模式或刷模式。
- 點模式:通過將你的滑鼠游標指向數據的一個特定部分來探索數據。
- 刷模式:通過在數據範圍周圍畫一個選擇框來探索數據,然後拖動選擇框來查看生成的報告。
試試看你的數據
你可以在這些雲演示中試用 PyGWalker:Google Colab、Binder 或 Graphic Walker Online Demo。
PyGWalker 是一個用於簡化數據分析和可視化工作流程的優秀工具,特別是對於那些想要使用 Pandas 進行界面可視化的人。藉助 PyGWalker 和 Graphic Walker,數據科學家可以在 Jupyter Notebook 中通過簡單的拖放操作輕鬆創建令人驚嘆的可視化效果。請查看 PyGWalker Git 倉庫獲取源代碼。
對於尋求自動化數據探索和高級增強分析的開源解決方案的數據科學家,該項目還適用於 RATH,這是一種開源自動 EDA、人工智慧支持的數據探索和可視化工具。你還可以查看 RATH Git 倉庫 獲取源代碼和活躍的社區。
(題圖:MJ/21c21716-b900-4466-98a9-51268960c9b8)
via: https://opensource.com/article/23/4/data-visualization-pygwalker-jupyter-notebook
作者:Bill Wang 選題:lkxed 譯者:geekpi 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive