Linux中國

使用 Python 讀取電子表格中的數據

Python 是最流行、功能最強大的編程語言之一。由於它是自由開源的,因此每個人都可以使用。大多數 Fedora 系統都已安裝了該語言。Python 可用於多種任務,其中包括處理逗號分隔值(CSV)數據。CSV文件一開始往往是以表格或電子表格的形式出現。本文介紹了如何在 Python 3 中處理 CSV 數據。

CSV 數據正如其名。CSV 文件按行放置數據,數值之間用逗號分隔。每行由相同的欄位定義。簡短的 CSV 文件通常易於閱讀和理解。但是較長的數據文件或具有更多欄位的數據文件可能很難用肉眼解析,因此在這種情況下計算機做得更好。

這是一個簡單的示例,其中的欄位是 NameEmailCountry。在此例中,CSV 數據將欄位定義作為第一行,儘管並非總是如此。

Name,Email,Country
John Q. Smith,jqsmith@example.com,USA
Petr Novak,pnovak@example.com,CZ
Bernard Jones,bjones@example.com,UK

從電子表格讀取 CSV

Python 包含了一個 csv 模塊,它可讀取和寫入 CSV 數據。大多數電子表格應用,無論是原生(例如 Excel 或 Numbers)還是基於 Web 的(例如 Google Sheet),都可以導出 CSV 數據。實際上,許多其他可發布表格報告的服務也可以導出為 CSV(例如,PayPal)。

Python csv 模塊有一個名為 DictReader 的內置讀取器方法,它可以將每個數據行作為有序字典 (OrderedDict) 處理。它需要一個文件對象訪問 CSV 數據。因此,如果上面的文件在當前目錄中為 example.csv,那麼以下代碼段是獲取此數據的一種方法:

f = open('example.csv', 'r')
from csv import DictReader
d = DictReader(f)
data = []
for row in d:
    data.append(row)

現在,內存中的 data 對象是 OrderedDict 對象的列表:

[OrderedDict([('Name', 'John Q. Smith'),
               ('Email', 'jqsmith@example.com'),
               ('Country', 'USA')]),
  OrderedDict([('Name', 'Petr Novak'),
               ('Email', 'pnovak@example.com'),
               ('Country', 'CZ')]),
  OrderedDict([('Name', 'Bernard Jones'),
               ('Email', 'bjones@example.com'),
               ('Country', 'UK')])]

引用這些對象很容易:

>>> print(data[0]['Country'])
USA
>>> print(data[2]['Email'])
bjones@example.com

順便說一句,如果你需要處理沒有欄位名標題行的 CSV 文件,那麼 DictReader 類可以讓你定義它們。在上面的示例中,添加 fieldnames 參數並傳遞一系列名稱:

d = DictReader(f, fieldnames=['Name', 'Email', 'Country'])

真實例子

我最近想從一長串人員名單中隨機選擇一個中獎者。我從電子表格中提取的 CSV 數據是一個簡單的名字和郵件地址列表。

幸運的是,Python 有一個有用的 random 模塊,可以很好地生成隨機值。該模塊 Random 類中的 randrange 函數正是我需要的。你可以給它一個常規的數字範圍(例如整數),以及它們之間的步長值。然後,該函數會生成一個隨機結果,這意味著我可以在數據的總行數範圍內獲得一個隨機整數(或者說是行號)。

這個小程序運行良好:

from csv import DictReader
from random import Random

d = DictReader(open('mydata.csv'))
data = []
for row in d:
    data.append(row)

r = Random()
winner = data[r.randrange(0, len(data), 1)]
print('The winner is:', winner['Name'])
print('Email address:', winner['Email'])

顯然,這個例子非常簡單。電子表格本身包含了複雜的分析數據的方法。但是,如果你想在電子表格應用之外做某事,Python 或許是一種技巧!

題圖由 Isaac Smith 拍攝,發表於 U​​nsplash

via: https://fedoramagazine.org/using-data-from-spreadsheets-in-fedora-with-python/

作者:Paul W. Frields 選題:lujun9972 譯者:geekpi 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的郵箱地址不會被公開。 必填項已用 * 標註

    這個站點使用 Akismet 來減少垃圾評論。了解你的評論數據如何被處理

    More in:Linux中國

    Linux中國

    關於Linux防火牆iptables的面試問答

    Nishita Agarwal是Tecmint的用戶,她將分享關於她剛剛經歷的一家公司(印度的一家私人公司Pune)的面試經驗。在面試中她被問及許多不同的問題,但她是iptables方面的專家,因此她想分享這些關於iptables的問題和相應的答案給那些以後可能會進行相關面試的人。 所有的問題和相應的答案都基於Nishita Agarwal的記憶並經過了重寫。 嗨,朋友!我叫Nishita Agarwal。我已經取得了理學學士學位,我的專業集中在UNIX和它的變種(BSD,Linux)。它們一直深深的吸引著我。我在存儲方面有1年多的經驗。我正在尋求職業上的變化,並將供職於印度的P
    Linux中國

    Lets Encrypt 已被所有主流瀏覽器所信任

    旨在讓每個網站都能使用 HTTPS 加密的非贏利組織 Lets Encrypt 已經得了 IdenTrust的交叉簽名,這意味著其證書現在已經可以被所有主流的瀏覽器所信任。從這個裡程碑事件開始,訪問者訪問使用了Lets Encrypt 證書的網站不再需要特別配置就可以得到 HTTPS 安全保護了。 Lets Encrypt 的兩個中級證書 ...
    Linux中國

    SSL/TLS 加密新紀元 – Lets Encrypt

    根據 Let's Encrypt 官方博客消息,Let's Encrypt 服務將在下周(11 月 16 日)正式對外開放。 Let's Encrypt 項目是由互聯網安全研究小組(ISRG,Internet Security Research Group)主導並開發的一個新型數字證書認證機構(CA,Certificate ...