Python 函數式編程：不可變數據結構

在這個由兩篇文章構成的系列中，我將討論如何將函數式編程方法論中的思想引入至 Python 中，來充分發揮這兩個領域的優勢。

本文（也就是第一篇文章）中，我們將探討不可變數據結構的優勢。第二部分會探討如何在 toolz 庫的幫助下，用 Python 實現高層次的函數式編程理念。

為什麼要用函數式編程？因為變化的東西更難推理。如果你已經確信變化會帶來麻煩，那很棒。如果你還沒有被說服，在文章結束時，你會明白這一點的。

我們從思考正方形和矩形開始。如果我們拋開實現細節，單從介面的角度考慮，正方形是矩形的子類嗎？

子類的定義基於里氏替換原則。一個子類必須能夠完成超類所做的一切。

如何為矩形定義介面？

from zope.interface import Interface

class IRectangle(Interface):
    def get_length(self):
        """正方形能做到"""
    def get_width(self):
        """正方形能做到"""
    def set_dimensions(self, length, width):
        """啊哦"""

如果我們這麼定義，那正方形就不能成為矩形的子類：如果長度和寬度不等，它就無法對 set_dimensions 方法做出響應。

另一種方法，是選擇將矩形做成不可變對象。

class IRectangle(Interface):
    def get_length(self):
        """正方形能做到"""
    def get_width(self):
        """正方形能做到"""
    def with_dimensions(self, length, width):
        """返回一個新矩形"""

現在，我們可以將正方形視為矩形了。在調用 with_dimensions 時，它可以返回一個新的矩形（它不一定是個正方形），但它本身並沒有變，依然是一個正方形。

這似乎像是個學術問題 —— 直到我們認為正方形和矩形可以在某種意義上看做一個容器的側面。在理解了這個例子以後，我們會處理更傳統的容器，以解決更現實的案例。比如，考慮一下隨機存取數組。

我們現在有 ISquare 和 IRectangle，而且 ISequere 是 IRectangle 的子類。

我們希望把矩形放進隨機存取數組中：

class IArrayOfRectangles(Interface):
    def get_element(self, i):
        """返回一個矩形"""
    def set_element(self, i, rectangle):
        """&apos;rectangle&apos; 可以是任意 IRectangle 對象"""

我們同樣希望把正方形放進隨機存取數組：

class IArrayOfSquare(Interface):
    def get_element(self, i):
        """返回一個正方形"""
    def set_element(self, i, square):
        """&apos;square&apos; 可以是任意 ISquare 對象"""

儘管 ISquare 是 IRectangle 的子集，但沒有任何一個數組可以同時實現 IArrayOfSquare 和 IArrayOfRectangle.

為什麼不能呢？假設 bucket 實現了這兩個類的功能。

>>> rectangle = make_rectangle(3, 4)
>>> bucket.set_element(0, rectangle) # 這是 IArrayOfRectangle 中的合法操作
>>> thing = bucket.get_element(0) # IArrayOfSquare 要求 thing 必須是一個正方形
>>> assert thing.height == thing.width
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AssertionError

無法同時實現這兩類功能，意味著這兩個類無法構成繼承關係，即使 ISquare 是 IRectangle 的子類。問題來自 set_element 方法：如果我們實現一個只讀的數組，那 IArrayOfSquare 就可以是 IArrayOfRectangle 的子類了。

在可變的 IRectangle 和可變的 IArrayOf* 介面中，可變性都會使得對類型和子類的思考變得更加困難 —— 放棄變換的能力，意味著我們的直覺所希望的類型間關係能夠成立了。

可變性還會帶來作用域方面的影響。當一個共享對象被兩個地方的代碼改變時，這種問題就會發生。一個經典的例子是兩個線程同時改變一個共享變數。不過在單線程程序中，即使在兩個相距很遠的地方共享一個變數，也是一件簡單的事情。從 Python 語言的角度來思考，大多數對象都可以從很多位置來訪問：比如在模塊全局變數，或在一個堆棧跟蹤中，或者以類屬性來訪問。

如果我們無法對共享做出約束，那我們可能要考慮對可變性來進行約束了。

這是一個不可變的矩形，它利用了 attr 庫：

@attr.s(frozen=True)
class Rectange(object):
    length = attr.ib()
    width = attr.ib()
    @classmethod
    def with_dimensions(cls, length, width):
        return cls(length, width)

這是一個正方形：

@attr.s(frozen=True)
class Square(object):
    side = attr.ib()
    @classmethod
    def with_dimensions(cls, length, width):
        return Rectangle(length, width)

使用 frozen 參數，我們可以輕易地使 attrs 創建的類成為不可變類型。正確實現 __setitem__ 方法的工作都交給別人完成了，對我們是不可見的。

修改對象仍然很容易；但是我們不可能改變它的本質。

too_long = Rectangle(100, 4)
reasonable = attr.evolve(too_long, length=10)

Pyrsistent 能讓我們擁有不可變的容器。

# 由整數構成的向量
a = pyrsistent.v(1, 2, 3)
# 並非由整數構成的向量
b = a.set(1, "hello")

儘管 b 不是一個由整數構成的向量，但沒有什麼能夠改變 a 只由整數構成的性質。

如果 a 有一百萬個元素呢？b 會將其中的 999999 個元素複製一遍嗎？Pyrsistent 具有「大 O」性能保證：所有操作的時間複雜度都是 O(log n). 它還帶有一個可選的 C 語言擴展，以在「大 O」性能之上進行提升。

修改嵌套對象時，會涉及到「變換器」的概念：

blog = pyrsistent.m(
    title="My blog",
    links=pyrsistent.v("github", "twitter"),
    posts=pyrsistent.v(
        pyrsistent.m(title="no updates",
                     content="I&apos;m busy"),
        pyrsistent.m(title="still no updates",
                     content="still busy")))
new_blog = blog.transform(["posts", 1, "content"],
                          "pretty busy")

new_blog 現在將是如下對象的不可變等價物：

{&apos;links&apos;: [&apos;github&apos;, &apos;twitter&apos;],
 &apos;posts&apos;: [{&apos;content&apos;: "I&apos;m busy",
            &apos;title&apos;: &apos;no updates&apos;},
           {&apos;content&apos;: &apos;pretty busy&apos;,
            &apos;title&apos;: &apos;still no updates&apos;}],
 &apos;title&apos;: &apos;My blog&apos;}

不過 blog 依然不變。這意味著任何擁有舊對象引用的人都沒有受到影響：轉換隻會有局部效果。

當共享行為猖獗時，這會很有用。例如，函數的默認參數：

def silly_sum(a, b, extra=v(1, 2)):
    extra = extra.extend([a, b])
    return sum(extra)

在本文中，我們了解了為什麼不可變性有助於我們來思考我們的代碼，以及如何在不帶來過大性能負擔的條件下實現它。下一篇，我們將學習如何藉助不可變對象來實現強大的程序結構。

via: https://opensource.com/article/18/10/functional-programming-python-immutable-data-structures

作者：Moshe Zadka 選題：lujun9972 譯者：StdioA 校對：wxy

本文由 LCTT 原創編譯，Linux中國榮譽推出

本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何？

太棒了

不錯

愛死了

不太好

感覺很糟

Rain

雨落清風。心向陽

Python 函數式編程：不可變數據結構

對這篇文章感覺如何？

5 個適合系統管理員使用的告警可視化工具

KRS：一個收集 Kubernetes 資源統計數據的新工具

Leave a reply 取消回復

More in:Linux中國

捐贈 Let's Encrypt，共建安全的互聯網

Let's Encrypt 正式發布，已經保護 380 萬個域名

關於Linux防火牆iptables的面試問答

Lets Encrypt 已被所有主流瀏覽器所信任

中文操作系統論壇

關注 LinuxStory

開源學村

編程類開放書籍薈萃

如何殺死 Linux 中的殭屍進程

2022年，從學習Rust開始

使用 Linux 命令行解決Wordle 問題

5本學習 TeX 的最佳免費書籍

Makefile 簡介

Linux 內核補丁提交初體驗

Linux 的前世今生 – 1

特別關注

更開放的分散式事務 | Fescar 品牌升級，更名為 Seata

HeRM’s – 一個命令食譜管理器

使用 Let's Encrypt 保護你的網站

LinuxStory

加入 LinuxStory 交流群組

投票調查

最熱標籤

分享

對這篇文章感覺如何？

You may also like

Leave a reply 取消回復

More in:Linux中國

中文操作系統論壇

關注 LinuxStory

開源學村

特別關注

最新文章

最熱標籤