Linux中國

尾調用、優化和 ES6

在探秘「棧」的倒數第二篇文章中,我們提到了 尾調用 tail call 、編譯優化、以及新發布的 JavaScript 上 合理尾調用 proper tail call

當一個函數 F 調用另一個函數作為它的結束動作時,就發生了一個尾調用。在那個時間點,函數 F 絕對不會有多餘的工作:函數 F 將「球」傳給被它調用的任意函數之後,它自己就「消失」了。這就是關鍵點,因為它打開了尾調用優化的「可能之門」:我們可以簡單地重用函數 F 的棧幀,而不是為函數調用 創建一個新的棧幀,因此節省了棧空間並且避免了新建一個棧幀所需要的工作量。下面是一個用 C 寫的簡單示例,然後使用 mild 優化 來編譯它的結果:

int add5(int a)
{
    return a + 5;
}

int add10(int a)
{
    int b = add5(a); // not tail
    return add5(b); // tail
}

int add5AndTriple(int a){
    int b = add5(a); // not tail
    return 3 * add5(a); // not tail, doing work after the call
}

int finicky(int a){
    if (a > 10){
        return add5AndTriple(a); // tail
    }

    if (a > 5){
        int b = add5(a); // not tail
        return finicky(b); // tail
    }

    return add10(a); // tail
}

簡單的尾調用 下載

在編譯器的輸出中,在預期會有一個 調用 的地方,你可以看到一個 跳轉 指令,一般情況下你可以發現尾調用優化(以下簡稱 TCO)。在運行時中,TCO 將會引起調用棧的減少。

一個通常認為的錯誤觀念是,尾調用必須要 遞歸。實際上並不是這樣的:一個尾調用可以被遞歸,比如在上面的 finicky() 中,但是,並不是必須要使用遞歸的。在調用點只要函數 F 完成它的調用,我們將得到一個單獨的尾調用。是否能夠進行優化這是一個另外的問題,它取決於你的編程環境。

「是的,它總是可以!」,這是我們所希望的最佳答案,它是著名的 Scheme 中的方式,就像是在 SICP上所討論的那樣(順便說一聲,如果你的程序不像「一個魔法師使用你的咒語召喚你的電腦精靈」那般有效,建議你讀一下這本書)。它也是 Lua 的方式。而更重要的是,它是下一個版本的 JavaScript —— ES6 的方式,這個規範清晰地定義了尾的位置,並且明確了優化所需要的幾個條件,比如,嚴格模式。當一個編程語言保證可用 TCO 時,它將支持 合理尾調用 proper tail call

現在,我們中的一些人不能拋開那些 C 的習慣,心臟出血,等等,而答案是一個更複雜的「有時候」,它將我們帶進了編譯優化的領域。我們看一下上面的那個 簡單示例;把我們 上篇文章 的階乘程序重新拿出來:

#include  <stdio.h>

int factorial(int n)
{
    int previous = 0xdeadbeef;

    if (n == 0 || n == 1) {
        return 1;
    }

    previous = factorial(n-1);
    return n * previous;
}

int main(int argc)
{
    int answer = factorial(5);
    printf("%dn", answer);
}

遞歸階乘 下載

像第 11 行那樣的,是尾調用嗎?答案是:「不是」,因為它被後面的 n 相乘了。但是,如果你不去優化它,GCC 使用 O2 優化結果 會讓你震驚:它不僅將階乘轉換為一個 無遞歸循環,而且 factorial(5) 調用被整個消除了,而以一個 120 (5! == 120) 的 編譯時常數來替換。這就是調試優化代碼有時會很難的原因。好的方面是,如果你調用這個函數,它將使用一個單個的棧幀,而不會去考慮 n 的初始值。編譯演算法是非常有趣的,如果你對它感興趣,我建議你去閱讀 構建一個優化編譯器ACDI

但是,這裡沒有做尾調用優化時到底發生了什麼?通過分析函數的功能和無需優化的遞歸發現,GCC 比我們更聰明,因為一開始就沒有使用尾調用。由於過於簡單以及很確定的操作,這個任務變得很簡單。我們給它增加一些可以引起混亂的東西(比如,getpid()),我們給 GCC 增加難度:

#include <stdio.h> 
#include <sys/types.h>
#include <unistd.h>

int pidFactorial(int n)
{
    if (1 == n) {
        return getpid(); // tail
    }

    return n * pidFactorial(n-1) * getpid(); // not tail
}

int main(int argc)
{
    int answer = pidFactorial(5);
    printf("%dn", answer);
}

遞歸 PID 階乘 下載

優化它,unix 精靈!現在,我們有了一個常規的 遞歸調用 並且這個函數分配 O(n) 棧幀來完成工作。GCC 在遞歸的基礎上仍然 為 getpid 使用了 TCO。如果我們現在希望讓這個函數尾調用遞歸,我需要稍微變一下:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int tailPidFactorial(int n, int acc)
{
    if (1 == n) {
        return acc * getpid(); // not tail
    }

    acc = (acc * getpid() * n);
    return tailPidFactorial(n-1, acc); // tail
}

int main(int argc)
{
    int answer = tailPidFactorial(5, 1);
    printf("%dn", answer);
}

tailPidFactorial.c 下載

現在,結果的累加是 一個循環,並且我們獲得了真實的 TCO。但是,在你慶祝之前,我們能說一下關於在 C 中的一般情形嗎?不幸的是,雖然優秀的 C 編譯器在大多數情況下都可以實現 TCO,但是,在一些情況下它們仍然做不到。例如,正如我們在 函數序言 中所看到的那樣,函數調用者在使用一個標準的 C 調用規則調用一個函數之後,它要負責去清理棧。因此,如果函數 F 帶了兩個參數,它只能使 TCO 調用的函數使用兩個或者更少的參數。這是 TCO 的眾多限制之一。Mark Probst 寫了一篇非常好的論文,他們討論了 在 C 中的合理尾遞歸,在這篇論文中他們討論了這些屬於 C 棧行為的問題。他也演示一些 瘋狂的、很酷的欺騙方法

「有時候」 對於任何一種關係來說都是不堅定的,因此,在 C 中你不能依賴 TCO。它是一個在某些地方可以或者某些地方不可以的離散型優化,而不是像合理尾調用一樣的編程語言的特性,雖然在實踐中可以使用編譯器來優化絕大部分的情形。但是,如果你想必須要實現 TCO,比如將 Scheme 轉譯 transpilation 成 C,你將會 很痛苦

因為 JavaScript 現在是非常流行的轉譯對象,合理尾調用比以往更重要。因此,對 ES6 及其提供的許多其它的重大改進的讚譽並不為過。它就像 JS 程序員的聖誕節一樣。

這就是尾調用和編譯優化的簡短結論。感謝你的閱讀,下次再見!

via:https://manybutfinite.com/post/tail-calls-optimization-es6/

作者:Gustavo Duarte 譯者:qhwdw 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國