Linux中國
使用 Dask 在 Python 中進行並行計算
關於 Python 性能的一個常見抱怨是全局解釋器鎖(GIL)。由於 GIL,同一時刻只能有一個線程執行 Python 位元組碼。因此,即使在現代的多核機器上,使用線程也不會加速計算。
但當你需要並行化到多核時,你不需要放棄使用 Python:Dask 庫可以將計算擴展到多個內核甚至多個機器。某些設置可以在數千台機器上配置 Dask,每台機器都有多個內核。雖然存在擴展規模的限制,但一般達不到。
雖然 Dask 有許多內置的數組操作,但舉一個非內置的例子,我們可以計算偏度:
import numpy
import dask
from dask import array as darray
arr = dask.from_array(numpy.array(my_data), chunks=(1000,))
mean = darray.mean()
stddev = darray.std(arr)
unnormalized_moment = darry.mean(arr * arr * arr)
## See formula in wikipedia:
skewness = ((unnormalized_moment - (3 * mean * stddev ** 2) - mean ** 3) /
stddev ** 3)
請注意,每個操作將根據需要使用儘可能多的內核。這將在所有核心上並行化執行,即使在計算數十億個元素時也是如此。
當然,並不是我們所有的操作都可由這個庫並行化,有時我們需要自己實現並行性。
為此,Dask 有一個「延遲」功能:
import dask
def is_palindrome(s):
return s == s[::-1]
palindromes = [dask.delayed(is_palindrome)(s) for s in string_list]
total = dask.delayed(sum)(palindromes)
result = total.compute()
這將計算字元串是否是迴文並返回迴文的數量。
雖然 Dask 是為數據科學家創建的,但它絕不僅限於數據科學。每當我們需要在 Python 中並行化任務時,我們可以使用 Dask —— 無論有沒有 GIL。
via: https://opensource.com/article/19/4/parallel-computation-python-dask
作者:Moshe Zadka (Community Moderator) 選題:lujun9972 譯者:geekpi 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive
對這篇文章感覺如何?
太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
More in:Linux中國
捐贈 Let's Encrypt,共建安全的互聯網
隨著 Mozilla、蘋果和谷歌對沃通和 StartCom 這兩家 CA 公司處罰落定,很多使用這兩家 CA 所簽發證書的網站紛紛尋求新的證書籤發商。有一個非盈利組織可以為大家提供了免費、可靠和安全的 SSL 證書服務,這就是 Let's Encrypt 項目。現在,它需要您的幫助
Let's Encrypt 正式發布,已經保護 380 萬個域名
由於 Let's Encrypt 讓安裝 X.509 TLS 證書變得非常簡單,所以這個數量增長迅猛。
關於Linux防火牆iptables的面試問答
Nishita Agarwal是Tecmint的用戶,她將分享關於她剛剛經歷的一家公司(印度的一家私人公司Pune)的面試經驗。在面試中她被問及許多不同的問題,但她是iptables方面的專家,因此她想分享這些關於iptables的問題和相應的答案給那些以後可能會進行相關面試的人。 所有的問題和相應的答案都基於Nishita Agarwal的記憶並經過了重寫。 嗨,朋友!我叫Nishita Agarwal。我已經取得了理學學士學位,我的專業集中在UNIX和它的變種(BSD,Linux)。它們一直深深的吸引著我。我在存儲方面有1年多的經驗。我正在尋求職業上的變化,並將供職於印度的P
Lets Encrypt 已被所有主流瀏覽器所信任
旨在讓每個網站都能使用 HTTPS 加密的非贏利組織 Lets Encrypt 已經得了 IdenTrust的交叉簽名,這意味著其證書現在已經可以被所有主流的瀏覽器所信任。從這個裡程碑事件開始,訪問者訪問使用了Lets Encrypt 證書的網站不再需要特別配置就可以得到 HTTPS 安全保護了。 Lets Encrypt 的兩個中級證書 ...

















