Linux中國

Go 程序的持續分析

Google 最有趣的部分之一就是我們規模龐大的持續分析服務。我們可以看到誰在使用 CPU 和內存,我們可以持續地監控我們的生產服務以爭用和阻止配置文件,並且我們可以生成分析和報告,並輕鬆地告訴我們可以進行哪些有重要影響的優化

我簡單研究了 Stackdriver Profiler,這是我們的新產品,它填補了針對雲端用戶在雲服務範圍內分析服務的空白。請注意,你無需在 Google 雲平台上運行你的代碼即可使用它。實際上,我現在每天都在開發時使用它。它也支持 Java 和 Node.js。

在生產中分析

pprof 可安全地用於生產。我們針對 CPU 和堆分配分析的額外會增加 5% 的開銷。一個實例中每分鐘收集 10 秒。如果你有一個 Kubernetes Pod 的多個副本,我們確保進行分攤收集。例如,如果你擁有一個 pod 的 10 個副本,模式,那麼開銷將變為 0.5%。這使用戶可以一直進行分析。

我們目前支持 Go 程序的 CPU、堆、互斥和線程分析。

為什麼?

在解釋如何在生產中使用分析器之前,先解釋為什麼你想要在生產中進行分析將有所幫助。一些非常常見的情況是:

  • 調試僅在生產中可見的性能問題。
  • 了解 CPU 使用率以減少費用。
  • 了解爭用的累積和優化的地方。
  • 了解新版本的影響,例如看到 canary 和產品級之間的區別。
  • 通過關聯分析樣本以了解延遲的根本原因來豐富你的分散式經驗。

啟用

Stackdriver Profiler 不能與 net/http/pprof 處理程序一起使用,並要求你在程序中安裝和配置一個一行的代理。

go get cloud.google.com/go/profiler

在你的主函數中,啟動分析器:

if err := profiler.Start(profiler.Config{
   Service:        "indexing-service",
   ServiceVersion: "1.0",
   ProjectID:      "bamboo-project-606", // optional on GCP
}); err != nil {
   log.Fatalf("Cannot start the profiler: %v", err) 
}

當你運行你的程序後,profiler 包將每分鐘報告給分析器 10 秒鐘。

可視化

當分析被報告給後端後,你將在 https://console.cloud.google.com/profiler 上看到火焰圖。你可以按標籤過濾並更改時間範圍,也可以按服務名稱和版本進行細分。數據將會長達 30 天。

你可以選擇其中一個分析,按服務,區域和版本分解。你可以在火焰中移動並通過標籤進行過濾。

閱讀火焰圖

Brendan Gregg 非常全面地解釋了火焰圖可視化。Stackdriver Profiler 增加了一點它自己的特點。

我們將查看一個 CPU 分析,但這也適用於其他分析。

  1. 最上面的 x 軸表示整個程序。火焰上的每個框表示調用路徑上的一幀。框的寬度與執行該函數花費的 CPU 時間成正比。
  2. 框從左到右排序,左邊是花費最多的調用路徑。
  3. 來自同一包的幀具有相同的顏色。這裡所有運行時功能均以綠色表示。
  4. 你可以單擊任何框進一步展開執行樹。

你可以將滑鼠懸停在任何框上查看任何幀的詳細信息。

過濾

你可以顯示、隱藏和高亮符號名稱。如果你特別想了解某個特定調用或包的消耗,這些信息非常有用。

  1. 選擇你的過濾器。你可以組合多個過濾器。在這裡,我們將高亮顯示 runtime.memmove
  2. 火焰將使用過濾器過濾幀並可視化過濾後的框。在這種情況下,它高亮顯示所有 runtime.memmove 框。

via: https://medium.com/google-cloud/continuous-profiling-of-go-programs-96d4416af77b

作者:JBD 譯者:geekpi 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國