Linux中國

好奇心幫我解決了一個硬體問題

我通常在家架設運行一個由一打計算機組成的家庭網路 —— 沒錯,正好 12 台計算機。同時我還負責其它地方的一些計算機維護工作。由於計算機很多,總會出現各種各樣的故障,其中有很多最終確診為硬體問題。但是要判定出是哪個硬體設備引發的故障卻是一件難事。

就在這周,我的主工作站上出現了一個棘手的問題,導致我兩次誤判了問題的原因。本文將帶你跟隨我排查問題的過程。我將告訴你我在哪一步做了錯誤的判斷以及為什麼,還有誤判是多麼容易發生。

最初的癥狀

我手上一直有好幾個項目。最近,我在幾台台式機上打開了很多應用程序,我剛開始工作,突然就黑屏了。主工作站的大多數(不是全部)風扇都停了,這讓我倒吸一口涼氣。我從來沒有遇到過這種情況,但顯然我的系統出問題了。

我有兩條主要線索可以跟進:一是顯示黑屏,二是有些風扇不轉了。但是前面板上的電源和磁碟活動指示燈還是亮的,只是比平常要暗一點。大多數安裝在主板、內存條和風扇上的 RGB 裝飾燈也都滅了。

我試過按電源鍵和重啟鍵,都沒有反應。我直接按供電單元的船型開關關閉了電源。重新供電後還是出現了剛才的癥狀。

最初的猜想

問題的現象和我數十年處理各類故障的經驗將原因指向了供電問題。

我將供電單元拆了下來並用電源測試儀對它進行了檢查。結果是供電單元沒有任何問題,各項電壓都符合規範。當然測試儀的結果也可能是錯誤的。測試儀並沒有在滿負荷狀態下進行測試,比如計算機運行中耗電幾百瓦的情況。我憑直覺更換了一個一千瓦的備用電源。

由於我的家庭網路中有 12 台計算機,我已經習慣準備了一些備用配件在身邊。這樣當有配件損壞時,我就不必非得跑一趟附近的電腦城或者網購後等快遞了。由於計算機這麼多,配件損壞是經常的事。

雖然電源測試儀告訴我電源沒有問題,但更換電源後問題確實消失了。即便檢測儀在過去都是正確的,我的經驗、知識和直覺告訴我就是電源問題。

不幸的是,我的直覺錯了。

第二個猜想

沒過多久我的工作站再次又了相同的問題。但兩個不同的供電單元有相同問題的可能性太低了。

我馬上想到那一定是主板出問題了。我沒有備用的主板,所以網購了一塊新主板。我想到其實可以用上手上多餘的內存條,然後把 CPU 連同一體水冷單元一起裝到新主板上。

專業的故障排查

新主板需要幾天天才能送到,所以我決定先將工作站上的舊主板拆下來。就在拔掉主板供電之前,我的好奇心顯現,並驅使我給只剩主板、CPU 和內存的系統開機。我已經把其它的部分都拆掉了。

好的故障排除過程需要分離所有潛在變數,目前我只是對供電單元進行了測試。我需要對每個組件都進行測試。

這需要我先拔掉前面板上的揚聲器和多功能面板連接線。多功能面板上集成了各種 USB、SATA 和內存卡插槽。

令人驚訝的是,當只有主板通電時竟然一切正常。

計算機本身無法開機,因為根本沒有連接存儲器。也不會有顯示輸出,因為我已經把顯卡拆掉了。但是沒有電源或主板故障的跡象。這進一步激發了我的好奇心。如果主板真的有問題的話,故障現象應該仍然存在才對。

所以我開始一系列的重複試驗:斷電,安裝一個已經拆掉的配件,重新上電。

最終發現問題上由前置多功能面板引發的。

我拆除了多功能面板並將其它零件全部裝了回去。工作站開機正常,運行良好。終於讓我逮到罪魁禍首了。

起因

弄清真正的問題之後,我立刻就明白了問題的根本原因。這還要從幾天前說起。那時我正在測試一些外接 USB 設備,包括幾種攝像頭、幾個用於備份的存儲設備和一個外接 USB 集線器。

我把一根 USB 連接線插到了多功能面板上的一個 USB 2.0 插口中。所有東西都停擺了,大部分燈熄滅了,風扇也不轉了。USB 連接線發熱很嚴重,我拔掉它時還把手指燙傷了。原來我不小心將連接線的 C 型插頭插到了一個 USB 3.0 A 型插口裡,導致了供電短路。

拔掉 USB 連接線之後,一切都恢復了「正常」 —— 但事實並非如此。我粗心的錯誤對多功能面板造成了損傷,它在堅持了幾天之後徹底短路了。

妄下結論

知識和經驗有時候比電源測試儀之類的工具更重要。當然知識跟經驗有時候也不管用。我最終找到了問題的真正原因,但其實我本該早就發現的。

儘管我在問題跟供電有關這一點上是對的,但還是誤入歧途了。原因是我沒能正確解讀問題現象並根據線索調查得出邏輯結論導致的。我本可以更早找出問題的根本原因的,這樣就不至於在修好主工作站之前浪費那麼多時間在將我的筆記本變成臨時主要設備上了。

系統管理員總與複雜的設備打交道,過早下結論在所難免。我有超過 50 年的從業經驗,還是犯了這樣的錯誤。我只需記住做幾個 深呼吸,然後刨根問底直到找到問題的根本原因。

好奇心

至少在等待新主板到貨期間,我遵循了自己的好奇心。這讓我比等新主板到貨要早得多將事情恢復正常。同時也避免了我在沒有充分測試的情況下把一塊完好的主板丟掉。

諺語說好奇心害死貓。我討厭這個諺語,因為它被家長、學校、見識短淺的老闆、老師和那些不想被我們這種好奇寶寶干擾的人用得太多了。事實上,好奇心激發了對於人們對於知識和真理的渴求。這可能是關於硬體、開源軟體、編程、組裝個人電腦、優化系統設置或者學習使用新軟體。滿足你的好奇心吧!

via: https://opensource.com/article/22/1/troubleshoot-hardware-sysadmin

作者:David Both 選題:lujun9972 譯者:toknow-gh 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國