在 Linux 中使用日誌來排錯

登錄失敗原因

如果你想檢查你的系統是否安全，你可以在驗證日誌中檢查登錄失敗的和登錄成功但可疑的用戶。當有人通過不正當或無效的憑據來登錄時會出現認證失敗，這通常發生在使用 SSH 進行遠程登錄或 su 到本地其他用戶來進行訪問權時。這些是由插入式驗證模塊（PAM）來記錄的。在你的日誌中會看到像 Failed password 和 user unknown 這樣的字元串。而成功認證記錄則會包括像 Accepted password 和 session opened 這樣的字元串。

失敗的例子:

pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=10.0.2.2
Failed password for invalid user hoover from 10.0.2.2 port 4791 ssh2
pam_unix(sshd:auth): check pass; user unknown
PAM service(sshd) ignoring max retries; 6 > 3

成功的例子：

Accepted password for hoover from 10.0.2.2 port 4792 ssh2
pam_unix(sshd:session): session opened for user hoover by (uid=0)
pam_unix(sshd:session): session closed for user hoover

你可以使用 grep 來查找哪些用戶失敗登錄的次數最多。這些都是潛在的攻擊者正在嘗試和訪問失敗的賬戶。這是一個在 ubuntu 系統上的例子。

$ grep "invalid user" /var/log/auth.log | cut -d &apos; &apos; -f 10 | sort | uniq -c | sort -nr
23 oracle
18 postgres
17 nagios
10 zabbix
6 test

由於沒有標準格式，所以你需要為每個應用程序的日誌使用不同的命令。日誌管理系統，可以自動分析日誌，將它們有效的歸類，幫助你提取關鍵字，如用戶名。

日誌管理系統可以使用自動解析功能從 Linux 日誌中提取用戶名。這使你可以看到用戶的信息，並能通過點擊過濾。在下面這個例子中，我們可以看到，root 用戶登錄了 2700 次之多，因為我們篩選的日誌僅顯示 root 用戶的嘗試登錄記錄。

日誌管理系統也可以讓你以時間為做坐標軸的圖表來查看，使你更容易發現異常。如果有人在幾分鐘內登錄失敗一次或兩次，它可能是一個真正的用戶而忘記了密碼。但是，如果有幾百個失敗的登錄並且使用的都是不同的用戶名，它更可能是在試圖攻擊系統。在這裡，你可以看到在3月12日，有人試圖登錄 Nagios 幾百次。這顯然不是一個合法的系統用戶。

重啟的原因

有時候，一台伺服器由於系統崩潰或重啟而宕機。你怎麼知道它何時發生，是誰做的？

關機命令

如果有人手動運行 shutdown 命令，你可以在驗證日誌文件中看到它。在這裡，你可以看到，有人從 IP 50.0.134.125 上作為 ubuntu 的用戶遠程登錄了，然後關閉了系統。

Mar 19 18:36:41 ip-172-31-11-231 sshd[23437]: Accepted publickey for ubuntu from 50.0.134.125 port 52538 ssh
Mar 19 18:36:41 ip-172-31-11-231 23437]:sshd[ pam_unix(sshd:session): session opened for user ubuntu by (uid=0)
Mar 19 18:37:09 ip-172-31-11-231 sudo:   ubuntu : TTY=pts/1 ; PWD=/home/ubuntu ; USER=root ; COMMAND=/sbin/shutdown -r now

內核初始化

如果你想看看伺服器重新啟動的所有原因（包括崩潰），你可以從內核初始化日誌中尋找。你需要搜索內核類（kernel）和 cpu 初始化（Initializing）的信息。

Mar 19 18:39:30 ip-172-31-11-231 kernel: [    0.000000] Initializing cgroup subsys cpuset
Mar 19 18:39:30 ip-172-31-11-231 kernel: [    0.000000] Initializing cgroup subsys cpu
Mar 19 18:39:30 ip-172-31-11-231 kernel: [    0.000000] Linux version 3.8.0-44-generic (buildd@tipua) (gcc version 4.6.3 (Ubuntu/Linaro 4.6.3-1ubuntu5) ) #66~precise1-Ubuntu SMP Tue Jul 15 04:01:04 UTC 2014 (Ubuntu 3.8.0-44.66~precise1-generic 3.8.13.25)

檢測內存問題

有很多原因可能導致伺服器崩潰，但一個常見的原因是內存用盡。

當你系統的內存不足時，進程會被殺死，通常會殺死使用最多資源的進程。當系統使用了所有內存，而新的或現有的進程試圖使用更多的內存時就會出現錯誤。在你的日誌文件查找像 Out of Memory 這樣的字元串或類似 kill 這樣的內核警告信息。這些信息表明系統故意殺死進程或應用程序，而不是允許進程崩潰。

例如:

[33238.178288] Out of memory: Kill process 6230 (firefox) score 53 or sacrifice child
[29923450.995084] select 5230 (docker), adj 0, size 708, to kill

你可以使用像 grep 這樣的工具找到這些日誌。這個例子是在 ubuntu 中:

$ grep 「Out of memory」 /var/log/syslog
 [33238.178288] Out of memory: Kill process 6230 (firefox) score 53 or sacrifice child

請記住，grep 也要使用內存，所以只是運行 grep 也可能導致內存不足的錯誤。這是另一個你應該中央化存儲日誌的原因！

定時任務錯誤日誌

cron 守護程序是一個調度器，可以在指定的日期和時間運行進程。如果進程運行失敗或無法完成，那麼 cron 的錯誤出現在你的日誌文件中。具體取決於你的發行版，你可以在 /var/log/cron，/var/log/messages，和 /var/log/syslog 幾個位置找到這個日誌。cron 任務失敗原因有很多。通常情況下，問題出在進程中而不是 cron 守護進程本身。

默認情況下，cron 任務的輸出會通過 postfix 發送電子郵件。這是一個顯示了該郵件已經發送的日誌。不幸的是，你不能在這裡看到郵件的內容。

Mar 13 16:35:01 PSQ110 postfix/pickup[15158]: C3EDC5800B4: uid=1001 from=<hoover>
Mar 13 16:35:01 PSQ110 postfix/cleanup[15727]: C3EDC5800B4: message-id=<20150310110501.C3EDC5800B4@PSQ110>
Mar 13 16:35:01 PSQ110 postfix/qmgr[15159]: C3EDC5800B4: from=<hoover@loggly.com>, size=607, nrcpt=1 (queue active)
Mar 13 16:35:05 PSQ110 postfix/smtp[15729]: C3EDC5800B4: to=<hoover@loggly.com>, relay=gmail-smtp-in.l.google.com[74.125.130.26]:25, delay=4.1, delays=0.26/0/2.2/1.7, dsn=2.0.0, status=sent (250 2.0.0 OK 1425985505 f16si501651pdj.5 - gsmtp)

你可以考慮將 cron 的標準輸出記錄到日誌中，以幫助你定位問題。這是一個你怎樣使用 logger 命令重定向 cron 標準輸出到 syslog的例子。用你的腳本來代替 echo 命令，helloCron 可以設置為任何你想要的應用程序的名字。

*/5 * * * * echo 『Hello World』 2>&1 | /usr/bin/logger -t helloCron

它創建的日誌條目：

Apr 28 22:20:01 ip-172-31-11-231 CRON[15296]: (ubuntu) CMD (echo &apos;Hello World!&apos; 2>&1 | /usr/bin/logger -t helloCron)
Apr 28 22:20:01 ip-172-31-11-231 helloCron: Hello World!

每個 cron 任務將根據任務的具體類型以及如何輸出數據來記錄不同的日誌。

希望在日誌中有問題根源的線索，也可以根據需要添加額外的日誌記錄。

via: http://www.loggly.com/ultimate-guide/logging/troubleshooting-with-linux-logs/

作者：Jason Skowronski 作者：Amy Echeverri 作者：Sadequl Hussain 譯者：strugglingyouth 校對：wxy

本文由 LCTT 原創翻譯，Linux中國榮譽推出

本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何？

太棒了

不錯

愛死了

不太好

感覺很糟

Rain

雨落清風。心向陽

在 Linux 中使用日誌來排錯

登錄失敗原因

重啟的原因

關機命令

內核初始化

檢測內存問題

定時任務錯誤日誌

對這篇文章感覺如何？

在 VirtualBox 中使用 Docker Machine 管理主機

如何在 Ubuntu 15.04 系統中安裝 Logwatch

Leave a reply 取消回復

More in:Linux中國

如何通過 VLC 使用字幕

Unix 桌面：在 Linux 問世之前

Valve 對於 Ubuntu 的 Snap 版本的 Steam 並不滿意：原因何在

Wine 9.0 發布，實驗性地加入了 Wayland 驅動

中文操作系統論壇

關注 LinuxStory

開源學村

編程類開放書籍薈萃

如何殺死 Linux 中的殭屍進程

2022年，從學習Rust開始

5本學習 TeX 的最佳免費書籍

Makefile 簡介

使用 Linux 命令行解決Wordle 問題

Linux 內核補丁提交初體驗

Linux 的前世今生 – 1

特別關注

NetBSD 10.0 正式發布

「Linux 中國」開源社區，停止運營

把各種舊電腦和舊電子設備變成遊戲終端：Lakka 5.0 正式發布

NetBSD 10.0 正式發布

「Linux 中國」開源社區，停止運營

把各種舊電腦和舊電子設備變成遊戲終端：Lakka 5.0 正式發布

NetBSD 10.0 正式發布

LinuxStory

加入 LinuxStory 交流群組

投票調查

最熱標籤

登錄失敗原因

重啟的原因

關機命令

內核初始化

檢測內存問題

定時任務錯誤日誌

分享

對這篇文章感覺如何？

You may also like

Leave a reply 取消回復

More in:Linux中國

中文操作系統論壇

關注 LinuxStory

開源學村

特別關注

最新文章

最熱標籤