DevOps运维技术栈

Linux 系统故障排除最常用的 10 个命令

掌握关键 Linux 命令,快速有效解决问题。

Linux 以其稳健性和可靠性著称,但即使是维护得最好的系统偶尔也会遇到性能和网络问题。掌握关键故障排除命令对于高效诊断和解决问题至关重要。

本指南将介绍 10 个基本 Linux 命令,帮助你识别和解决系统性能、网络连接和进程管理相关的问题。

理解 Linux 故障排除

Linux 故障排除涉及识别、诊断和解决系统问题,通常通过使用命令行工具快速了解系统操作和错误。Linux 提供了监控性能、管理进程、检查连接等的命令,使其成为那些能够有效使用这些工具的人的强大操作系统。

1.top: 监控系统性能

top 命令提供系统资源使用的实时视图,显示活动进程及其 CPU 和内存消耗。

  1. 输入top 并按 Enter。
  2. 查看列以识别高 CPU 或内存消耗的进程。
  3. P 按 CPU 使用率排序,或按M 按内存使用率排序。

2.dmesg: 检查内核消息

dmesg 命令显示来自内核的系统消息,有助于诊断硬件和启动问题。

  1. 输入dmesg 查看所有内核消息,或使用dmesg | tail 查看最新条目。
  2. 使用dmesg | grep [关键词] 过滤消息。

3.ping: 测试网络连接

ping 命令通过发送数据包检查系统是否能到达网络上的另一系统。

  1. 输入ping google.com 检查互联网连接。
  2. 查看响应时间以评估延迟。
  3. 使用Ctrl+C 停止 ping 测试。

4.traceroute: 分析网络路径

traceroute 帮助你追踪数据包到达目标的路径,识别网络瓶颈。

  1. 运行traceroute google.com 查看数据包经过的每个跳点。
  2. 查看输出以查找任何延迟或超时。

5.netstat /ss: 网络统计和连接

这些命令显示活动网络连接和监听端口,有助于解决网络相关问题。

  1. 运行netstat -tulnss -tuln 查看 TCP 和 UDP 连接。
  2. -tuln 选项显示活动网络连接和监听端口。

6.df: 磁盘使用分析

df 命令提供已挂载文件系统的可用磁盘空间概览。

  1. 输入df -h 以人类可读格式显示磁盘使用情况。
  2. 识别接近满容量的文件系统(例如,超过 80% 使用率)。

7.du: 目录使用洞察

使用du 检查特定目录的磁盘使用情况,有助于定位需要清理的大文件或文件夹。

  1. 输入du -sh /path/to/directory 查看该目录的大小。
  2. 在目录中使用du -sh * | sort -h 列出并按大小排序所有文件。

8.ps: 进程状态和管理

ps 命令显示活动进程及其资源消耗,允许你识别和管理进程。

  1. 运行ps aux 列出所有进程,显示用户、CPU 使用率和内存。
  2. 使用ps aux | grep [进程名] 查找特定进程。

9.tail: 日志文件分析

tail 命令显示文件末尾,非常适合监控实时日志条目。

  1. 使用tail -f /var/log/syslog 查看最新系统日志。
  2. Ctrl+C 停止监控。

10.iptables: 防火墙规则检查

iptables 显示或配置防火墙规则,允许你查看哪些规则可能影响网络连接。

  1. 运行sudo iptables -L 列出所有活动防火墙规则。
  2. 查找可能阻止或限制特定端口或 IP 访问的规则。

结论

这些命令各自提供了对 Linux 系统性能和功能不同方面的关键洞察。从使用top 监控进程到使用iptables 检查防火墙规则,掌握这些命令可以显著简化故障排除任务。熟悉这些工具,以更好地控制你的 Linux 环境并高效解决问题。

退出移动版