Linux的300+个真实运维场景之09 启动过程和内核参数

场景 104:引导程序配置问题

场景:系统无法启动,出现与 GRUB 引导程序相关的错误。

故障排除步骤:

从 Live CD/USB 或救援模式启动:

使用可引导的 Live CD/USB 或救援模式访问系统。

编辑 GRUB 配置文件:

nano /etc/default/grub

查看并修改 GRUB_CMDLINE_LINUX

验证 GRUB_CMDLINE_LINUX参数的正确性:

确保内核参数设置正确。

重新生成 GRUB 配置:

grub2-mkconfig -o /boot/grub2/grub.cfg

重启系统:

reboot

场景 105:启动时内核崩溃

场景:系统在引导程序之后立即遇到内核崩溃。

故障排除步骤:

使用救援模式或 Live CD/USB 启动。

检查内核崩溃消息以获取线索:

查看屏幕上显示的内核崩溃消息。

查看内核日志(dmesg、/var/log/messages):

dmesg
cat /var/log/messages

调查硬件相关问题(如 RAM、磁盘故障):

检查硬件组件是否有问题。

如果需要,重新安装或更新内核:

使用包管理器命令(如 yumdnf)重新安装或更新内核。

场景 106:内核参数设置错误

场景:由于内核参数设置错误,系统出现意外行为。

故障排除步骤:

  1. 编辑 GRUB 配置文件:
  2. nano /etc/default/grub
  3. 修改 GRUB_CMDLINE_LINUX
  4. 检查并修改内核参数:
  5. 确保设置正确的参数。
  6. 重新生成 GRUB 配置:
  7. grub2-mkconfig -o /boot/grub2/grub.cfg
  8. 重启并验证问题是否仍然存在:
  9. reboot
  10. 查看内核日志以查找与参数相关的错误:
  11. journalctl -k

场景 107:启动在特定阶段挂起

场景:启动过程在某个特定点停止,没有进展。

故障排除步骤:

在启动时访问 GRUB 菜单,并在内核命令行中添加 single

  • 编辑 GRUB 条目并追加 single

以单用户模式启动并调查问题:

  • 使用 init 1single 以单用户模式启动。

查看日志(/var/log/boot.log/var/log/messages)以查找错误:

cat /var/log/boot.log
cat /var/log/messages

查找挂起阶段的错误或警告。

识别并解决与挂起阶段相关的问题。

从 GRUB 命令行中移除 single 以正常启动:

  • 编辑 GRUB 配置,移除 single,然后重新生成配置。

场景 108:启动过程冻结或缓慢

场景:系统在启动时冻结,或启动时间异常长。

故障排除步骤:

访问 GRUB 菜单,并在内核命令行中添加 nomodeset

  • 编辑 GRUB 条目并追加 nomodeset

以单用户模式启动并识别资源密集型进程:

  • 使用 tophtop 检查 CPU 和内存使用情况。

检查磁盘空间、磁盘健康和 RAID 配置:

df -h
smartctl -a /dev/sda
mdadm --detail /dev/md0

调查磁盘相关问题。

优化系统启动服务:

  • 使用 systemctl 禁用不必要的服务。

查看日志以查找导致延迟的错误:

journalctl -b

场景 109:缺少或损坏的内核

场景:启动时系统报告缺少或损坏的内核映像。

故障排除步骤:

从 Live CD/USB 或救援模式启动。

挂载根文件系统并导航到 /boot

mount /dev/sdXn /mnt   # 将 sdXn 替换为根分区
cd /mnt/boot

验证内核映像的存在和完整性:

ls -l vmlinuz*
md5sum vmlinuz*

如果缺少或损坏,重新安装内核包:

yum reinstall kernel

重新生成 GRUB 配置:

grub2-mkconfig -o /boot/grub2/grub.cfg

重启系统:

reboot

场景 110:initramfs 问题

场景:启动时系统报告 initramfs 映像问题。

故障排除步骤:

从 Live CD/USB 或救援模式启动。

访问 GRUB 菜单,并在内核命令行中添加 rd.break

  • 编辑 GRUB 条目并追加 rd.break

以只读模式挂载根文件系统:

mount -o remount,ro /sysroot

检查并修复 initramfs 映像:

chroot /sysroot
dracut -f /boot/initramfs-<kernel-version>.img

重启系统:

reboot

场景 111:错误的根文件系统挂载

场景:启动时系统无法挂载根文件系统。

故障排除步骤:

访问 GRUB 菜单,并在内核命令行中添加 rd.break

以写入权限重新挂载根文件系统:

mount -o remount,rw /sysroot

检查 /etc/fstab 中根设备的正确性:

cat /etc/fstab

确保指定正确的根文件系统 UUID 或设备:

  • 如果需要,更新 /etc/fstab

退出紧急 shell 并继续启动过程:

exit

场景 112:内核模块加载问题

场景:启动完成后,某些内核模块无法加载。

故障排除步骤:

查看日志(dmesg/var/log/messages)以查找模块加载错误:

dmesg | grep <module-name>
cat /var/log/messages | grep <module-name>

使用 lsmod 验证内核模块:

lsmod | grep <module-name>

使用 modprobermmod 手动加载或卸载有问题的模块:

modprobe <module-name>
rmmod <module-name>

更新或重新安装内核模块包:

yum reinstall <module-package>

确保模块的依赖项已满足:

  • 解决任何缺失的依赖项。

场景 113:UEFI 启动问题

场景:系统在 UEFI 模式下启动时出现问题。

故障排除步骤:

访问 UEFI/BIOS 设置并检查启动顺序:

  • 验证正确的启动顺序设置。

验证 UEFI 相关设置的正确性:

  • 检查 UEFI 设置的准确性。

确保系统以 UEFI 模式启动:

  • 在系统设置中确认 UEFI 启动模式。

检查 EFI 系统分区(ESP)中的正确文件:

  • 确保存在如 BOOTX64.EFI 等所需文件。

在 UEFI 模式下重新安装引导程序:

grub2-install --target=x86_64-efi --efi-directory=/boot/efi --bootloader-id=GRUB

注意事项

  • 记录故障排除过程中所做的任何更改,并谨慎修改关键系统配置。
  • 如有不确定之处,请查阅相关文档或寻求支持渠道的帮助。
原文链接:,转发请注明来源!