找回密码
 register

QQ登录

只需一步,快速开始

查看: 101|回复: 0

[*网络运维*] 远程SSH服务登录特别慢解决方法 内网IP访问速度没问题

[复制链接]

[*网络运维*] 远程SSH服务登录特别慢解决方法 内网IP访问速度没问题

[复制链接]
  • 打卡等级:热心大叔
  • 打卡总天数:94
  • 打卡月天数:17
  • 打卡总奖励:94
  • 最近打卡:2025-01-18 01:28:20
Waylee

主题

0

回帖

1万

积分

仙帝

积分
11929
Waylee 2024-10-25 12:17 | 显示全部楼层 |阅读模式

马上注册,查看网站隐藏内容!!

您需要 登录 才可以下载或查看,没有账号?register

×
背景
大家工作时,少不了ssh登录各个服务器,我这边手里也有很多服务器,有一些登录很快就进去了,有些要卡半天才能进去。之前以为是公司网络问题,每次也就忍了,这次突然不想忍了,决定定位一下。
我这边的服务器是10.80.121.46。因为这个问题是可复现的,算是个好问题,于是在本地开了wireshark,ssh登录,看看能不能看出端倪。
  1. host 10.80.121.46 and tcp port  22
复制代码

001.png
可以看到,服务端在00:13,发了第一个消息过来;过了20s,发了第二个消息过来。
总的来说,应该是服务端问题。
定位过程
看日志
由于是ssh这种加密了的协议,抓包也看不出个啥。所以我首先的思路是看看sshd这个服务端进程的日志。sshd是systemd管理的,所以看看状态先。
002.png
这种的话,一般也能看到最新的日志,如果要看完整的日志,可以用如下命令:
  1. journalctl -u sshd
  2. ps: journalctl -u sshd -f  可以像tailf那样持续跟踪日志
复制代码

但是,发现只有info级别的日志,也看不出什么特别:
  1. Apr 03 15:27:30 nginx2 sshd[87616]: Accepted password for root from 10.0.235.72 port 11481 ssh2
复制代码

接下来,又看了下其他日志:
/var/log/messages:
  1. Apr  3 15:27:30 year-account-nginx2 systemd-logind: New session 13336 of user root.
  2. Apr  3 15:27:30 year-account-nginx2 systemd: Started Session 13336 of user root.
复制代码

/var/log/secure:
  1. Apr  3 15:27:30 year-account-nginx2 sshd[87616]: Accepted password for root from 10.0.235.72 port 11481 ssh2
  2. Apr  3 15:27:30 year-account-nginx2 sshd[87616]: pam_unix(sshd:session): session opened for user root by (uid=0)
复制代码

反正看了好些日志,没啥用,这边上个链接,讲linux下的各种日志。
https://www.plesk.com/blog/featured/linux-logs-explained/
https://www.eurovps.com/blog/imp ... must-be-monitoring/
开启debug日志
上网查了下,怎么开启sshd的debug级别日志,结论如下:
  1. vim /etc/ssh/sshd_config 加一行:
  2. LogLevel DEBUG
复制代码

这个LogLevel的取值有哪些呢,具体可以在机器上执行:
  1. man sshd_config
复制代码

没想到取值还有更逆天的:
003.png
我之前就是在debug级别下测试的,然后看日志:
  1. journalctl -u sshd -f
复制代码

004.png
看到出现了20s的间隔,但是,还是没有什么错误或者警告。当时,我就开始上网查了,但是这次,咱们要不试试把日志级别弄成DEBUG3:
005.png
这里日志细了一些,但还是看不太出来啥问题。这个10.0.235.72,是我本机windows的ip。
服务端dns抓包
经过上网冲浪,发现很多文章提到了一点,就是sshd会拿着我们客户端的ip,去dns 服务器查询ip对应的主机名(域名)。很明显,我这个ip,肯定是没什么域名的。大概率是这个原因,但是基于严谨的角度考虑,我还是先找找证据。
dns服务器对外的端口是53,所以我抓的就是这个端口的网络包:
006.png
可以发现,本机是给两个dns服务器发请求的,分别是8.8.8.8 8.8.4.4
看下机器的dns服务器配置:
  1. vim /etc/resolv.conf
  2. nameserver 8.8.8.8
  3. nameserver 8.8.4.4
复制代码

不知道为啥是这个地址。
测试了端口通不通,发现tcp不通,udp不知道咋测(试了下netcat、nmap,没太弄懂)
ping也不通,不知道是真不通,还是对端禁ping了。
这些都不重要,重要的是,这个报文也不知道是啥意思,看起来和我的问题没什么关系。
trace排查
暂时放下dns这块,准备strace试试,反正,死马当活马医。
strace这个一般用得少,选项记不住,一开始就这么试试:
  1. netstat -nltp|grep 22
  2. tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      93585/sshd         
  3. tcp        0      0 0.0.0.0:4822            0.0.0.0:*               LISTEN      31633/nginx: master
  4. tcp6       0      0 :::22                   :::*                    LISTEN      93585/sshd   
复制代码

拿到sshd pid为93585,开启strace:
007.png
但是啥也没看出来。
找了下以前笔记,加了几个选项:
  1. strace -p 121920 -s 1000  -t -e trace=network,file,desc,process
  2. -s: 字符串显示1000个字符串,不截断(默认是32,会看不全)
  3. -t:显示时间
  4. -e trace=network,file,desc,process,监控网络、文件、文件描述符、进程相关的系统调用
复制代码

008.png
这次信息多一点,还是啥都看不出来。
上网查
没法了,把之前dns抓的包拿下来用wireshark分析分析。
009.png
010.png
这个dns查询,有点看不懂,直接拿关键字搜了下,大家看如下链接吧:
https://www.cloudflare.com/zh-cn ... rds/dns-ptr-record/
011.png
难怪,dns进行反向查找时,客户端ip是反的,我的实际ip是:10.0.235.72
到了上图,就变成了:
012.png
也难怪我没看出来,这个基本算是一个强力证据了,大概率是dns解析的问题,毕竟用了我的ip。
修改sshd配置
那就禁用这个机制吧,方式如下:
  1. vim /etc/ssh/sshd_config
  2. UseDNS no
复制代码

然后重启sshd
  1. systemctl restart sshd
复制代码

这样基本就ok了。重新试了下,再没有卡20s了,秒登录。
继续探索strace
找到问题原因后,strace我又继续研究了下。原来是少了个选项,-f:
  1.        -f
  2.        --follow-forks
  3.                    Trace  child  processes  as  they  are  created  by  currently traced processes as a result of the fork(2), vfork(2) and
  4.                    clone(2) system calls.  Note that -p PID -f will attach all threads of process PID if it  is  multi-threaded,  not  only
  5.                    thread with thread_id = PID.
复制代码

这个选项是跟踪子进程的系统调用,因为,sshd收到一个客户端连接时,会fork一个新进程出来。前面都忘了加-f,所以导致没跟踪到。
换下命令:
  1. strace -p 93585 -s 1000  -t -e trace=network,file,desc,process -f
复制代码

013.png
这次可以跟踪了。
补充
在写这篇文章的时候,对一个地方产生了疑问。一般看日志的时候,对于systemd管理的service,我会看journalctl,也会看/var/log/messages,经常的情况是,在journalctl中的日志,在/var/log/messages中也能看到。
查了下两者的机制,参考:
https://serverfault.com/question ... er-than-var-log-mes
systemd会写日志到一些文件(journalctl就会读这些文件),然后,另一个后台进程rsyslogd,也会读这些日志,然后写到/var/log/messages这些文件中。
  1. [root@year-account-nginx2 log]# ps -ef|grep rsys
  2. root       1614      1  0  2022 ?        00:46:28 /usr/sbin/rsyslogd -n
复制代码

014.png
您需要登录后才可以回帖 登录 | register

本版积分规则

雪舞知识库 | 浙ICP备15015590号-1 | 萌ICP备20232229号|浙公网安备33048102000118号 |天天打卡

GMT+8, 2025-1-18 16:03 , Processed in 0.114899 second(s), 9 queries , Redis On.

Powered by XueWu Licensed

Copyright © Tencent Cloud.

快速回复 返回顶部 返回列表