jeffersonmicroni
(usa openSUSE)
Enviado em 01/10/2024 - 16:29h
Boa tarde a todos,
Este é meu primeiro post no VOL, e venho pedir auxílio para um problema com meu servidor de firewal que não consigo resolver. Tenho um bom conhecimento de linux, não tão aprofundado.
É um servidor openSUSE versão 11.3 de 12 anos de idade, nunca foi atualizado. Rodava bem, ate recentemente começar a apresentar lentidão, processos travando (rodando indefinidamente consumindo 100% de CPU), e essa bendita intermitencia na conexão com a internet.
Minha topologia é o FW recebe internet da VIVO e faz o mascaramento para minha rede interna, sendo ele DNS para internet e DHCP para a rede interna. Possuo também um AD WS2022 como fileserver, print server, e DNS interno, e tmb um WS2022 como WSUS.
O problema ocorre da seguinte forma: de tempos em tempo (em momentos aleatórios) várias vezes ao dia, 4, 5, 6 vezes, a conexão a internet nos computadosres clientes na minha rede fica indisponível e alguns minutos depois (2 a 4 min) retorna. No FW também fica indisponível.
Já fiz o monitoramento para verificar se algum serviço esta reiniciando, mas a principio não identifiquei. Verifiquei arquivos de configuração, cron, reiniciai processos, servidor completo, e permanece o problema. Fiz monitoramento de processos e e verifiquei que constantemente este comando do named é executado:
/usr/sbin/named -t /var/lib/named -u named
foi a única coisa suspeita.
Ele possui nagios instalado, que a muito tempo não é usado pois a empresa deixou de fazer monitoramento. Mas está ativo, ai um dia desses tinha um processo dele usando 100% de cpu travando o servidor, matei o processo e tentei para o serviço, ai a internet parou de vez. Reiniciei o nagios e a internet voltou. Realmente não entendo muito a relação das coisas. Não sei interpretar logs para tentar ter uma melhor visão da coisas.
Quem puder dar uma ajuda ficarei muito grato. Disponibilizo qualquer informação adicional necessária.
Desde já muito obrigado.
Jefferson.