terça-feira, 30 de outubro de 2012
Problemas de cluster do Windows 2003
Este artigo não é da Microsoft, que é de no-campo-técnicos que trabalham com grupos em situações do mundo real. Na Synergy Phoenix estamos contactado regularmente para ajudar as empresas locais (pequeno e grande) com qualquer agrupamento ajuda eles podem precisar. Nesse caso, a cliente tinha 7 Windows 2003 servidores Dell, cada um com a NIC Broadcom padrão duplo que vem com 1-U servidores estes dias. Como você sabe que essas interfaces de rede pode ser "Teamed" para formar uma única interface. O cliente quer fazer seu ambiente de produção existente como tolerante a falhas possível. Estes sete novos servidores são novos e são configurados em um ambiente de laboratório. Cada executando o Windows 2003 standard.
O que temos de trabalhar com:
Eles têm dois controladores de domínio dedicados para o Active Directory, eles estão executando o DNS para estes para resolução de nomes interno e externo. Seus registros de domínios zona será hospedado aqui, eles vão se tornar ns1 e ns2.
Eles têm dois servidores web, e três servidores COMPLUS. Mais tarde, eles irão implementar os Clusters SQL, mas não vamos entrar nisso aqui.
Até agora é uma configuração para a frente. Eles querem ter parceria do NIC, tendo NIC1 de cada servidor conectado ao switch-1, e NIC2 ligado a chave-2. Permitindo um interruptor ao fracasso. Eles terão um cabo cross-over entre os dois aparelhos que permitam ou NIC falhar. Cada switch vai ser conectado a ela do próprio firewall / roteador, mas o Gateway em cada servidor será definido principalmente para apontar para o FW que o seu switch-1 está conectado, vamos adicionar um IP do Gateway segundo com uma métrica diferente para permitir qualquer falha do firewall primário. Cada Firewall estiver conectado a um ISP diferente e tem um IP externo diferente configurado. Isto permite que ns2 ser um IP em ISP-2, o que permite uma falha total do primeiro ISP. Por ter todos os registros de host em ns2 apontando para IP do ISP segundo permite a falha completa de um segmento inteiro da sua linha.
Esse é o layout. Assim que começar a instalação AD e DNS configurado, nós da equipe e configurar o NIC do. Puxe algumas tomadas para testar a teoria da configuração e estamos confiantes de que tudo está indo bem. Portanto, agora temos de configurar e testar o cluster.
O cluster:
Desde que não temos um balanceador de carga de rede temos de equilibrar a carga entre os servidores web e servidores COMPLUS por meio de Carga da Microsoft de rede de balanceamento. Nós prosseguimos com a interface de gerenciamento NTLB para agrupar os servidores web. Cada um dos dois servidores convergem para o cluster sem problemas. Quando tentamos o mesmo nos servidores COMPLUS não vai tão bem.
O problema:
Nós adicionamos complus1 ao cluster. Acrescenta bem, é claro que sim, é o único membro do cluster. Ele diz que "convergindo" para um momento e depois vai verde. Nós tentar adicionar complus2 ao cluster e ele diz que "convergindo" para sempre, nunca converge. Ele permanece no estado de "convergência" por mais de 30 minutos, de atualização após a atualização, parar e iniciar, pausar, tentar qualquer coisa. Não podemos começar o segundo nó a convergir. Tentamos complus3 adição e obter o mesmo resultado. Nós refazer nossos passos, verificando DNS para a resolução interna de ambos os próprios servidores eo cluster IP, tudo parece bom. Tentamos ping todos nós, toda a gente parece ping cada finas. IPConfig mostra o IP de cluster em cada um dos servidores COMPLUS. NTLB é obrigado em cada "Team" interface. Buscando o apoio da Microsoft insistem que há um problema com a placa de rede. Então passamos a unteam e tentar cada NIC individualmente. À medida que refazer nossos passos, encontramos o mesmo problema, independentemente de como é que NIC usamos em qualquer sistema. Por um capricho que uncluster cada, reinicie, e adicionar complus2 primeiro. Então nós adicionamos complus3 ao cluster. E eles "convergir" em segundos. Tentando adicionar complus1 falha. Então, nós isolamos o problema a apenas um servidor.
A solução:
Acontece que NTLB foi ligado na complus1, foi obrigado a cada NIC (ambos membros da "equipe"). Uma vez que re-equipe do NIC do e remover NTLB de NIC1 e NIC2, o servidor converge para o cluster sem nenhum problema.
Resumo:
Quando agrupamento certifique-se de selecionar apenas o serviço NTLB em uma das NIC do que está sendo usado como o cluster. Outra placa de rede deve ter NTLB ligado a ele. À medida que continuamos com a nossa configuração proposta, tudo funciona bem. Todos os testes forem bem sucedidos e parece que eles vão ter uma grande falha ambiente de produção tolerante. Em seguida é a Clusters SQL, a implementação de dois clusters SQL em uma SAN EMC ao vivo, sem tolerância de tempo de inatividade, este deve ser divertido. Até então ......
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário