Instalando e configurando um sistema RAID 1 no Debian Lenny

Recentemente houve a necessidade de montar em meu setor de trabalho um sistema com redundância contra falhas. Pesquisando sobre o assunto, resolvemos que a alternativa para solucionar nosso problema poderia ser um RAID 1. Depois de feito, testado e documentado, resolvi compartilhar com a comunidade a minha experiência

[ Hits: 135.047 ]

Por: hermes nunes pereira junior em 24/09/2010


Configurando o novo Grub



O menu.lst foi (re)criado em /boot/grub, mas ele ainda está sem indicar que o sistema é um RAID, o parâmetro root ainda está apontando para o sda1, lugar onde originalmente está o /boot.

É necessário alterar este parâmetro para que se um dos HDs falhar, na hora do próximo boot ele assuma que o outro HD é o principal.

Para editar:

# vim /boot/grub/menu.lst

Na linha:

kernel          /boot/vmlinuz-2.6.26-2-686 root=/dev/sda1 ro quiet

Troque para:

kernel          /boot/vmlinuz-2.6.26-2-686 root=/dev/md0 ro

Obs.: A versão do kernel poderá ser diferente na versão do Linux instalado.

O /dev/md0 é a primeira posição do array criado pelo mdadm, usando o /dev/sda1 e /dev/sdb1.

Depois destas configurações, o sistema está pronto para suportar uma eventual falha de um dos HDs.

Verificando e testando o sistema na ocorrência de falhas

O sistema está atualizado e funcionando, mas precisamos fazer uma simulação real de um HD queimado. Podemos retirar um dos HDs e reiniciar o sistema ou usar o mdadm para simular o erro.

Utilizando o mdadm:

# mdadm --manage --set-fault /dev/md1 /dev/sdb5

Este comando fará com que o segundo disco (/dev/sdb5), primeira partição, que está no array md0 pare de funcionar.

Os parâmetros:
  • --manage - chama o módulo de gerência
  • /dev/md0 - primeiro dispositivo RAID
  • /dev/sdb5 - partição lógica no segundo HD

Este comando "danificou" o array /dev/md1. Para verificar o erro digite:

# mdadm --detail /dev/md1

No final da listagem aparecerá:

NumberMajorMinorRaidDeviceState
0850Active sync /dev/sda5
1001Removed
2821-Fault spare /dev/sdb5


O sistema está com um "crash". Segundo o comando, o /dev/sdb5 foi removido do RAID.

O /proc/mdstat dará a mesma informação:

md1: active raid1 sdb5[2] (F) sdb5[0]

O (F) é a indicação de fault.

Corrigindo o problema

Vimos que o /dev/md1 /dev/sdb5 está danificado. Poderia ser um erro por causa de um erro físico no HD, ou mesmo um HD queimado.

Se for um HD com problemas físicos, a primeira coisa a ser feita é colocar outro HD no lugar.

Depois é necessário remover do RAID as partições que estão no array para depois adicioná-las novamente.

Para remover:

# mdadm /dev/md1 -r /dev/sdb5

Supondo que o HD pifou de vez e tenha que colocar outro, a melhor alternativa é colocar um HD igual ao primeiro, mas não é a única chance do RAID funcionar, o fundamental é que as partições tenham o mesmo tamanho.

Para colocar o novo HD fazendo o RAID, basta seguir os passos a partir do item COPIANDO A TABELA DE PARTICIONAMENTO e seguir até o final.

Considerações finais

Esta solução é uma boa alternativa para dar uma segurança ao sistema em caso de falhas. Mas é bom lembrar que o RAID não é backup. Um backup sempre é importante, mesmo em sistemas RAID.

Página anterior    

Páginas do artigo
   1. Introdução
   2. Tipos de RAID
   3. Montando o sistema RAID
   4. Copiando a tabela de particionamento
   5. Criando o primeiro dispositivo md0
   6. Criando o sistema de arquivos das partições RAID
   7. Criando o sistema de arquivos das partições RAID - cont
   8. Adicionando o primeiro HD ao RAID 1
   9. Configurando o novo Grub
Outros artigos deste autor

O fantástico mundo dos instrumentos MIDI (parte 1)

Instalando o CMS XOOPS

Usando o Linux como um studio de gravação (parte 1)

Uma breve introdução ao Audacity

Criando um mirror do Conectiva para uma rede interna

Leitura recomendada

Configuração Linux (Debian) com mínimo de recursos e interface gráfica super leve

Nagios - Instalação e configuração

Configurando um servidor de FTP no OpenBSD

Instalando o driver da NVidia no Fedora Core 2 sem compilar o kernel

VPN Site-to-Site Openswan x ASA (Cisco)

  
Comentários
[1] Comentário enviado por pherde em 24/09/2010 - 14:46h

Po...... muito bom o artigo, muito bem detalhado....

[2] Comentário enviado por removido em 26/09/2010 - 17:36h

Hermes Nunes Pereira Júnior:

you broke the balloon's mouth with your article. It's very well written. Congratulations!
10!

[3] Comentário enviado por obernan em 27/11/2010 - 17:09h

Muito obrigado pela contribuicao, esse seu tutorial e muito importante, ja copiei e gravai na minha pasta de tutos importates !!!!
Mas uma vez muito obrigado pela contribuicao.
Abraço

[4] Comentário enviado por tihbaptista em 28/11/2010 - 23:36h

Sempre quando eu tento executar esse comando mdadm /dev/md2 -a /dev/sda6 diz que o device esta ocuado. É o device responsavel pelo swap, tem alguma ideia do que pode ser?

[5] Comentário enviado por aj.vini em 12/01/2011 - 15:15h

@tihbaptista

Seu swap está ativado? Se sim, desative-o com o swapoff /dev/sda6 antes de executar o comando.

[6] Comentário enviado por moliveira777 em 13/08/2011 - 22:44h

Boa noite,

Parabéns pelo artigo, mas fiquei com uma dúvida, os comandos abaixo são no HD master(sda) ou slave(sdb) ?

# cd /mnt
# mkdir raiz
# mount -t ext3 /dev/md0 raiz
# cd raiz
# mkdir initrd mnt proc sys
# cp -a /boot /bin /cdrom /dev /etc /initrd.img /lib /media ./
# cp -a /opt /root /sbin /selinux /srv /tmp /usr /var /vmlinuz ./


[7] Comentário enviado por alexandre.unix em 21/10/2011 - 12:35h

bom dia, esse tutorial não está funcionando, quando configuro conforme abaixo
As alterações ocorreram nas linhas:

root (hd1,0)
kernel /vmlinuz-2.6.24-1-686 root=/dev/md0 ro

Esta alteração vai fazer com que o sistema dê o boot pelo /dev/md0, a partição raiz, mas no segundo HD, o hd1,0.

o linux não carrega mais ai reinstalei novamente e pulei essa parte e continuo, só que quando chegar para atribuir os discos sda1 e os outros ele não deixa fala que está ocupado, teria como alguém me ajudar ?

[8] Comentário enviado por alexandre.unix em 21/10/2011 - 15:05h

Seguam esse tutorial que funciona.
Raid1 instalando o sistema do zero...
Testei todos os passos ,funciona perfeitamente.
Testei também o desastre com os 2 discos, uma de casa vez, dei o restore e funcionou perfeitamente.


http://translate.google.com.br/translate?hl=pt-BR&sl=en&u=http://mikeoverip.wordpress.com/2009/12/07...


Abraços...

[9] Comentário enviado por minduim em 29/01/2012 - 21:11h

Por favor alguem poderia me ajudar? Não consigo com que o Ubuntu 11.10 de boot com RAD1 no segundo HD.
Aproposito parabéns pelo artigo.

http://www.vivaolinux.com.br/topico/GRUB/Ubuntu-1110-Raid1-via-software-nao-funciona

[10] Comentário enviado por ksombrah em 08/03/2019 - 11:57h

Bom dia!
Só um detalhe se tenho uma estrutura LVM montada tem algum detalhe diferente, a parte de mudar o sistema de arquivos do HD não afetará o que já está no Sistema?
At.te

Paz e Bem!
Alcione Ferreira
Sombra®
101080
[http://www.alcionesytes.net/]
------------------------------------------------
Liberdade e conhecimento ao alcance de todos.

Office Escritório - http://www.libreoffice.org/
Navegador Firefox - http://www.mozilla.org.br/
Email Thunderbird - http://www.mozilla.org.br/
---------------------------------------------------------------
Linux user number 432030 of http://counter.li.org/
---------------------------------------------------------------
ICQ: 377035698
Jabber: ksombrah@jabber.org
MSN: alcione.sombra@hotmail.com
---------------------------------------------------------------
Curriculum: http://lattes.cnpq.br/0545256741852110


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts