Os dados são organizados em estruturas, que os armazenam digitalmente de
modo que possam ser lidos por um computador. Essas estruturas são chamadas
de arquivos.
Os arquivos são armazenados, no sistema de arquivos, em diretórios que são
uma subdivisão lógica e que funcionam como repositórios de arquivos ou de outros diretórios.
O conjunto de diretórios e arquivos forma um sistema de arquivos raíz, ou
"árvore" de diretórios, que no
GNU/Linux deve seguir um padrão
estabelecido. Segundo RIBEIRO (2004), o sistema de arquivos é hierárquico
e admite que diversos dispositivos sejam mapeados e utilizados a partir do
diretório raíz (root). Para o usuário toda essa estrutura é vista de forma única.
A denominação "sistema de arquivos" também é usada para se referir ao
formato lógico que é dado ao dispositivo de armazenamento, pelo sistema
operacional, no momento da formatação. O sistema de arquivos é que define o modo como os arquivos são estruturados, nomeados, acessados, utilizados, protegidos e manipulados pelo sistema operacional.
Segundo NEMETH et al (2004), o GNU/Linux suporta diversos formatos de sistemas de arquivos através de uma camada modular introduzida no kernel denominada VFS (Virtual File System).
Dentre os sistemas de arquivos suportados pelo GNU/Linux estão os sistemas
EXT3 e
ReiserFS, que apresentam excelentes tempos de resposta em suas tarefas e possuem recursos avançados de recuperação de dados em casos de desastres e falhas.
Essa característica de recuperação é chamada de "journaling" (registro de ações). Sistemas que não possuem "journal" são mais suscetíveis às falhas e perdas de dados. Além disso, em caso de parada do sistema ou falta de energia, o tempo necessário para retomar as operações é elevado, já que uma verificação de integridade é realizada em cada arquivo do sistema. Nas partições que possuem milhares de arquivos essa verificação pode levar horas.
Os sistemas de arquivos com suporte a "journal" são recomendados por aumentarem a disponibilidade (High Availability - HA) em servidores GNU/Linux. A alta disponibilidade é medida pelo tempo em que o servidor se encontra fora de serviço por falhas no sistema operacional ou no hardware.
Quanto menor o tempo em que o sistema estiver indisponível, maior é o índice de disponibilidade, medido em uma escala de casas decimais que tende a se aproximar de 100%, conforme Tabela 1.