4. Fazer DUMP do banco de dados a ser migrado:
A primeira coisa que você deve fazer agora é exportar cada banco de dados individual. A melhor forma de fazer isto é utilizando o pg_dump através da linha de comando. Você pode fazer alguns testes iniciais sem carregar a estrutura dos dados para ver se está tudo ok. Para isto, utilize a opção '-s'. Depois você pode exportar apenas os dados utilizando a opção '-a'.
$ pg_dump --use-set-session-authorization -E utf-8 -h ip_do_banco -U postgres nome_do_banco_a_ser_migrado > nome_do_banco_a_ser_migrado.sql
A opção '--use-set-session-authorization' é opcional. Ela faz com que seja utilizada o comando SQL 'SET SESSION AUTHORIZATION' ao invés do 'ALTER ... OWNER' para cada objeto. A opção '-E' força a exportação ser realizada na codificação de caracteres desejada. Desta forma não é preciso utilizar o iconv ou mudar o 'client enconding' para importar os dados na codificação correta.
5. Editar o dump:
Agora vem a parte mais importante do processo de migração, editar o dump e corrigir algumas coisas:
- Alterar o tablespace para as tabelas e índices com o comando SQL 'SET default tablespace';
- Criar o usuário que será dono do schema e todos os objetos dentro dele, a ser utilizado pelo desenvolvedor. Colocamos também um limite de conexões para este usuário para impedir que o desenvolvedor tente utilizar este usuário como usuário da aplicação;
- Criar um ou mais usuários a serem utilizados pela aplicação;
- Criar o schema e defini-lo como padrão para que todos os objetos subsequentes sejam criados dentro dele, através da instrução 'SET search path';
- Criar as permissões para os usuários das aplicações concedendo apenas os privilégios realmente necessários para eles.
Alguns cuidados:
- Utilize um editor em modo texto, principalmente se o seu dump for muito grande. Isto irá facilitar o seu trabalho de edição, pois abrir arquivos grandes em modo gráfico pode acabar com a memória do seu computador mais rápido do que em modo texto. Outra alternativa é criar um dump separado para a definição de dados DDL e outro para os dados em DML. A maior parte das alterações dizem respeito apenas a DDL, que são arquivos bem menores.
- Verifique se existe uma linha igual a esta no início do arquivo:
SET client_encoding = 'utf-8';
Ela é importante para garantir que o psql vá utilizar a codificação correta durante a importação. Caso você esteja utilizando outra codificação, você poderá ter problemas durante a importação. Mude a codificação de caractere para UTF8 ou mude o 'client-encoding' para aquele que o arquivo do dump está utilizando.
- Algumas linhas como o 'SET default tablespace' e 'SET search path' já vem no dump padrão realizado pelo pg_dump. Ao invés de reescrever estas linhas, apenas altere a já existente. O risco não fazê-lo é criar um parâmetro que será sobrescrito pré-existente no dump pouco após da linha que você acrescentou.
- Algumas funções em PL são criadas dependendo da versão do PostgreSQL que você está utilizando. Estas funções costumam ser criadas ao se criar o banco de dados ou ao se implementar alguma funcionalidade do diretório contrib do PostgreSQL. Geralmente, estas funções são comuns a todos os sistemas e não precisam ser incluídas novamente. Costuma ser seguro remover estas linhas do dump. Caso ocorra algum problema durante a homologação, você poderá criar um novo dump e recuperar as funções da base de dados antiga.
5.1 Criando usuários:
CREATE ROLE sistema_a WITH LOGIN PASSWORD '123456' INHERIT IN ROLE developer CONNECTION LIMIT 2;
CREATE ROLE sistema_a_client WITH LOGIN PASSWORD '123456';
SET SESSION AUTHORIZATION sistema_a;
Note aqui que o 'INHERIT IN ROLE developer' faz com que o usuário faça parte da role developer e ainda herde as permissões dele. A linha 'SET SESSION AUTHORIZAION' faz com que os objetos subsequentes sejam todos criados com o usuário citado como owner.
5.2. Criando o schema:
Agora criaremos o schema com o mesmo nome do usuário do desenvolvedor. É importante que o usuário tenha o mesmo nome do schema, pois no arquivo postgresql.conf o 'search_path' inclui a variável '$user' por default. Isto significa que o nome do usuário que se conectar procurará automaticamente objetos neste schema sem precisar qualificar seu nome ou utilizar o 'SET search path'.
CREATE SCHEMA sistema_a AUTHORIZATION sistema_a;
5.3. Definido os tablespaces:
Para definir o tablespace, você deve procurar dois pontos importantes no seu dump: o ponto imediatamente anterior antes de criar as tabelas e o ponto imediatamente anterior a criação dos índices e constraints.
Antes da criação das tabelas coloque a seguinte linha:
SET default_tablespace = 'tbs_tables';
Antes da criação de índices e constraints, coloque a seguinte linha:
SET default_tablespace = 'tbs_indexes';
5.4. Concedendo privilégios aos usuários da aplicação
No final do dump, o pg_dump coloca as permissões inerentes aos objetos criados para cada usuário. Esta parte do trabalho não tem como ser automatizada. É interessante manter o REVOKE para o usuário PUBLIC de forma a zerar as permissões para todos os usuários antes de concedê-las novamente. Evite a todo o custo conceder privilégios do tipo ALL, a fim de não conceder mais privilégio do que o estritamente necessário para cada usuário. Apesar de ser uma tarefa tediosa, esta é uma tarefa importante no trabalho de qualquer bom DBA. Privilégios do tipo CREATE, TEMP, DELETE, RULE, REFERENCES, TRIGGER que só devem existir em usuários de sistema em casos específicos.
6. Importação:
O último passo é importar cada dump devidamente alterado no passo anterior para o banco de dados central.
$ psql -h ip_do_banco -U postgres nome_do_banco < nome_do_banco_a_ser_migrado.sql
7. Testes:
Por fim, deve-se testar a aplicação para que ver se tudo está funcionando adequadamente com o usuário do sistema e senha nova. Pode ser necessário qualificar o nome dos esquemas para acessar os objetos no local correto. Uma alternativa mais simples é utilizar a instrução 'SET search path' logo após a conexão com o banco de dados. Uma boa idéia é utilizar também a instrução 'SET client enconding' utilizando a codificação da sua aplicação. Como o UTF8 tem a capacidade de ser convertido para a maior parte dos tipos de codificação, ele é ideal para ser utilizado no servidor, enquanto no cliente você pode escolher o tipo de codificação mais adequado para a sua aplicação.
Lembre-se de testar cuidadosamente sua aplicação antes de libera-la para a produção. Um servidor de testes é fundamental para este processo.
Referências:
Schemas:
http://www.postgresql.org/docs/8.1/interactive/ddl-schemas.htmL
psql:
http://www.postgresql.org/docs/8.1/interactive/app-psql.html
pg_dump:
http://www.postgresql.org/docs/8.1/interactive/app-pgdump.html
CREATE DATABASE:
http://www.postgresql.org/docs/8.1/interactive/sql-createdatabase.html
CREATE TABLESPACE:
http://www.postgresql.org/docs/8.1/interactive/sql-createtablespace.html
CREATE SCHEMA:
http://www.postgresql.org/docs/8.1/interactive/sql-createschema.html
CREATE ROLE:
http://www.postgresql.org/docs/8.1/interactive/sql-createrole.html
GRANT:
http://www.postgresql.org/docs/8.1/interactive/sql-grant.html
REVOKE:
http://www.postgresql.org/docs/8.1/interactive/sql-revoke.html
SET:
http://www.postgresql.org/docs/8.1/interactive/sql-set.html
SET AUTHORIZATION SESSION:
http://www.postgresql.org/docs/8.1/interactive/sql-set-session-authorization.html