Olá pessoal, como estão!?

Como eu tinha mencionado no Instagram há um tempo atrás, eu decidi migrar de ferramenta de ETL passando do SSIS para o Pentaho e desde então, tenho desbravado esse incrível programa que possui as mais variadas transformações no seu hall de tarefas.

E como estou voltando a produzir os posts novamente aqui no blog e insta, nada mais justo que retomar os posts sobre ETL mas desta vez, sobre o Pentaho Data Integration.

Para este primeiro post, irei começar com a introdução de como criar conexão com SQL Server autenticando via S.O – padrão Windows.

INÍCIO

O primeiro passo é baixar o Pentaho. O download será iniciado após o cadastro que o site pede e ao final, configure as variáveis de ambiente que o software necessita.

Quando terminar o passo acima, baixe no site da Microsoft o drive de conexão Java (JDBC) e copie os arquivos que vieram compactados no download para a pasta lib do Pentaho.(link demonstração).

O Pentaho virá em um arquivo .rar. Extraia em um diretório desejado e execute o arquivo Spoon que está na pasta principal. (spoon.sh – nome do arquivo)

Aqui, temos a pasta do arquivo baixado no site da Microsoft. Coloque os dois arquivos que estão dentro desta pasta na pasta lib Pentaho.

Abaixo, a pasta onde devemos colocar os drivers Java baixados no site da Microsoft.

Ao terminar este processo, execute o arquivo spoon.sh e o Pentaho irá iniciar.

Quando ele iniciar, aparecerá essa tela:

Circulado em preto, temos a aba que guarda todas as transformações que o Pentaho oferece.

Em vermelho, as conexões com banco, conexões entre os steps (tasks de transformação) e etc. 

Para este primeiro momento vamos apenas criar a conexão com o banco, e para tal, clique com o botão direito na opção database connections → new.

Aqui temos  a tela de criação da conexão com SQL Server.

Se houver alguma dúvida, veja abaixo:

  1. Sublinhado em vermelho está o host name;
  2. Sublinhado em azul está o server name.

O database name basta adicionar o nome do seu banco fonte.

Na configuração port number coloque a porta que o seu banco SQL Server usa, caso não tenha alterado a configuração padrão, é: 1433.

Não se esqueça de criar o nome da conexão. O Pentaho irá acusar falha se não houver.

Caso tenha feito todos os passos e ainda esteja dando algum erro referente a conexão ou port number, talvez seja necessário habilitar os drivers de conexão do SQL Server.

Abra o SQL Server Configuration Manager. (se não sabe onde encontrar, leia esse post). Ao abrir o SSCM vá em SQL Server Network Configuration e habilite-os. 

Faça isso para todas as instâncias que existirem no seu ambiente e caso não configure a porta, será a padrão 1433. 

Ao habilitar, tente conectar novamente o Pentaho ao SQL Server com o teste de conexão.

Configuração final da conexão.

Ao criarem a configuração para a primeira conexão, existe uma forma de gravar essa conexão para todas as outras transformações que forem criadas, independente de ser uma nova.

Ainda na aba View, abra a pasta do database connections, clique com o botão direito na conexão criada e share. 

Quando clicar na opção de share o PDI automaticamente irá ‘disponibilizar’ essa conexão para qualquer transformação criada. Ele armazena em um arquivo de log na sua pasta de extração.

As conexões compartilhadas passam a permanecer com o nome em negrito.

CONFIGURAÇÕES DE CONEXÃO COMO VARIÁVEIS.

No Pentaho, temos a opção de armazenar as configurações que utilizamos para criar a conexão com o SQL Server como parâmetros de variáveis. Exemplo: criando uma variável para o host name que foi utilizado.

Esse processo é apenas para economizar tempo e agilizar seus trabalhos. Veja abaixo como criar.

Ao clicar na opção circulada em vermelho, esta tela irá aparecer.

Ao abrir esta tela, verá diversas variáveis do próprio Pentaho (Kettle) e caso queira adicionar, basta clicar com o botão direito e adicionar uma linha.

A nomenclatura e o valor ficam a critério e pelo que entendi, não é possível adicionar descrição para estas variáveis ‘customizadas’. Pelo menos, não consegui.

Quando terminar, basta ir em configurações de conexão para utilizar.

Irei criar uma nova conexão apenas utilizando as variáveis.

Reparem nos símbolos destacados em preto. Todas as vezes que abrirem algum step no Pentaho e encontrarem este símbolo, podem utilizar variáveis na transformação.

Vejam que dentro da caixa vermelha, não digitei o nome do host, do banco de dados ou instância, apenas passei as variáveis que armazenam esses valores. 

A tecla de atalho para abrir a opção é: ctrl + barra de espaço.

NOTA: variáveis possuem um sinal de dólar antes do nome. 

Ao terminar de configurar, faça o teste de conexão e após, finalize o processo.

CONCLUSÃO.

Este foi um post introdutório sobre como criar conexão no Pentaho para acessar o SQL Server e começar com as transformações.

Existe mais uma forma de conexão dinâmica que ainda não domino, mas em breve trarei aqui no blog.

OLÁ!

Se chegou até aqui e gostou do pequeno tutorial, deixe seu like compartilhe. Ajude o blog a alcançar mais pessoas!

Caso queira receber em primeira mão esse tipo de conteúdo, se inscreva abaixo:

SIGA NAS REDES SOCIAIS:

Espero que tenham gostado, saúde.