Fala galera!

Neste post quero mostrar como podemos utilizar fontes ou enviar arquivos para planilhas hospedadas no Google Drive.

O primeiro passo é instalar a seguinte extensão no Pentaho:

Ao final, essa extensão irá habilitar os seguintes steps na transformação:

Para conectar o PDI nestes steps precisamos de um token no formato json que vai garantir a conexão segura com o serviço via uma API.

CREDENCIAIS E APIs

O primeiro passo é habilitar as credenciais. Clique neste link e acesse a aba ‘credenciais’ à sua esquerda.

Ao clicar, procure por “criar credenciais”.

Atribua um nome para sua conta de serviço. Fica tranquilo que o ID cria sozinho.

Ao criar, uma nova opção se abrirá pedindo para configurar que tipo de papel esse perfil terá no controle do serviço, escolha o seguinte, para o controle total:

Seremos enviados para a tela inicial com as nossas contas criadas. Selecione a conta criada e na próxima tela, vamos configurar a chave para esta conta que será o token no formato JSON:

Clique em chave e nas seguintes opções:

Quando clicar em “criar nova chave”, uma tela com duas opções se abrirá, escolha a opção “json” e peça para o serviço criar a chave.

O download iniciará automaticamente e é bem rápido. Vá nas pasta onde seu arquivo foi salvo e copie e cole para o diretório do PDI dentro da pasta da extensão:

Quando chegar no diretório acima, vá para pasta “credentials”.

Por via das dúvidas, ative a API do Google Drive para não ter nenhum problema.

Acesse este link, e clique em ativar “Ativar APIs e Serviços”.

Um novo link irá se abrir, procure pelo Google Drive e ative.

Ao clicar em gerenciar, ative o serviço no link seguinte:

Basta ativar e pronto, criado o serviço de API do Google Drive.

Após ativar a API do Google Drive, ative a de planilhas no serviço do Google neste link. Basta clicar em ativar.

CONFIGURANDO O STEP NO PENTAHO

Voltando ao Pentaho, dentro do step de Pentaho Google Sheets Output na primeira aba que se chama Service Account vá ao diretório do token Json que baixamos e escolha o arquivo.

Utilizarei o Output por não ter nenhuma planilha criada.

Abaixo a minha transformação de exemplo com um Data Grid gerando dados para planilha.

Na aba spreadsheet vamos configurar os caminhos que os dados terão.

Estas foram as minhas configurações.

  • Spreadsheet Key – nome da planilha que irá para o API.
  • Worksheet ID – nome da aba da planilha.
  • Create new sheet if it does not exist – configura se a planilha será criada ou não.
  • Share Full Rights (RW) with: aqui é para compartilhar a planilha com outras contas que irão modificar ou apenas ver o arquivo.

Se seguiu os passos corretamente até aqui, basta executar a transformação que a planilha será criada.

Abaixo, o log de erros com o processo finalizado.

E abaixo, a planilha criada e compartilhada com meu endereço de e-mail utilizado.

INPUT STEP

Para o Input o processo é bem mais simples, mas aqui é um tanto peculiar. Abra a planilha que deseja puxar os dados e copie uma parte do ID da planilha para o step do PDI.

Esse ID se encontra no endereço web do arquivo destacado em amarelo, veja abaixo:

Passando esse código para o step.

Após, basta ir na aba get fields e puxar as colunas do arquivo.

Com o input configurado, ligue-o com um dummy step e execute a transformação.

Resultado da transformação.

Comparando com a planilha, mostrando que os valores estão correspondentes.

A transformação final de exemplo ficou desta forma.

CONCLUSÃO

Este foi um post simples, apresentando mais uma opção de fonte e direção de dados para o PDI.

A parte mais trabalhosa é ativar a API de conexão que é um pouco mais demorada.

O ponto negativo é que não da para compartilhar com mais de uma conta de email no Share Full Rights (RW) with. Pelo menos, eu não consegui.

E um ponto que achei interessante é o fato dele utilizar parte do endereço web como forma de acesso no input. Bem diferente.

Espero que gostem, saúde!

Link para baixar o arquivo, aqui!