Fala pessoal, estão bem?

Hoje quero passar para vocês uma dica rápida sobre tratamento de linhas.

Com essa tarefa podemos pegar uma amostra, que pode ser configurável e analisar o comportamento e o que contém ali. Para esse exemplo, vamos utilizar a tarefa row sampling.

CONFIGURANDO ROW SAMPLING

Crie uma conexão com o seu banco e uma tabela qualquer no data flow e adicione a tarefa row sampling, quando adicionar, ligue sua fonte oledb com ela.

Após configurar conforme a imagem, crie uma raw file conection e habilite o famoso data view. Não esqueça criar a relação entre.

O sample output name é o nome que será dado para a saída das linhas que teremos como exemplo

E o Unselected output será o nome para a saída das linhas que não iremos analisar e após, execute o processo.

ETL CRIADO

Outro ponto que preciso ressaltar aqui é a opção de ativar o random seed que permite “gravar” um certo conjunto de exemplo, já que essa task escolhe as linhas de forma aleatória!

CONFIGURANDO O SEED DO SAMPLE

Quando habilitar e configurar, toda vez que esse data flow com essa task for executado, ele irá retornar a mesma amostragem de linhas extraídas da fonte. Para criar nova amostragem basta desmarcar ou configurar um novo seed.

Espero que tenham gostado dessa dica, saúde!