Talend Open Studio: Primeiros Passos

Compartilhe este post

Neste post vamos apresentar à vocês a ferramenta Talend Open Studio para que possam fazer avaliação do quanto essa ferramenta é prática e eficaz.

Hoje, todos procuram soluções inteligentes para o mundo dos negócios. Transformar Gigas, Terabytes de dados em informação legível, como gráficos, tabelas, é algo não apenas necessário, mas essencial para a tomada de decisão que hoje, acompanhando a velocidade da informação, deve ser feita em tempo real, tudo é para agora, ou melhor, ontem.  É onde entra a inteligência nos negócios, Busineess Intelligence (BI).

As ferramentas de integração de dados, são conhecidas também como ETL (Extract, Tranform, Load), onde a função destas nada mais é do que preparar todos esses dados e organizá-los de forma a serem guardados em tabelas, fazendo com que consultas posteriores sejam mais simples e eficazes, é onde um emaranhado de dados começa a fazer sentido. Nesse ponto que se encaixa o trabalho do Talend Open Studio, a ferramenta livre e de código aberto da empresa francesa Talend. Com um poderoso sistema ETL, esta se comporta como a mais abrangente em código aberto do mercado.

O Talend também trabalha com o processo denominado ELT (Extract, Load, Tranform), onde este sobressai em desempenho, quanto a carga em banco de grande volume de dados por aproveitar a eficiência das funções nativas do banco de dados em uso. O Talend mostra que a solução livre pode ser um ótimo negócio, chegando a concorrer com grandes como IBM, SAS e SAP.

Alguns Destaques

Um ponto positivo é quanto a documentação. No próprio site da Talend podemos encontrar toda a documentação para qualquer versão da ferramenta que queremos, seja ela em uma versão paga ou não. Podemos encontrar desde detalhes sobre a arquitetura do sistema até os componentes, explicados um a um, quanto a função e uso.

Desenvolvido em Java, O Talend possui entre outras, gerenciador gráficos para processos ETL, gerenciador de metadados, interface WebService para processos ETL. Aqui daremos uma visão sobre ETL, e a ferramenta gratuita TOS – Talend Open Studio, usada para tal fim. Desde instalação, passando por uma configuração inicial, e uma breve visão de interface.

Em outros posts trataremos especificamente cada uma dos tópicos tratados superficialmente aqui a fim de apresentar a ferramenta de maneira completa para que possamos passar para níveis mais avançados de tutoriais, onde ficará mais divertido! Mas agora vamos a parte chata menos legal necessária.

Talend é uma ferramenta que trabalha com a geração de código, sendo Java ou Perl. O mecanismo de geração de código permite a integração do código gerado pelo Talend dentro de outras soluções, além de ter maior portabilidade. E esta é o grande diferencial do Talend. Aqui trataremos apenas para o caso de Java, o que não torna inútil para quem segue com Perl, pois nos tutoriais trataremos do desenvolvimento que pode ser seguido em qualquer um dos casos.

Instalação do Talend Open Studio

A instalação do Talend é muito simples. Na verdade, trata-se de uma extração para diretório de caminho curto, como “c:\Talend”, e ‘voila!’. Está feito. Agora podemos passar para a primeira execução.

Execução

Na execução, não somente na primeira, mas em todas, é apresentada um janela para

a configuração, seleção, importação, de projetos. Em dois campos, sendo o primeiro quanto a conexão, como local ou remoto, e um segundo campo projeto, onde temos opção de importar, criar ou remover um projeto. Por enquanto ficaremos com os projetos de demonstração em Java. Clique em ‘…’ e crie uma nova conexão. Selecione ‘Local’ em repositório. Dê um nome à sua conexão, sugiro “Local”. Escolha um diretório destino para a Workspace dos seus projetos.

Uma observação a ser feita, o Open Studio não possibilita a criação de uma conexão remota, ou seja, para o TOS o desenvolvimento sempre ocorrerá localmente.

No campo “Projeto” selecione ‘Import demo project’ clique em ‘Go!’, então selecione a linguagem. Espere a importação. Então refresh na lista de projetos,  selecione ‘TALENDDEMOSJAVA – java’ e ‘Open’. Pronto, aqui temos uma boa quantidade de Jobs, metadados, entre outros, sendo o suficiente para uma boa diversão.

Interface

Talend Open Studio
Interface do Talend Open Studio

Por default, o Talend dispõe suas abas da forma que irei apresentar logo em seguinte. Mas nada impede o usuário de ocultar, exibir outras opções, bem como mudar tamanhos, e até mesmo os locais das mesmas.

À esquerda, encontramos nossas conexões, metadados, templates, funções, além dos desenvolvimentos já desenvolvidos, bem como suas versões. Enfim, os dados a serem integrados e/ou transformados em nosso projeto, bem como funções que possamos vir a utilizar neste.

À direita, está o ouro. Digo isso pela gama de componentes que encontramos. É possível se chegar a solução do nosso problema de várias maneira diferentes usando vários componentes diferentes tamanha é quantidade de componentes disponíveis por default. E claro, se chegar a solução não é o único objetivo. Mas fazer isso com o menor número de recursos possíveis, como tempo, e recursos da própria máquina. Aqui, sempre priorizaremos mostrar a melhor solução, por excelência.

Abaixo, encontramos a aba de configuração, execução, teste, debug, o Talend Exchange, que possibilita a inclusão automática de novos componentes ampliando ainda mais nossos horizontes. Onde também configuramos as opções de cada componente adicionado ao Job.

E no meio disso tudo no campo para criação. O espaço onde desenvolvemos as soluções, onde os componentes são adicionados linkados para gerar o Job. Tudo no “arraste”, botão direito,  muito intuitivo.

O Talend apresenta solução flexível para atender aos processos de ETL de forma segura e confiável. A documentação pelo desenvolvedor se mostra bastante simples e de fácil acesso e fácil extração, podendo exportá-la como HTML, por exemplo. Estando ciente que a documentação se encontra completa apenas em inglês ou francês, é possível estudar sozinho para conhecer melhor esta ferramenta e perceber que pode ser usada para várias soluções que está procurando.

Assine nossa newsletter

Fique por dentro das novidades mais recentes sobre o Talend e aprenda com nossos experts

Leia outros posts do nosso blog

Talend

Qlik adquire Talend. O que esperar desta fusão?

No dia 16 de Maio de 2023, a Qlik anunciou o fechamento da aquisição da Talend, ampliando seu portifólio de soluções para acessar, transformar, analisar e agir com dados confiáveis. Com essa fusão, a Qlik pretende oferecer uma solução abrangente e de última geração para integração, qualidade e análise de dados.

Talend

Talend Studio: Usando variáveis de contexto

Olá, neste job mostraremos como definir variáveis de contexto no Talend Studio. Variáveis de contexto podem armazenar diretórios, configuração de banco de dados, enfim tipos

Quer acelerar a tomada de decisão com dados de qualidade?

Fale conosco agora mesmo!

Fale com nossos experts

O café é por nossa conta!