0:00
[MÚSICA] [MÚSICA]
>> Edileusa,
quais são os benefícios do Hadoop?
>> Os benefícios do Hadoop, os principais que eu vejo,
é trabalhar com grandes informações de dados mais de beta bytes,
de forma massiva, paralela e dando uma resposta muito rápida para tudo isso.
E usando hardware de uma forma barata,
hardware de commodities, que você forma esse ambiente,
que você tem essa escalabilidade e você pode trabalhar com esse dado.
Hoje na Unisys, nós temos a nossa máquina AB e nessa máquina nós
rodamos o Hadoop, onde temos processamento muito alto,
tudo paralelo e podemos rodar Machine Learning e ter
modelos de dados rodando cerca de cinco a três
minutos você tem rodando uma amostra de dado inteira e
você consegue esse nível de rapidez da execução do seu modelo,
onde você tem a possibilidade de fazer grandes otimizações do seu
modelo e refiná-lo até ele chegar no ponto ótimo.
Isso incluindo uma base de dados completa e não só trabalhando com uma amostra,
mas sim com a base de dados inteira.
>> Essa é a grande vantagem da tecnologia, não é?
>> Essa é a grande vantagem.
>> Processamento de tempo real, de forma paralela, com réplica.
>> Com o Hadoop, você consegue unir dados estruturados e não estruturados.
Você poderia dizer assim ' no meu data warehouse eu processo grandes volumes
de dados'.
Tá, mas você não processa dados não estruturados integrado com dados
estruturados, como você processa no Hadoop.
Então essa é a grande sacada do Hadoop.
E você cresce esse Hadoop, você..
>> Escala a vontade.
>> ..escala a vontade o quanto for
necessário para acomodar os seus dados e você utiliza a base de dados completa.
Essa é a proposta de Big Data.
Você não mais vai estimar, você vai medir,
você vai processar a base de dados completa.
>> Luciano, como é que inicia projeto de Big Data?
>> Bem, essa é uma pergunta bastante comum dos clientes fazerem.
Principalmente aqueles clientes que têm interesse e têm muita vontade,
mas ainda não se localizam muito no assunto ainda.
Então a gente diz assim,
que todo projeto de Big Data começa com business case claro.
Ele tem que saber onde ele quer chegar, número.
Ele sabendo onde ele quer chegar, pelo menos por período de tempo,
ele pode partir para o step dois, que é trabalhar sua governança de dados.
Governança termos de quais bancos vão ser envolvidos nesse trabalho e
a qualidade dos dados que esses bancos precisam trazer.
Então uma vez que você tenha o business case claro e você consegue trabalhar na
agregação e na qualidade dos seus dados, você já está apto a dar os primeiros
passos relação a trabalho de Big Data, Advanced Analytics, ou Machine Learning.
>> E você também, quando você vai iniciar projeto de Big Data,
você tem que voltar para dentro da sua empresa e buscar o dado.
Seja ele dado que esteja ambiente analítico,
ambiente relacional, estruturado e seja ele dado não estruturado.
E você vai olhar para esses dados e dizer 'não,
eu tenho condições de tirar valor de toda essa gama de dados que eu tenho'.
Então você precisa organizar esse dado, pensar na qualidade que esses dados têm,
para você poder tirar valor dele e você começar a trabalhar com esses dados,
fazendo para buscar as respostas para o seu negócio.
>> Luciano, quais os desafios para a implementação de projeto de Big Data?
>> Professora, eu acho assim, os quatro principais desafios que existem para
qualquer projeto de Big Data, acho que o primeiro deles é a clareza de objetivos.
A empresa precisa ter claro quais são os objetivos,
aonde ela quer chegar com o uso dessa tecnologia.
No segundo momento, ela precisa definir e ter expectativas realistas.
Porque, muitas vezes, levado por consultores e por empresas que querem
muito vender uma solução de Big Data, ou uma solução de Advanced Analytics, acaba
criando expectativas que são irrealistas ou muito difíceis de serem alcançadas,
mas extremamente otimistas.
Eu acho que nesse trabalho a Unisys é muito coerente, ela sempre ajuda o cliente
a buscar, criar expectativas realistas para o que ele vai fazer, para a gente
incrementalmente chegar nesse objetivo final, que é o objetivo do cliente.
Eu acho que ponto importantíssimo,
desafio importantíssimo na área do Big Data é conhecimento.
O conhecimento muda muito rápido,
as tecnologias mudam com uma frequência absurda e são muito complexas.
Então, se você não tiver domínio sobre essa complexidade e sobre a velocidade
de mudanças que a tecnologia sofre ao longo do tempo,
você não só não consegue executar,
como você não consegue acompanhar o que está acontecendo no mercado.
Então, eu acho que isso é uma coisa crítica.
E por fim, eu acho que o principal desafio do Big Data hoje
dia é que as empresas reclamam muito, ou as vezes nem se dão conta que ele existe,
que é o desafio da escalabilidade.
O que acontece, as empresas vão, compram software, pacote,
juntam os dados deles de alguma forma, agregam a certo nível,
começam a produzir BIs avançados, eventualmente, até testar modelos.
Mas o problema é que quando você parte para a escalabilidade tudo muda.
Não dá para usar aquela estruturação de dados, não dá para usar aqueles programas,
não dá para utilizar aquela forma de agregação de dados.
Então assim, escalabilidade é o principal desafio qualquer empresa,
que quer trabalhar com Big Data, extrair valor disto, vai enfrentar.
>> Perfeito.
Antes de começar projeto tem que ter bom planejamento para não dar problema.
>> Certamente.
>> Edileusa,
quais são as demandas de infraestrutura para os projetos de Big Data?
>> As demandas de infraestrutura é que você tenha uma infraestrutura que
processe dados massivos e de forma paralela.
Isto faz todo diferencial.
Como o Luciano acabou de falar, é diferente de você ter BI,
você ter data warehouse, onde você processa também grandes volumes de dados,
mas você não consegue unir com outros dados, como a gente já comentou,
não estruturados, e tudo mais, para ter a resposta para o seu negócio.
Então a questão é você fazer, para esta infraestrutura,
é usar essa plataforma que te permita contemplar esses dados não estruturados,
semiestruturados, estruturados, de uma forma conjunto.
Então isso é importante, você ter essa infraestrutura,
a infraestrutura adequada para esse tipo..
>> De problema.
>> ..de problema, que exige essa estrutura.
>> Para cada problema vamos buscar a melhor..
>> A solução mais adequada.
>> E é muito importante também ressaltar, professora,
que no caso da Unisys nós não temos a ferramenta de Big Data, e de Analytics.
Assim, a gente usa as ferramentas que são mais compatíveis de diagnósticos,
a gente usa as ferramentas que são mais compatíveis com o estado atual de avanço
do cliente, ou a gente usa as ferramentas que a gente recomenda para ele,
que são as melhores ferramentas para se usar para se chegar no objetivo dele.
Então a gente não tem assim, nome mágico de uma ferramenta mágica,
onde você joga as informações e saem as respostas.
Não é assim que funciona.
Nós vamos de maneira, sempre entendendo o problema do cliente, sempre de uma maneira
que vai tornar essa experiência, essa mudança dele mais palatável,
mais fácil de ser utilizada e com os melhores resultados.
>> E essa flexibilidade favorece a implementação de projeto de Big Data.
>> Com certeza.
>> Luciano, como justificar projeto de Big Data?
Esta pergunta vale milhão de dólares.
>> Realmente, professora.
É a pergunta de milhão de dólares.
Todos os clientes normalmente chegam com essa demanda assim 'olha eu tenho
interesse, quero fazer, mas como é que eu codifico isto?' Então assim,
do processo natural de trabalho de consultoria Advanced Analytics da Unisys,
a gente tem várias reuniões com os clientes ao longo de algumas semanas,
inclusive, a gente realiza algumas imersões dentro das empresas.
Essa semana, por exemplo, na quinta-feira vou ter uma imersão dentro de cliente,
vou passar o dia inteiro com eles para entender o problema a fundo,
como eles trabalham hoje.
Cima dessas reuniões e desse trabalho de entendimento, a Unisys faz diagnóstico.
Esse diagnóstico, o que ele vai fazer?
Ele vai dizer assim, "qual que é o máximo valor que você pode
agregar à sua empresa para a resolução desse problema, que a gente pode
proporcionar com Advanced Analytics e Machine Learning?" Então a partir desse
número a gente vai fazer contratos, vai fazer o acompanhamento desses objetivos.
Então, é curioso porque, na verdade, a gente nunca tem isso na ponta da língua,
a gente sempre trabalha com o cliente para entender onde ele quer chegar,
como ele vai fazer, sugestões e chegamos num número.
Esse número é número criado de comum acordo entre cliente e Unisys e
a partir desse número nós vamos trabalhar.
Então assim, é curioso mas depois de mais ou menos 30 dias de trabalho a gente tem
número, ballpark, que a gente consegue conversar torno dele e obviamente nesse
processo o próprio trabalho se justifica termos de retorno de investimento.
>> Por que as empresas precisam se preocupar com segurança Big Data?
>> Bom, a maior parte das empresas quando começa a falar sobre o Big Data,
acaba não tendo noção de como isso é importante para ela,
não só termos de valor, mas como a segurança dessas informações vai se tornar
algo essencial para a operação do dia a dia dela.
Na medida que você começa a trabalhar com o Big Data e você começa a trazer os dados
de diferentes fontes para data lake,
você concentra a informação num lugar É como se você tivesse pequenos tesouros
espalhados pela empresa que fossem muito difíceis de você reunir e, até por isso,
é uma grande dificuldade de hackers hoje dia criarem grandes estragos nas empresas,
a inexistência ou dificuldade de se obter grande volume de dados.
Os dados estão muito dispersos hoje.
Na medida que você começa a trabalhar com o Big Data e trás todo o mundo para
data lake, é como se você pegasse toda a renda do país, ou da empresa,
e colocasse único cofre.
Quando você faz isso, o seu entendimento de como praticar segurança,
o seu entendimento de trabalho,
de credenciais para o uso dos dados, precisa mudar completamente.
Então na medida que você começa a trabalhar com Big Data,
você automaticamente tem que mudar o seu entendimento e a sua gestão
de segurança dentro da sua empresa.
>> É muito perigoso cyberattack, porque uma vez invadiu..
>> Sim. >> ..já consegue acessar o data lake.
>> Exatamente.
>> É muito perigoso.
[MÚSICA]