SlideShare uma empresa Scribd logo
1 de 13
Desafios do Big Data
Renato Ochando
1º Hackathon Inmetrics em parceria com a FIAP
Big Data
O que é?
Teve inicio no fim dos anos 90, com as empresas de
internet tentando gerenciar volumes de informação sem
precedentes.
Big Data é um termo que descreve sistemas com alto:
• Volume de informação
• Velocidade na ingestão de informação
• Variedade de dados
Demanda formas inovadoras de processar informação, a
um custo efetivo, que possibilitem visão profunda, tomada
de decisão e automação de processos.
“Big data não trata de petabytes, mas de computação
complexa.”
Big Data
O que é?
Se você é um desenvolvedor, até agora tudo bem com os
“três V” do Big Data – código de aplicação cuida de
volume, velocidade e variedade.
... Mas se você é um cientista de dados, nada disso cuida
do significado da informação. Então, são necessários mais
“dois V”, talvez:
• Veracidade da informação
• Valor que a informação agrega ao negócio
Em 2015, 85% das organizações na lista das 500 da
Fortune não serão capazes de explorar Big Data para
vantagem competitiva.
Volume
O Volume está sempre crescendo
Possuir mais informação significa possuir melhores
modelos.
Grandes volumes de informação são, de imediato, o maior
desafio para as estruturas convencionais de TI, o que
demanda por armazenamento altamente escalável e
consultas distribuídas.
As tecnologias mais utilizadas para armazenamento e
processamento de informações são Hadoop e MapReduce.
Constantemente o volume de informação criada excede o
limite da capacidade do seu storage (abordagem
seletiva).
Velocidade
Processamento em tempo real
A primeira geração de soluções para big data eram focadas
principalmente na captura e análise de informações batch.
Fast data se concentra em reduzir o intervalo de tempo
entre dados que chegam e o valor a ser extraído desses
dados.
Equilibra vários tradeoffs para entregar:
1. Confiabilidade na ingestão de dados;
2. Flexibilidade no armazenamento e consultas;
3. Ferramentas sofisticadas para analytics.
Big data foi ontem. Fast data é agora.
Variedade
Estrutura da informação
Soluções de Big Data irão armazenar informações
estruturadas, semiestruturadas, e não estruturadas. Por
exemplo documentos de texto, multimídia, etc.
Modelar e preparar informações de diferentes fontes de
sistemas para obter “visões” tem sido, por décadas, um
trabalho demorado e tedioso.
A maioria das organizações passam de 70% à 80% do tempo
modelando, em vez de interagir com com a informação
para produzir visões de negócio.
“Variedade, e não volume, será o maior desafio de Big
Data em 2015.”
Veracidade
In Data We Trust
Refere-se à vieses, ruído e anormalidade nos dados.
A correção da informação e eliminação de ruídos deve ser
feita, de preferência, na fonte de coleta.
Assim que os usuários começam a explorar as informações,
eles se tornam verdadeiramente engajados e mais
dispostos a investir em esforços para “limpar” os dados.
Veracidade não é apenas sobre a qualidade dos dados,
mas também sobre a compreensão dos dados.
Valor
Desafio de agregar valor
Lacuna entre habilidade e tecnologia para usar a
informação.
Enquanto 75% dos líderes de negócio acreditam que estão
extraindo máximo de seus dados. Na realidade, apenas 4%,
de fato, tem colhido frutos relevantes dessas iniciativas.
De forma geral, 43% das empresas indicaram que “obtém
pequenos benefícios tangíveis das informações”, enquanto
23% afirmam que não colhem benefício algum.
A estratégia em torno da utilização dos dados é o
principal recurso para uma organização obter vantagem
competitiva nos mercados onde atua.
Desafios arquiteturais
Arquitetura Lambda
Arquitetura para processamento de dados
genérica, escalável e tolerante à falhas.
Toda informação que entra no sistema é
despachada para ambas camadas batch e
online.
Camada batch: armazena toda a informação
(imutável) e pré computa visões para a camada
de servidão.
Camada online: compensa a alta latência de
atualizações, tratando apenas de informações
recentes.
Desafios de implementação
Os desafios continuam...
Inúmeras iniciativas para o
desenvolvimento de novas soluções.
Projetos open source ainda conduzem
o desenvolvimento de big data.
Empresas que vendem soluções de big
data ainda proveem suporte e
funcionalidades proprietárias.
Open source ou solução proprietária?
Segurança
Segurança de informação
Falhas de segurança são extremamente prejudiciais para o
negócio.
Segurança em big data não é fundamentalmente diferente
de segurança para sistemas tradicionais.
Os desafios surgem devido à:
1. Complexidade do ambiente;
2. Diferentes fontes de informação (coletada, agregada e
analisada);
3. Tecnologias aplicadas para sustentar a solução.
Nenhuma corrente é mais forte que seu elo mais fraco.
Obrigado!

Mais conteúdo relacionado

Mais procurados

A20 paper - perfil business intelligence - big data e fast data
A20   paper - perfil business intelligence - big data e fast dataA20   paper - perfil business intelligence - big data e fast data
A20 paper - perfil business intelligence - big data e fast dataBIBrasil
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
Gestão Ágil de Dados com Enterprise Data Fabric
Gestão Ágil de Dados com Enterprise Data FabricGestão Ágil de Dados com Enterprise Data Fabric
Gestão Ágil de Dados com Enterprise Data FabricDenodo
 
Hadoop Day - MeetUp - O poder da Informação
Hadoop Day - MeetUp - O poder da InformaçãoHadoop Day - MeetUp - O poder da Informação
Hadoop Day - MeetUp - O poder da InformaçãoThiago Santiago
 
BIG DATA
BIG DATA BIG DATA
BIG DATA ABEP123
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para LeigosPedro Neto
 
Inteligência Artificial, Internet das Coisas e Inovação.
Inteligência Artificial,  Internet das Coisas e Inovação. Inteligência Artificial,  Internet das Coisas e Inovação.
Inteligência Artificial, Internet das Coisas e Inovação. Fernando Novais da Silva
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
 
Governança de Dados e Big Data
Governança de Dados e Big DataGovernança de Dados e Big Data
Governança de Dados e Big DataCarlos Barbieri
 
5 motivos para adotar o Event-Driven com Kafka
5 motivos para adotar o Event-Driven com Kafka5 motivos para adotar o Event-Driven com Kafka
5 motivos para adotar o Event-Driven com KafkaTechrom Tecnologia
 
Big data = Oportunidades
Big data = OportunidadesBig data = Oportunidades
Big data = OportunidadesGustavo Santade
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
ROI e Valor Econômico da Virtualização de Dados
ROI e Valor Econômico da Virtualização de DadosROI e Valor Econômico da Virtualização de Dados
ROI e Valor Econômico da Virtualização de DadosDenodo
 

Mais procurados (20)

A20 paper - perfil business intelligence - big data e fast data
A20   paper - perfil business intelligence - big data e fast dataA20   paper - perfil business intelligence - big data e fast data
A20 paper - perfil business intelligence - big data e fast data
 
BIG data
BIG dataBIG data
BIG data
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
Gestão Ágil de Dados com Enterprise Data Fabric
Gestão Ágil de Dados com Enterprise Data FabricGestão Ágil de Dados com Enterprise Data Fabric
Gestão Ágil de Dados com Enterprise Data Fabric
 
O que é Data Science?
O que é Data Science?O que é Data Science?
O que é Data Science?
 
Inteligencia competitiva
Inteligencia competitivaInteligencia competitiva
Inteligencia competitiva
 
BigData
BigDataBigData
BigData
 
Hadoop Day - MeetUp - O poder da Informação
Hadoop Day - MeetUp - O poder da InformaçãoHadoop Day - MeetUp - O poder da Informação
Hadoop Day - MeetUp - O poder da Informação
 
BIG DATA
BIG DATA BIG DATA
BIG DATA
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para Leigos
 
Inteligência Artificial, Internet das Coisas e Inovação.
Inteligência Artificial,  Internet das Coisas e Inovação. Inteligência Artificial,  Internet das Coisas e Inovação.
Inteligência Artificial, Internet das Coisas e Inovação.
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 
Governança de Dados e Big Data
Governança de Dados e Big DataGovernança de Dados e Big Data
Governança de Dados e Big Data
 
5 motivos para adotar o Event-Driven com Kafka
5 motivos para adotar o Event-Driven com Kafka5 motivos para adotar o Event-Driven com Kafka
5 motivos para adotar o Event-Driven com Kafka
 
Big data = Oportunidades
Big data = OportunidadesBig data = Oportunidades
Big data = Oportunidades
 
Data is the new oil
Data is the new oilData is the new oil
Data is the new oil
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
ROI e Valor Econômico da Virtualização de Dados
ROI e Valor Econômico da Virtualização de DadosROI e Valor Econômico da Virtualização de Dados
ROI e Valor Econômico da Virtualização de Dados
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Hadoop, Big Data e Cloud Computing
Hadoop, Big Data e Cloud ComputingHadoop, Big Data e Cloud Computing
Hadoop, Big Data e Cloud Computing
 

Destaque

Hackathon Natura Campus Media Lab - Veja como funciona e participe!
Hackathon Natura Campus Media Lab - Veja como funciona e participe!Hackathon Natura Campus Media Lab - Veja como funciona e participe!
Hackathon Natura Campus Media Lab - Veja como funciona e participe!naturacampus
 
Tem uma idéia de um projeto? Desenvolva em 1 final de semana num hackathon!
Tem uma idéia de um projeto? Desenvolva em 1 final de semana num hackathon!Tem uma idéia de um projeto? Desenvolva em 1 final de semana num hackathon!
Tem uma idéia de um projeto? Desenvolva em 1 final de semana num hackathon!Cayo Medeiros
 
Hackathon fiap condução dos dias 08 e 09 de abril - v.1 - 08042016
Hackathon fiap   condução dos dias 08 e 09 de abril - v.1 - 08042016Hackathon fiap   condução dos dias 08 e 09 de abril - v.1 - 08042016
Hackathon fiap condução dos dias 08 e 09 de abril - v.1 - 08042016Guilherme Estevão
 
Hacker cidadão - divulgação
Hacker cidadão - divulgaçãoHacker cidadão - divulgação
Hacker cidadão - divulgaçãoKiev Gama
 
A experiência da elaboração do 1º Hackathon do Governo de Minas - Encontro Na...
A experiência da elaboração do 1º Hackathon do Governo de Minas - Encontro Na...A experiência da elaboração do 1º Hackathon do Governo de Minas - Encontro Na...
A experiência da elaboração do 1º Hackathon do Governo de Minas - Encontro Na...Raquel Camargo
 
Certificado de participação no Hackathon Globo 2016 - Cesar A. Nogueira
Certificado de participação no Hackathon Globo 2016 - Cesar A. NogueiraCertificado de participação no Hackathon Globo 2016 - Cesar A. Nogueira
Certificado de participação no Hackathon Globo 2016 - Cesar A. NogueiraCesar Augusto Nogueira
 

Destaque (7)

Hackathon Natura Campus Media Lab - Veja como funciona e participe!
Hackathon Natura Campus Media Lab - Veja como funciona e participe!Hackathon Natura Campus Media Lab - Veja como funciona e participe!
Hackathon Natura Campus Media Lab - Veja como funciona e participe!
 
Tem uma idéia de um projeto? Desenvolva em 1 final de semana num hackathon!
Tem uma idéia de um projeto? Desenvolva em 1 final de semana num hackathon!Tem uma idéia de um projeto? Desenvolva em 1 final de semana num hackathon!
Tem uma idéia de um projeto? Desenvolva em 1 final de semana num hackathon!
 
Hackathon fiap condução dos dias 08 e 09 de abril - v.1 - 08042016
Hackathon fiap   condução dos dias 08 e 09 de abril - v.1 - 08042016Hackathon fiap   condução dos dias 08 e 09 de abril - v.1 - 08042016
Hackathon fiap condução dos dias 08 e 09 de abril - v.1 - 08042016
 
Hacker cidadão - divulgação
Hacker cidadão - divulgaçãoHacker cidadão - divulgação
Hacker cidadão - divulgação
 
A experiência da elaboração do 1º Hackathon do Governo de Minas - Encontro Na...
A experiência da elaboração do 1º Hackathon do Governo de Minas - Encontro Na...A experiência da elaboração do 1º Hackathon do Governo de Minas - Encontro Na...
A experiência da elaboração do 1º Hackathon do Governo de Minas - Encontro Na...
 
Certificado de participação no Hackathon Globo 2016 - Cesar A. Nogueira
Certificado de participação no Hackathon Globo 2016 - Cesar A. NogueiraCertificado de participação no Hackathon Globo 2016 - Cesar A. Nogueira
Certificado de participação no Hackathon Globo 2016 - Cesar A. Nogueira
 
Check list hackathon - Agencia Inventtando
Check list hackathon - Agencia InventtandoCheck list hackathon - Agencia Inventtando
Check list hackathon - Agencia Inventtando
 

Semelhante a Hackathon Inmetrics e Fiap: Desafios do Big Data

Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesGabriel Prado
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
A20 paper - perfil business intelligence - big data e fast data
A20   paper - perfil business intelligence - big data e fast dataA20   paper - perfil business intelligence - big data e fast data
A20 paper - perfil business intelligence - big data e fast dataMarcelo Krug
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Wiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & AnalyticsWiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & AnalyticsLeonardo Couto
 
Seminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
Seminário Big Data, 19/05/2014 - Apresentação Afonso CoelhoSeminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
Seminário Big Data, 19/05/2014 - Apresentação Afonso CoelhoFecomercioSP
 
Wiseminer data intelligence 2015 01
Wiseminer data intelligence 2015 01Wiseminer data intelligence 2015 01
Wiseminer data intelligence 2015 01Leonardo Couto
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosFrancisco Oliveira
 
Cultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócioCultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócioMJV Technology & Innovation Brasil
 
Transforme Dados em Vantagem Competitiva
Transforme Dados em Vantagem CompetitivaTransforme Dados em Vantagem Competitiva
Transforme Dados em Vantagem CompetitivaLeonardo Couto
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Denodo
 
Impact of-9-cloud it-consumption-models-top-10_pt-br
Impact of-9-cloud it-consumption-models-top-10_pt-brImpact of-9-cloud it-consumption-models-top-10_pt-br
Impact of-9-cloud it-consumption-models-top-10_pt-brCisco do Brasil
 
Data Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaData Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaDenodo
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small dataRoberto Oliveira
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTIBruna Pereira
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxdataRain
 

Semelhante a Hackathon Inmetrics e Fiap: Desafios do Big Data (20)

Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e Oportunidades
 
Data mesh-pt
Data mesh-ptData mesh-pt
Data mesh-pt
 
Big Data
Big DataBig Data
Big Data
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
A20 paper - perfil business intelligence - big data e fast data
A20   paper - perfil business intelligence - big data e fast dataA20   paper - perfil business intelligence - big data e fast data
A20 paper - perfil business intelligence - big data e fast data
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Wiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & AnalyticsWiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & Analytics
 
Seminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
Seminário Big Data, 19/05/2014 - Apresentação Afonso CoelhoSeminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
Seminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
 
Wiseminer data intelligence 2015 01
Wiseminer data intelligence 2015 01Wiseminer data intelligence 2015 01
Wiseminer data intelligence 2015 01
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Cultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócioCultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócio
 
Artigo big data_final
Artigo big data_finalArtigo big data_final
Artigo big data_final
 
Transforme Dados em Vantagem Competitiva
Transforme Dados em Vantagem CompetitivaTransforme Dados em Vantagem Competitiva
Transforme Dados em Vantagem Competitiva
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
Impact of-9-cloud it-consumption-models-top-10_pt-br
Impact of-9-cloud it-consumption-models-top-10_pt-brImpact of-9-cloud it-consumption-models-top-10_pt-br
Impact of-9-cloud it-consumption-models-top-10_pt-br
 
Data Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaData Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudança
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small data
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
 

Hackathon Inmetrics e Fiap: Desafios do Big Data

  • 1. Desafios do Big Data Renato Ochando
  • 2. 1º Hackathon Inmetrics em parceria com a FIAP
  • 3. Big Data O que é? Teve inicio no fim dos anos 90, com as empresas de internet tentando gerenciar volumes de informação sem precedentes. Big Data é um termo que descreve sistemas com alto: • Volume de informação • Velocidade na ingestão de informação • Variedade de dados Demanda formas inovadoras de processar informação, a um custo efetivo, que possibilitem visão profunda, tomada de decisão e automação de processos. “Big data não trata de petabytes, mas de computação complexa.”
  • 4. Big Data O que é? Se você é um desenvolvedor, até agora tudo bem com os “três V” do Big Data – código de aplicação cuida de volume, velocidade e variedade. ... Mas se você é um cientista de dados, nada disso cuida do significado da informação. Então, são necessários mais “dois V”, talvez: • Veracidade da informação • Valor que a informação agrega ao negócio Em 2015, 85% das organizações na lista das 500 da Fortune não serão capazes de explorar Big Data para vantagem competitiva.
  • 5. Volume O Volume está sempre crescendo Possuir mais informação significa possuir melhores modelos. Grandes volumes de informação são, de imediato, o maior desafio para as estruturas convencionais de TI, o que demanda por armazenamento altamente escalável e consultas distribuídas. As tecnologias mais utilizadas para armazenamento e processamento de informações são Hadoop e MapReduce. Constantemente o volume de informação criada excede o limite da capacidade do seu storage (abordagem seletiva).
  • 6. Velocidade Processamento em tempo real A primeira geração de soluções para big data eram focadas principalmente na captura e análise de informações batch. Fast data se concentra em reduzir o intervalo de tempo entre dados que chegam e o valor a ser extraído desses dados. Equilibra vários tradeoffs para entregar: 1. Confiabilidade na ingestão de dados; 2. Flexibilidade no armazenamento e consultas; 3. Ferramentas sofisticadas para analytics. Big data foi ontem. Fast data é agora.
  • 7. Variedade Estrutura da informação Soluções de Big Data irão armazenar informações estruturadas, semiestruturadas, e não estruturadas. Por exemplo documentos de texto, multimídia, etc. Modelar e preparar informações de diferentes fontes de sistemas para obter “visões” tem sido, por décadas, um trabalho demorado e tedioso. A maioria das organizações passam de 70% à 80% do tempo modelando, em vez de interagir com com a informação para produzir visões de negócio. “Variedade, e não volume, será o maior desafio de Big Data em 2015.”
  • 8. Veracidade In Data We Trust Refere-se à vieses, ruído e anormalidade nos dados. A correção da informação e eliminação de ruídos deve ser feita, de preferência, na fonte de coleta. Assim que os usuários começam a explorar as informações, eles se tornam verdadeiramente engajados e mais dispostos a investir em esforços para “limpar” os dados. Veracidade não é apenas sobre a qualidade dos dados, mas também sobre a compreensão dos dados.
  • 9. Valor Desafio de agregar valor Lacuna entre habilidade e tecnologia para usar a informação. Enquanto 75% dos líderes de negócio acreditam que estão extraindo máximo de seus dados. Na realidade, apenas 4%, de fato, tem colhido frutos relevantes dessas iniciativas. De forma geral, 43% das empresas indicaram que “obtém pequenos benefícios tangíveis das informações”, enquanto 23% afirmam que não colhem benefício algum. A estratégia em torno da utilização dos dados é o principal recurso para uma organização obter vantagem competitiva nos mercados onde atua.
  • 10. Desafios arquiteturais Arquitetura Lambda Arquitetura para processamento de dados genérica, escalável e tolerante à falhas. Toda informação que entra no sistema é despachada para ambas camadas batch e online. Camada batch: armazena toda a informação (imutável) e pré computa visões para a camada de servidão. Camada online: compensa a alta latência de atualizações, tratando apenas de informações recentes.
  • 11. Desafios de implementação Os desafios continuam... Inúmeras iniciativas para o desenvolvimento de novas soluções. Projetos open source ainda conduzem o desenvolvimento de big data. Empresas que vendem soluções de big data ainda proveem suporte e funcionalidades proprietárias. Open source ou solução proprietária?
  • 12. Segurança Segurança de informação Falhas de segurança são extremamente prejudiciais para o negócio. Segurança em big data não é fundamentalmente diferente de segurança para sistemas tradicionais. Os desafios surgem devido à: 1. Complexidade do ambiente; 2. Diferentes fontes de informação (coletada, agregada e analisada); 3. Tecnologias aplicadas para sustentar a solução. Nenhuma corrente é mais forte que seu elo mais fraco.

Notas do Editor

  1. BigData é somente acima de 500 terabytes.
  2. “Analistas fazem hype; Desenvolvedores fazem software.” “O quão grande é o BigData” é uma pergunta clichê mas ajuda a colocar desenvolvedores, analistas e usuários na mesma página. Viscosidade: Termo usado para descrever a latência ou lag dos dados em relação aos eventos sendo descritos. Viralidade: Definido por alguns utilizadores, como a velocidade à qual se espalha os dados; quantas vezes ele é pego e repetido por outros usuários ou eventos.
  3. Map Reduce tem mais de 10 anos. A Google o aposentou em 2014. LHC produz 15 PB por segundo e armazena apenas 35 PB por ano. Yahoo possui o maior cluster hadoop com 500 PB em 40.000 servidores. Volatilidade: Por quanto tempo a informação é valida.
  4. Desafios de volume e performance. Tecnologias mais quentes são Kafka, Spark e Cassandra.
  5. Tem a ver com ingestão de informação. É um problema cada vez mais caro e difícil de combater. Existe um trabalho futuro muito forte em automação para este cenário. Não confundir com o conceito de variabilidade, que está ligado ao fluxo de informações altamente inconsistentes, com picos periódicos.
  6. Vieses = análises tendenciosas. Ex.: Importação de limão mexicano reduz acidentes mortais nos EUA. Quando não consegue compreender não extrai valor.
  7. A imagem saiu na capa do The Economist, The Data Deluge (o dilúvio de informação).
  8. O Incremento de componentes faz surgir o desafio.