Aprendizagem de máquina, Internet, Tecnologia de informação, Telecomunicações

Big Data: O que é e para que serve?

Big Data é um termo que descreve uma quantidade gigantesca de dados, os quais softwares tradicionais não conseguem processar e gerenciar.

De onde vêm tanta informação?

A internet e as redes sociais produzem uma quantidade cada vez maior de dados em forma de imagens, vídeos, comentários, mensagens, curtidas, etc. O simples fato de navegar na internet já produz dados. A Internet das Coisas vai aumentar ainda mais a quantidade de informações. 

Categorias de dados no Big Data

Estruturados

Dados padronizados e organizados em tabelas, listas ou outra estrutura rígida. São números ou textos de fácil intepretação.

Não estruturados

Compõem a maioria dos dados do Big Data. Não possuem uma estrutura definida e não são relacionados entre si. São postagens em redes sociais, vídeos, arquivos de som, geolocalização e documentos. 

Semiestruturados

Esta classe de dados é intermediária entre as duas anteriores. Possuem uma organização heterogênea, estrutura irregular embutida no dado. Alguns exemplos são: Emails, arquivos BibTex, XML e JSON.  

Os Vs do Big Data

Os Vs são os parâmetros da informação no Big Data. No começo deste século, foram considerados apenas os três primeiros Vs. Com o passar do tempo, foram incluídos os dois últimos.

  • Volume: A quantidade de informação.
  • Velocidade: A velocidade de processamento e interpretação.
  • Variedade: Os tipos de dados.
  • Veracidade: A autenticidade e quando foi coletada, geralmente dados relacionados a acontecimentos passados têm pouca importância.
  • Valor: A utilidade e a importância da informação.

Big Data Analytics

É o processo de extrair, armazenar e analisar os dados. Descobrindo padrões ocultos e relações entre as informações.

supercomputador para o Big Data
O Big Data só pode ser armazenado e processado por supercomputadores. Pois apenas estes possuem capacidade e velocidade para lidar com dados que crescem rapidamente. Fonte: Helmholtz.

Dados são coletados de várias fontes, os não estruturados são depositados em data lakes, em um formato bruto, sem processamento. O Big Data Analytics pode encontrar padrões, descrever a situação atual, fazer diagnósticos, prever cenários futuros e oferecer soluções com base na grande quantidade de informações. Existem várias plataformas de Big Data que fornecem soluções usando as ferramentas apropriadas.

Algumas aplicações

  • Com a análise dos dados, as empresas conseguem entender melhor o perfil dos clientes para melhorar o marketing e o atendimento, desenvolver produtos e serviços melhores. Além de oferecer recomendações com base no histórico do cliente. 
  • Informações estruturadas (ano, marca e modelo de um equipamento) e não estruturadas (leitura dos sensores, temperatura), permitem alertar sobre possíveis falhas, para realizar manutenções preventivas.
  • Aprendizado de máquina: A enorme quantidade de dados permite um melhor treinamento das redes neurais, para trazer resultados mais precisos e rápidos.
  • A análise dos dados pode detectar padrões que indiquem fraude.  

About Pedro Ney Stroski

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *