Big Data:Tipos de Dados

O Big Data processa uma enorme quantidade de dados em tempo real, esses dados vem em todos os formatos de emails, arquivos XML até arquivos de áudio e texto. Esses dados são divididos em três tipos, Dados Estruturados, Dados Semi Estruturados e Dados Não Estruturados.

Os três tipos de dados possuem características diferentes, tornando mais fácil ou mais difícil o trabalho do algoritmo do Big Data.






Dados Estruturados: São organizados, de formato estrito e definido tornando fácil a recuperação da informação contida nos dados. Dados contidos em banco de dados são exemplos de dados estruturados.

Dados Semi Estruturados: Possuem uma certa estrutura, porém não seguem a estrutura formal de banco de dados relacionais, sua estrutura é heterogênea, o que requere uma análise prévia dos dados para identificar ou extrair sua informação. Arquivos XML são exemplos de dados semi estruturados.

Dados Não Estruturados: Não possuem estrutura alguma, são de difícil recuperação e precisam de um pré-processamento para extrair informação. Arquivos de texto, áudio e vídeo são exemplos de dados não estruturados.

Referências:

https://danielcavalcanti.com.br/home/dados-estruturados-e-semiestruturados/

Comentários

  1. Dados estruturados são homogêneos? E, em relação à estrutura, tem haver com serem do mesmo tipo ou de tipos diferentes? E são imutáveis, como as tuplas em haskell?

    ResponderExcluir
    Respostas
    1. Sim, eles são homogêneos. Quanto a estrutura, eles são posicionados em linhas e colunas, parecido com uma planilha do Excel, podendo assim ser vista e compreendida "a olho nu". Elas não são imutáveis, você pode edita-lós, porém ele possui limites de quantos dados você pode armazenar em um local. Por exemplo, um cadastro de e-mail, você coloca o nome, e-mail, senha e etc cada um espaço diferente e possui limitações como tamanho, tipos de caracteres que podem ser usados.

      Excluir

Postar um comentário

Postagens mais visitadas deste blog

Algoritmos #03 - Formas de representar um algoritmo

Estrutura de Dados #2 - Listas Encadeadas e Árvores.

Algoritmos #02 - Ada Lovelace e o primeiro algoritmo