Tecnologias de Big Data #1
Apesar de ser considerado um conceito recente, Big Data é uma área bastante ampla, assim como as tecnologias envolvidas no seu seu funcionamento, que combinadas, otimizam bastante sua eficiência e amplia suas aplicações. A seguir, veremos algumas dessas tecnologias e qual suas utilidades à Big Data.
Processamento Paralelo: É uma tecnologia essencial para a análise dos dados obtidos pelo Big Data.
Consiste em uma forma mais eficiente de trabalhar informações, com ênfase na exploração de eventos simultâneos na execução de um programa. De forma simplificada, é o uso simultâneo de várias unidades de processamento (CPUs) para realizar trabalhos computacionais. Ajuda no aumento da velocidade e poder de processamento de uma máquina.
Sistema de arquivos distribuídos: É um sistema que permite que os programas armazenem e acessem arquivos remotos exatamente como se fossem locais. É bastante proveitoso, pois é possível que vários processos compartilhem dados de modo seguro e confiável durante longos períodos, desde que o acesso seja feito em uma máquina na mesma rede. O desempenho e a segurança no acesso aos arquivos armazenados em um servidor deve ser comparáveis aos arquivos em discos locais.
Esse sistema possue alguns requisitos, tais como: transparência de acesso, localização, concorrência, falha e desempenho.
Computação em nuvem: É a capacidade de acessar arquivos e executar diferentes tarefas pela internet. O armazenamento de dados é feito em serviços online, em uma rede. Para realizarmos alguma tarefa, é necessário se conectarmos ao serviço online, usar suas ferramentas, salvar e então utilizar em qualquer outro lugar.
Com a computação em nuvem, os seus dados não estão salvos em um disco rígido do seu computador, mas sim disponível na web, o que é bastante vantajoso em Big Data, uma vez que é possível utilizar essas dados. O necessário para computação em nuvem apenas é um computador conectado à internet.
Mineração de dados: é o processo de encontrar anomalias, padrões e correlações em grandes conjuntos de dados para prever resultados.
Através de várias técnicas, é possível usar essas informações para várias coisas, como: diminuir custos, aumentar a renda, ajudar em relações com clientes, reduzir riscos e muito mais.
Usualmente, é dividida em três tipos de modelagem:
Modelagem descritiva - revela semelhanças compartilhadas ou agrupamentos em dados históricos para determinar as razões por trás do sucesso ou do fracasso.
Modelagem preditiva - vai mais fundo na hora de classificar eventos futuros ou estimar resultados desconhecidos.
Modelagem prescritiva - com o aumento e diversificação de dados na web, se faz necessário analisar, filtrar e transformar dados não-estruturados de uma maneira que auxilie na precisão das previsões.
Processamento Paralelo: É uma tecnologia essencial para a análise dos dados obtidos pelo Big Data.
Consiste em uma forma mais eficiente de trabalhar informações, com ênfase na exploração de eventos simultâneos na execução de um programa. De forma simplificada, é o uso simultâneo de várias unidades de processamento (CPUs) para realizar trabalhos computacionais. Ajuda no aumento da velocidade e poder de processamento de uma máquina.
Sistema de arquivos distribuídos: É um sistema que permite que os programas armazenem e acessem arquivos remotos exatamente como se fossem locais. É bastante proveitoso, pois é possível que vários processos compartilhem dados de modo seguro e confiável durante longos períodos, desde que o acesso seja feito em uma máquina na mesma rede. O desempenho e a segurança no acesso aos arquivos armazenados em um servidor deve ser comparáveis aos arquivos em discos locais.
Esse sistema possue alguns requisitos, tais como: transparência de acesso, localização, concorrência, falha e desempenho.
Computação em nuvem: É a capacidade de acessar arquivos e executar diferentes tarefas pela internet. O armazenamento de dados é feito em serviços online, em uma rede. Para realizarmos alguma tarefa, é necessário se conectarmos ao serviço online, usar suas ferramentas, salvar e então utilizar em qualquer outro lugar.
Com a computação em nuvem, os seus dados não estão salvos em um disco rígido do seu computador, mas sim disponível na web, o que é bastante vantajoso em Big Data, uma vez que é possível utilizar essas dados. O necessário para computação em nuvem apenas é um computador conectado à internet.
Mineração de dados: é o processo de encontrar anomalias, padrões e correlações em grandes conjuntos de dados para prever resultados.
Através de várias técnicas, é possível usar essas informações para várias coisas, como: diminuir custos, aumentar a renda, ajudar em relações com clientes, reduzir riscos e muito mais.
Usualmente, é dividida em três tipos de modelagem:
Modelagem descritiva - revela semelhanças compartilhadas ou agrupamentos em dados históricos para determinar as razões por trás do sucesso ou do fracasso.
Modelagem preditiva - vai mais fundo na hora de classificar eventos futuros ou estimar resultados desconhecidos.
Modelagem prescritiva - com o aumento e diversificação de dados na web, se faz necessário analisar, filtrar e transformar dados não-estruturados de uma maneira que auxilie na precisão das previsões.
Referências:
https://transformacaodigital.com/conceitos-de-big-data-o-que-e-processamento-paralelo/
https://www.google.com/amp/s/www.estudopratico.com.br/o-que-e-computacao-em-nuvem/amp/
https://www.sas.com/pt_br/insights/analytics/mineracao-de-dados.html#dmtechnical
Comentários
Postar um comentário