Introdução
Produzir informações está ligado diretamente ao ser humano. Desde os primeiros moradores da Terra até os dias atuais, produzimos e tentamos guardar estas informações. Isso se confirma, por exemplo, quando vemos figuras rupestres em cavernas ou escritas em paredes de pedras encravadas nas pirâmides egípcias, ou algo mais recente: quando tiramos fotos e salvamos em nosso celular. Ambos os exemplos são dados diferentes e de momentos históricos diferentes e que mesmo assim não deixam de ser dados.
Mas, você já parou para pensar na quantidade de informações que o ser humano produz durante o dia? Ou, na quantidade de dados de clientes que um banco possui? Ou ainda, na quantidade de informações que o Facebook recebe a cada minuto?
Definição
Por mais que o ato de recolher e armazenar dados seja uma prática antiga, o termo Big Data é um termo novo, usado pela primeira vez no início dos anos 2000, pelo analista Doug Laney, para nomear um imenso conjunto de dados e caracteriza-los em três V’s.
Volume: Como o nome sugere, é referente a quantidade de dados que são produzidos exponencialmente. Algumas empresas pegam dados de diferentes fontes, por isso armazenar todo esses dados seriam um problema, mas já há softwares que permitem isso.
Velocidade: Se antes a informação nova era aquela que chegava junto com o jornal impresso pela manhã, ou que passava a noite no Jornal Nacional, ou seja, que levava horas para sabermos, hoje já não é bem assim.
Temos informações sendo produzidas a todo momento, em frações de segundo. O que um post no Twitter pode mobilizar e produzir repercussão, alguém pode fazer outro post e ter uma maior repercussão que o primeiro.
Variedade: Os dados são gerados em diversos tipos de formatos: vídeos, imagens, textos, planilhas, áudios, etc.
Há ainda quem acrescente outros V’s na caracterização do Big data, como por exemplo, a Veracidade dos dados.
Veracidade: abrange com característica o fato que estes dados não apresentam uma verdade absoluta, ou seja, certa incerteza onde deve-se observá-los com muita parcimônia para que os mesmos possam gerar informações úteis e oportunas.
Tecnologias
Devido a grande quantidade de dados precisamos de tecnologias para organizá-los, ordená-los e torná-los acessível a nós seres humanos. Como por exemplo: Excel, Hadoop,Bloco de notas, Oracle, Mysql, SQLserver2012.
Além disso, muitas empresas costumam a usar os dados que tem, mas que são do cliente, para fins comerciais, por exemplo:
- Se eu assisto uma série de suspense na Netflix, ela vai e indicar séries e filmes com a mesma temática.
- Se eu tenho um perfil de amigos no Facebook, com o cruzamento de dados dos meus amigos, ele vai indicar outros amigos que tenham o mesmo perfil dos amigos que eu já tenho, ou ainda: indicar um usuário para eu adicionar que tenha vários amigos em comum comigo.
- Além de servir como apoio a tomada de decisões, pois a partir de dados que uma empresa possui, ela pode analisar, por exemplo, se vale a pena desenvolver determinada campanha, a partir do perfil do cliente dela.
Tudo, exatamente tudo o que fazemos na internet se transformam em dados, desde o primeiro clique na aba aberta até o post que fazemos no Facebook, desde o site de notícias que abrimos até a foto que publicamos no Instagram, desde a entrada no site de uma agência de viagens até os vídeos que assistimos ou publicamos no Youtube. E, tudo isso é usado contra ou a nosso favor. Esse exemplos
Fontes
sites: