Os grandes desafios do Big Data
13 Junho 2013 · Flávio Codeço Coelho
O fenômeno do Big Data na Ciência pré-data, de certa forma, o conceito atual de Big Data - muito atrelado à montanha de dados gerada continuamente em serviços de internet, como redes sociais e sítios de proteção de conteúdo, por exemplo, Youtube e Flickr. Disciplinas como física de partículas, meteorologia e astronomia, já lidam com grandes volumes de dados há décadas.
O artigo “Biology: The big challenges of Big Data”, de Vivien Marx, publicado pela Nature, mostra que com o avanço e barateamento da tecnologia de sequenciamento genômico, a biologia adentra a seara do Big Data Científico, com grandes laboratórios de Biologia Molecular, como o EMBL (Laboratório Europeu de Biologia Molecular), mantendo acervos de dados com dezenas de petabytes que dobram de tamanho a cada ano – e isto é apenas um décimo do volume de dados armazenado no Centro Europeu de Pesquisa Nuclear (CERN), que opera o LHC, o maior acelerador de partículas do mundo.
A publicação aponta que um dos mais importantes gargalos atuais da ciência do Big Data é a movimentação destes dados. Devido ao seu volume, eles ultrapassam a capacidade analítica de um único laboratório, precisando ser compartilhado com parceiros de outras instituições ao redor do globo. Tamanho fluxo de informações desafia a arquitetura atual da internet, que ainda não é capaz de transmitir um alto volume de informação eficientemente. Como qualquer desafio, a necessidade de dar mobilidade a estes dados converteu-se em grande oportunidade para empresas de tecnologia que estão desenvolvendo desde novos protocolos de comunicação até ambientes integrados na nuvem para análise colaborativa de dados.
Para ler o artigo “Biology: The big challenges of Big Data”, acesse aqui.