Cientista de dados é a profissão do futuro

Estamos iniciando um ciclo tecnológico com ampla capacidade de processamento, armazenamento de dados e comunicação que permite análises avançadas de gigantescos volumes de dados. Isso muda os atuais paradigmas da computação.

Nesse cenário, é possível considerar não apenas os 15% dos dados estruturados das empresas, mas todos aqueles disponíveis em e-mails, planilhas, textos, figuras, vídeos, áudio, dados públicos e das redes sociais. Associando as tecnologias de Big Data, Internet das Coisas e ferramentas avançadas, teremos tomadas de decisão mais acertadas. Entretanto, para isso funcionar, precisamos do elemento mais importante: o cientista de dados.

A tecnologia exigida para as redes sociais está mudando o paradigma da computação. O Twitter deve gerar diariamente 35 Zettabytes (ZB) em 2020, mais do que os 7 ZB por dia, atualmente. Um Zettabyte equivale a 1021 bytes, enquanto um Gigabyte equivale a 109 bytes. Os impactos desse fenômeno implicam na mudança da arquitetura de servidores, na forma de armazenamento de dados e na seleção da linguagem de programação. Por exemplo: o Twitter obteve 10 vezes mais velocidade de processamento com o JMV do que com o Ruby.

Na área de energia, as aplicações vão desde a seleção do local para a instalação de uma planta de geração até o combate a fraudes. Por exemplo, a seleção do local para a instalação de uma planta de energia eólica deve ser determinada por múltiplos fatores, como temperatura, precipitação de chuvas, velocidade do vento, umidade, pressão atmosférica e muitos outros. A correta tomada de decisão reduz os riscos dos investimentos multimilionários.

Na área de saúde, as aplicações são imensas. Correlacionar grandes volumes de dados de variadas fontes ajudará a detectar a causa-raiz de doenças e impedir o surgimento de epidemias de impacto significativo nas populações. Sobretudo, ajudará a prevenir doenças e melhorar os diagnósticos clínicos.

Um cientista de dados deve reunir várias habilidades, como ter fortes conhecimentos estatísticos e matemáticos, fazer modelagem preditiva, conhecer estratégias de negócios para construir algoritmos necessários para fazer as perguntas certas e ter as respostas certas. Eles devem ser capazes de traduzir as conclusões em uma linguagem de negócios de forma escrita, oral e visual. Eles precisam entender como os produtos são desenvolvidos, como projetar arquiteturas de computadores e conhecer linguagens de programação orientadas a Big Data. Além disso, devem garantir a privacidades dos consumidores e responsabilidade ética.

Grandes cientistas de dados podem ter diferentes origens, como engenharia, ciência da computação, bioestatística, econometria, física e matemática aplicada. Mestrado e doutorado serão altamente recomendados para a formação dos cientistas de dados.

Como dá para perceber, teremos poucos grandes cientistas de dados. Aqui se colocam desafios tanto para os profissionais quanto para as empresas: o profissional deve se empenhar na formação e as empresas, na seleção e investimentos para aperfeiçoar as habilidades dos cientistas de dados.

Fonte: http://olhardigital.uol.com.br/