Thinkstock
Cientista de dados: profissional completo é raríssimo
São Paulo – Chamada de a mais sexy deste século pela Harvard Business Review, a profissão cientista de dados segue tão quente quanto rara no Brasil.
Quente porque a demanda continua em expansão mesmo com o mercado de
trabalho brasileiro em retração. “Crise? Que crise” dirá, provavelmente,
um cientista de dados qualificado.
Publicidade
Raro porque não é tão fácil assim encontrar profissionais que atendam à
tríade exigida pela profissão: conhecimentos de programação,
estatística/matemática e visão de negócios.
“É uma carreira nova no Brasil, e estamos percebendo um aumento
exponencial na demanda por profissionais. Em contrapartida, ainda não
temos muitas pessoas sendo formadas nessa área”, diz Henrique Gamba,
diretor geral da Yoctoo, recrutamento especializado em TI.
Segundo ele, a crise não fez cair os salários para estes profissionais: a
partir de 9 mil reais para quem tem entre 3 e 4 anos de experiência e
até 22 mil para um especialista na área. “É que a geração, captação e
armazenamento de dados, em volume cada vez maior (big data), é a chave
para o direcionamento e estratégia de qualquer negócio”, diz Gamba.
As empresas que mais contratam cientistas de dados são as fornecedoras
de soluções de tecnologia (de big bata) e aquelas que trabalham
intensivamente com dados como instituições financeiras, institutos de
pesquisa, internet, e-commerce, bureaus de crédito, etc.
As diferentes fases do trabalho de um cientista de dados
“O coração da atividade de um cientista de dados é analisar uma massa de
informações para fazer inferências”, diz Lucas de Paula da Neoway,
empresa que oferece soluções de inteligência de negócios.
O dado é a matéria bruta do cientista. Mas seu primeiro desafio é pensar
na pergunta certa a ser feita para chegar na resposta que o negócio
precisa responder.
A partir desta questão é que começa o trabalho de captar e preparar os
dados. Com o terreno preparado, é hora de aplicar fórmulas matemáticas.
Para isto, modelos estatísticos são elaborados e hipóteses criadas e
testadas.
“Ele usa a matéria prima (dados) para tirar insights, gerar estas
hipóteses que serão postas à prova com trabalho estatístico e
matemático”, diz Lucas. A validação científica destas inferências é o
que trará, de fato, a resposta de valor para os negócios. O próximo
passo é apresentar as conclusões para clientes externos e internos.
“Saber comunicar é igualmente importante. Muitas vezes é preciso
convencer o cliente de que o modelo é exato”, diz ele.
A análise dos dados e suas conclusões é como combinar as notas tocando
piano e produzir uma música, compara Lucas. Mas para tocar este piano, é
preciso antes carregá-lo e deixá-lo pronto para ser usado, o que, na
linguagem da ciência de dados, significa preparar as informações
coletadas.
“A diferença entre um estatístico e um cientista de dados é que o
primeiro precisa dos dados já prontos para trabalhar e o segundo tem a
versatilidade de fazer esta preparação, tem as chamadas hacking skills
(habilidades de hackeamento), que o estatístico não tem.
Combinação de habilidades e trabalho em equipe
Justamente por ser extremamente difícil combinar todas estas
habilidades, o mais comum é formar equipes com profissionais que se
complementam.
“Fazemos um mix e montamos equipes. Um profissional de computação fica
encarregado de fazer a preparação, trabalha em conjunto com quem faça
análise matemática e embutimos também conhecimento de negócios”, diz
Monica Tyszler, diretora de soluções e serviços do SAS América Latina.
A falta de alguma das habilidades compromete todo o sucesso no trabalho.
“Se há expertise em computação e matemática, mas nenhuma em negócios,
não será possível descobrir qual é o problema que a empresa precisa
resolver”, diz De Paula.
Mais expertise na área computação e de negócios e nenhuma em matemática e
estatística vai resultar em prejuízos no rigor da análise. E por fim, a
ausência de conhecimento em computação impede a extração de um volume
significativo de dados que é o que, em última instância, tem a
capacidade de trazer valor em termos de negócios.
Na Neoway, De Paula forma duplas de trabalho para garantir que todas as
habilidades estejam à mesa. “Por exemplo, temos aqui um físico e um
especialista em econometria que atuam juntos”, diz.
As formações mais frequentes dos cientistas de dados em ação hoje
Nos Estados Unidos, algumas universidades já possuem programas de
formação conceituados. Mas por se tratar de atividade nova, grande parte
dos profissionais que atuam hoje na área veio de outras formações
acadêmicas.
Estatística, engenharia, matemática, física são bastante frequentes nos
currículos dos profissionais, segundo o diretor geral da Yoctoo.
“Importante notar que formações como mestrado e doutorado são quase
sempre mandatórias”, diz Gamba. Segundo ele, carreiras que facilitam a
migração para a área são inteligência de negócios, estatística ou
tecnologia, de modo geral.
Na opinião da diretora do SAS, a formação em engenharia de produção
atrelada à engenharia de computação dá uma boa base para quem quer
seguir carreira na área de ciência de dados. “Tem aula de programação,
matemática estatística, pesquisa e há o conhecimento de negócios
aplicado à engenharia de produção”, explica.
Saber programar e ter conhecimentos de sistemas gerenciadores de bancos
de dados é essencial.
Grande parte das linguagens usadas neste ramo são
open source, ou seja, código aberto. Na Neoway, as equipes trabalham com
as linguagens Python, R, Spark, Scala, Go e os gerenciadores de bancos
de dados MongoDB, SQL, Elasticsearch, Neo4j, Cassandra e o sistema de
mensagens Apache Kafka.
O SAS é uma das empresas que investem na qualificação de profissionais.
“Começamos com um curso de formação de cientista de dados nos Estados
Unidos e a ideia foi trazer para o Brasil”, diz Mônica. Técnicas de
gerenciamento de big data, de análises avançadas, de visualização de
dados, machine learning e técnicas de comunicação que também são
essenciais para os cientistas de dados, a Academia para Ciência de Dados
do SAS é uma opção para quem quer certificação nesta área.
Nenhum comentário:
Postar um comentário