Futuros cientistas precisam ser formados no contexto do Big Data

Receba atualizações em tempo real direto no seu dispositivo, inscreva-se agora.

Nunca se produziu tantos dados como no mundo atual. Uma enxurrada deles é gerada diariamente nas ações mais corriqueiras: uma ida ao supermercado, o preenchimento de um cadastro, a curtida em um post ou foto publicada nas redes sociais, a visualização de um filme em uma plataforma de streaming. Estamos na era da Big Data.

Os dados têm sido frequentemente descritos como o combustível, ou o ouro, do futuro. O grande desafio é transformar informação (dados brutos) em conhecimento capaz de acelerar transformações, gerar inovações e produzir insights valiosos nos mais variados segmentos. Ou seja, correlacionar e dar sentido a esses dados para tomadas de decisões baseadas na identificação de tendências e predições de cenários.

E é isso que faz a ciência de dados, campo do conhecimento focado em garimpar, organizar, trabalhar e dar significado a esses dados. É uma área multidisciplinar que envolve matemática, estatística e computação, com aplicações em diversas frentes.

Assim como em outras áreas, a ciência de dados tem se incorporado nas diversas práticas científicas de forma irreversível. A Física, Química, Biologia e Engenharias já fazem uso constante de rotinas de aquisição, organização, armazenamento, processamento e representação de quantidades massivas de dados. O design de novos materiais, a determinação de estruturas de proteínas, a produção de motores mais limpos e eficientes e o aperfeiçoamento da mobilidade urbana são problemas científicos que necessitam de grande volume de dados para serem atacados. Independentemente da carreira, o cientista de amanhã terá que navegar com segurança nos domínios da ciência de dados.

 

Déficit de especialistas

 

O crescimento do investimento na área de ciência de dados tem gerado um déficit de especialistas, um imenso mercado de trabalho ainda a ser explorado. Levantamento divulgado pela Intera, startup especializada em recrutamento profissional, mostrou que houve um aumento de 485% na abertura de vagas para cientistas de dados no primeiro semestre de 2021.

A carreira ocupa a nona posição na lista das 25 que mais cresceram entre janeiro de 2017 e julho de 2021, segundo estudo apresentado em janeiro deste ano pelo LinkedIn. Um dado interessante é que esse levantamento foi realizado justamente a partir da análise de informações coletadas na própria rede social, voltada aos ambientes institucionais e corporativos.

 

Profissões do amanhã

 

“Tem uma frase em um artigo que vale a pena mencionar: nem todo cientista precisa saber utilizar machine learning, mas aquele que sabe tomará o emprego daquele que não sabe. Certamente, o conhecimento da ciência intensiva de dados estará vinculada a todas as profissões do futuro. Há um campo muito amplo para os profissionais com formação nesta área. Tecnologias recentes e disruptivas, da engenharia à medicina, fazem uso dessa vasta disponibilidade de dados”, afirma o físico Adalberto Fazzio, diretor da Ilum Escola de Ciência, do Centro Nacional de Pesquisa em Energia e Materiais (CNPEM).

O avanço das tecnologias de inteligência artificial e automação junto à Ciência podem trazer mudanças sociais e econômicas profundas. A ciência de dados é base para tais tecnologias e, portanto, deve ser incorporada na agenda das instituições de ensino superior. “O aluno da Ilum estuda ciência com o olhar da ciência de dados”, diz o químico Amauri Jardim de Paula, professor na Ilum.

A seguir, um bate-papo com o professor Amauri Jardim de Paula sobre o que é a ciência de dados, sobre a formação e o papel dos cientistas de dados neste cenário de transformações e as implicações do avanço dessas tecnologias para o presente e para o futuro da sociedade.

 

O que é a ciência de dados e onde ela já está presente no dia a dia das pessoas? 

A ciência de dados envolve, mas não só, a coleta, extração, manipulação, análise, classificação e comparação de dados. O objetivo principal dessa prática é o de prever comportamentos e eventos relevantes. Alguns exemplos seriam o de previsão de um padrão de consumo de pessoas, bem como a previsão da propriedade de um novo material ainda não descoberto.

 

Muitos especialistas comparam a importância e a revolução causada por esta imensa massa de dados gerada atualmente com o que representou a eletricidade no passado e o que o petróleo representa hoje. Outros se referem aos dados como o “novo ouro”. Como esse volume de dados pode impactar o futuro da sociedade?

Sabemos hoje que os modelos matemáticos usados no aprendizado de máquina aumentam a sua eficiência em prever algo dependendo da quantidade de dados que usamos para “treiná-los”. De forma geral, quanto mais dados, melhor a previsão que os modelos podem fazer. Neste contexto, a quantidade de dados disponível passa a determinar o quão eficiente um computador ou um robô treinados executarão uma determinada atividade. Por isso, os dados são o “novo ouro”.

 

Qual a relevância da ciência de dados para as empresas e suas aplicações?

Empresas de alta tecnologia fazem uso crescente destes modelos de aprendizado de máquina em suas operações. Como exemplo, pense em uma empresa que depende de logística em suas operações. Hoje, já sabemos que os modelos de aprendizado de máquina são eficientes para prever rotas terrestres de entrega. O setor de logística é um dos que se beneficia estrategicamente contratando especialistas em ciência de dados. Geralmente, quanto maior o número de variáveis de uma determinada operação de uma empresa, mais benefícios ela teria utilizando aprendizado de máquina. No caso do setor logístico, a entrega de um produto em nossas casas depende de muitas variáveis: clima (se vai chover ou não), dia da semana (se for um dia útil ou não), trajeto (quantos semáforos há no percurso) e outros. Modelos de aprendizado de máquina são usados hoje para determinar qual rota o entregador deve tomar. Ainda vemos benefícios do uso de aprendizado de máquina nas áreas de saúde, agricultura e segurança pública. Por fim, os governos também estão fazendo uso crescente e estratégico desses modelos para promoção de políticas públicas.

 

Quais são as áreas de conhecimento envolvidas na ciência de dados? 

Apesar de ter como base a matemática, estatística e computação, as aplicações da ciência de dados são feitas na Química, Biologia, Medicina, Física, Engenharias e Economia. Entretanto, as implicações éticas do aprendizado de máquina são área de estudo das Humanidades. Por isso, na Ilum, o aluno aprende as práticas de ciência de dados de forma integrada com as Ciências da Natureza e com as Humanidades.

 

O déficit desses profissionais no mercado de trabalho é imenso. Qual é o cenário brasileiros hoje no ensino e capacitação nesta área? O que é preciso oferecer para uma boa formação do cientista de dados? 

Importantes desafios nacionais podem ser atacados com a ciência de dados. Esses profissionais são hoje cruciais para o desenvolvimento de tecnologias inovadoras, em um amplo espectro de aplicações. Esses profissionais também ocupam papel central no suporte à pesquisa em diversos campos do conhecimento. É preciso, portanto, formar profissionais multidisciplinares e de alta qualidade, que possuam uma excelente base de conhecimentos para a ciência de dados, mas que também saibam estudar e resolver problemas em qualquer área do conhecimento.

 

Quais são as principais habilidades que esses profissionais devem desenvolver para fazer frente à demanda e se diferenciar na carreira? 

Antes de mais nada, qualquer atividade envolvendo a ciência de dados se faz com uma base sólida de matemática, estatística e programação de computadores, independentemente do contexto. Essa base sólida é o que oferecemos nos primeiros semestres do curso na Ilum. Dito isso, ao longo do curso, o aluno pode usar a ciência de dados em problemas científicos e tecnológicos da Química, Física e Biologia. Além disso, habilidades para a carreira como independência, proatividade e capacidade de trabalho em equipe são trabalhadas em nosso modelo pedagógico. O curso na Ilum é inteiramente baseado em metodologias ativas, nas quais o aluno é o protagonista em sua formação.

 

O aprendizado de máquinas e a inteligência artificial são comumente associados na ficção, em livros e filmes, com cenários distópicos e de domínio dessa inteligência sobre os humanos. No campo da realidade, hoje, há setores que associam o uso desse expediente com a otimização de processos que substituiriam a mão de obra humana. Em que medida esse temor é justificável?

Apesar dos modelos de aprendizado de máquina hoje disponíveis já serem de alta eficiência, esses são treinados para desempenharem tarefas muito específicas, como a de traduzir um texto e reconhecer voz. Há um desenvolvimento fantástico na área e, ano após ano, novos modelos são apresentados para diferentes fins. A generalização das tarefas que um modelo pode executar ainda é foco de pesquisa. A busca é para que tenhamos em breve robôs operando com modelos de aprendizado de máquina que consigam desempenhar várias tarefas, como andar, pegar, ouvir e falar. Por essa razão, é crucial que a área das Humanidades acompanhe esse desenvolvimento tecnológico, especialmente para balizar os questionamentos éticos e morais.

 

Há uma ideia geral de que apenas grandes empresas têm capacidade e recursos, financeiros, tecnológicos e humanos, para fazer uso desta ferramenta. A ciência de dados é também para os pequenos?

Em termos de software, uma boa parte dos modelos matemáticos de aprendizado de máquina já foram implementados em algoritmos de código aberto e são distribuídos de forma gratuita. Não apenas isso, mas diversas ferramentas que são o estado da arte na área são software livre. Em termos de hardware, o custo escala com o poder computacional necessário (velocidade) e tamanho do banco de dados (memória). No final do dia, esse custo depende muito dos dados e do processo que será realizado com eles.

Comentários estão fechados.