Equipe Rampa

Cientista de Dados Sênior

17 de outubro de 2024
Acessar agora
Deadline date:

Descrição do job

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

Ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro.

Cadastre-se agora mesmo em nossas vagas!
Responsabilidades e atribuições
Experiência técnica com:

Python, R e desejável Redshift;
Experiência atuando com modelagem estatística, validação de tendências, scores, relevância, fraude, riscos, performance e resultado, manipulação de bancos de dados e otimização de algoritmos. Desenvolvimento de algoritmos de machine learning.
Requisitos e qualificações
Formação:

Graduação em Ciência da Computação, Engenharia de Software, Engenharia de Dados ou áreas correlatas. Pós-graduação ou certificações em áreas relevantes são desejáveis.

Experiência:

A partir de 7 anos de experiência profissional na área de tecnologia da informação, com pelo menos 5 anos dedicados especificamente à engenharia de dados, MLOps ou Ciência de dados.

Responsabilidades:

Projetar, desenvolver e manter pipelines de dados eficientes e escaláveis para coletar, processar e transformar dados brutos em formatos prontos para uso em modelos de aprendizado de máquina;
Garantir a qualidade, integridade e consistência dos dados ao longo de todo o ciclo de vida do ML;
Implementar pipelines de CI/CD (Integração Contínua/Entrega Contínua) para automação de testes, validação e implantação de modelos de ML;
Automatizar processos de treinamento, validação, deployment e monitoramento de modelos;
Configurar e gerenciar a infraestrutura necessária para suportar o ciclo de vida do ML, incluindo ambientes de desenvolvimento, teste e produção;
Utilizar ferramentas de gerenciamento de contêineres como Docker e Kubernetes para escalar e orquestrar modelos de ML;
Monitorar o desempenho dos modelos em produção e implementar alertas e métricas para identificar e resolver problemas;
Realizar manutenção regular dos modelos para garantir que permaneçam atualizados e eficazes;
Trabalhar em estreita colaboração com cientistas de dados, engenheiros de software e outros stakeholders para entender os requisitos do projeto e garantir a entrega eficaz de soluções de ML;
Facilitar a comunicação e a colaboração entre as equipes de desenvolvimento e operações para garantir uma integração perfeita;
Implementar práticas de gerenciamento de dados, incluindo governança de dados, segurança e conformidade com regulamentações (como GDPR e LGPD);
Garantir a proteção dos dados sensíveis e confidenciais ao longo do ciclo de vida do ML;
Identificar gargalos e otimizar o desempenho dos pipelines de dados e dos modelos de ML;
Utilizar técnicas avançadas de otimização para melhorar a eficiência e reduzir custos operacionais;
Implementar novas ferramentas que possam melhorar os processos e a eficiência operacional;
Documentar todos os processos, procedimentos e configurações de infraestrutura relacionados aos pipelines de MLops;
Estabelecer e promover as melhores práticas para desenvolvimento, implantação e operação de modelos de ML em escala;
Manter-se atualizado com as últimas tendências e tecnologias em MLops e engenharia de dados;
Fornecer orientação e suporte técnico para membros juniores da equipe;
Assumir um papel de liderança em projetos críticos e ajudar a definir a direção estratégica para a equipe de MLops
Informações adicionais
Conhecimentos:

Conhecimento em design e arquitetura de bancos de dados;
Experiência em processos de extração, transformação e carga de dados;
Familiaridade com Hadoop, Spark, Kafka;
Habilidade em construir e gerenciar pipelines de ML;
Experiência com ferramentas de CI/CD para ML como Jenkins, GitLab CI, etc;
Conhecimento em deploy de modelos de ML em produção utilizando frameworks como TensorFlow Serving, Docker, Kubernetes;
Habilidades em monitorar e manter modelos de ML em produção;
Proficiência com serviços de nuvem específicos para dados e ML, como AWS SageMaker, Azure Machine Learning, Google AI Platform;
Experiência com S3, Redshift, e ferramentas da nuvem AWS.

Desejável:

Certificação AWS.

Experiência em Logística é um grande diferencial, caso tenha atuado no ramo de ferrovia é um GRANDE diferencial.