Cientista de Dados | Engenheiro de LLM

🔥 1 minuto atrás

🌏 Qualquer lugar do mundo

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

📊 Cientista de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of TEKEVER

TEKEVER

1001 - 5000 funcionários

Fundada em 2001

🚀 Aeroespacial

🔧 Hardware

🤝 B2B

💰 $534.202.302 Venture Round - TEKEVER em 2025-05

Aerospace • Hardware • B2B

<TEKEVER> é uma empresa de tecnologia especializada em sistemas não tripulados e sistemas de satélite de próxima geração, oferecendo soluções integradas de hardware e software e serviços relacionados. A empresa fornece transformação digital, engenharia de plataformas e software, navegabilidade, impressão 3D, treinamento e consultoria para clientes comerciais e governamentais em várias localidades internacionais. A TEKEVER foca em sistemas e serviços integrados a hardware para aplicações aeroespaciais e relacionadas à defesa, críticas para missões.

Descrição

• Desenvolver, implementar e otimizar algoritmos, modelos e capacidades avançadas que ajudam equipes a automatizar suas cargas de trabalho. • Trabalhar em uma variedade de projetos que envolvem compreensão, processamento e geração de linguagem humana para resolver problemas complexos e criar soluções inovadoras. • Projetar, desenvolver e implementar algoritmos e modelos de ponta no contexto de modelos de linguagem. • Implementar novas funcionalidades baseadas em IA em áreas como suporte à decisão, planejamento de missões e automação de fluxos de trabalho. • Treinar e otimizar large language models (LLMs) usando grandes volumes de dados textuais, garantindo alto desempenho e precisão. • Realizar tarefas de pré-processamento de dados como tokenização, stemming, lematização e normalização para preparar conjuntos de dados para treinamento e avaliação. • Manter-se atualizado com os últimos avanços em LLMs e Processamento de Linguagem Natural (NLP) e aplicar novas técnicas para melhorar modelos existentes e desenvolver novas soluções. • Trabalhar em estreita colaboração com engenheiros de dados, desenvolvedores de software, gerentes de produto e demais stakeholders para entender os requisitos do projeto e entregar soluções eficazes. • Avaliar o desempenho dos modelos usando métricas e técnicas apropriadas e melhorar iterativamente sua precisão e eficiência. • Colaborar com equipes de engenharia para implantar modelos em ambientes de produção e garantir sua robustez e escalabilidade. • Manter documentação abrangente de modelos, algoritmos e processos para referência futura e reprodutibilidade.

🎯 Requisitos

• Graduação ou mestrado em Ciência da Computação, Data Science ou área relacionada. Doutorado é um diferencial. • Mais de 3 anos de experiência em data science, com foco em large language models (LLMs) e NLP. • Fortes habilidades de programação em Python, com experiência no uso de bibliotecas de NLP e LLMs como spaCy, Hugging Face (Transformers, Datasets, PEFT, TRL) e nas principais famílias de modelos (por exemplo, GPT, Claude, Gemini, Llama, Mistral, Qwen, Gemma) tanto via API quanto com pesos abertos. • Proficiência em frameworks de deep learning, principalmente PyTorch (além de Keras/TensorFlow quando necessário), e familiaridade com otimização de inferência (quantização, TensorRT-LLM). • Experiência com pré-processamento, curadoria e tokenização de dados para cargas de trabalho de LLM, incluindo construção e limpeza de datasets para fine-tuning e retrieval (chunking, embeddings, deduplicação, geração de dados sintéticos). • Sólido entendimento de arquiteturas transformer e do mecanismo de atenção, com conhecimento prático de técnicas de fine-tuning e alinhamento (full fine-tuning, LoRA/QLoRA, instruction tuning, RLHF/DPO). • Exposição a RNNs e CNNs é um diferencial, não um requisito central. • Experiência em treinar e ajustar LLMs e em construir sistemas RAG e agentivos, incluindo frameworks de orquestração (LangChain, LlamaIndex, LangGraph), bancos de vetores (por exemplo, Qdrant, Weaviate, pgvector) e chamadas de ferramentas/funções. • Experiência com ferramentas de experimentação e rastreamento: notebooks Jupyter, rastreamento de experimentos e prompts (MLflow, Weights & Biases) e avaliação de LLMs (por exemplo, Ragas, LangSmith/Langfuse, harnesses de avaliação customizados). • Familiaridade com plataformas em nuvem (AWS, Azure, Google Cloud) e seus serviços de IA, com foco em Google Cloud (Vertex AI, model garden, managed endpoints). • Experiência em implantar LLMs self-hosted e com pesos abertos em produção, usando frameworks de serving como vLLM, TGI, Ollama ou llama.cpp, com conhecimento sobre dimensionamento de GPU, formatos de quantização (GGUF, AWQ, GPTQ) e restrições on-prem ou airgapped. • Conhecimento prático de MLOps/LLMOps e práticas de DevOps: Git, CI/CD, conteinerização (Docker, Kubernetes), além de telemetria, monitoramento e observabilidade para desempenho de modelos e inferência. • Excelentes habilidades analíticas e de resolução de problemas, com capacidade de projetar soluções inovadoras para problemas complexos. • Experiência ou conhecimento sobre ética em IA, justiça e estratégias de mitigação de viés no contexto de NLP e LLMs. • Fortes habilidades de comunicação verbal e escrita, com capacidade de explicar conceitos técnicos complexos para stakeholders não técnicos. • Capacidade de trabalhar de forma eficaz em um ambiente colaborativo e multifuncional. • Alto grau de atenção aos detalhes e compromisso com a precisão e qualidade do trabalho. • Capacidade de prosperar em um ambiente dinâmico e acelerado e gerenciar múltiplos projetos simultaneamente.

🏖️ Benefícios

• Excelente ambiente de trabalho e oportunidade de causar impacto real no mundo • Empresa de engenharia de ponta, com estrutura horizontal e sem política interna • Trabalhar com as tecnologias mais recentes em Data & AI, incluindo Edge AI e Swarming — tanto em nossas plataformas de software quanto em nossos sistemas embarcados a bordo • Regime de trabalho flexível • Oportunidades de desenvolvimento profissional • Ambiente de trabalho colaborativo e inclusivo • Salário compatível com o nível de experiência comprovada

Candidatar-se

Vagas Similares

🕒 Maio 14

BlueThrone

51 - 200

👥 B2C

Líder de Analytics conduzindo mensuração e analytics para o portfólio de apps móveis rentáveis da BlueThrone. Lidera analytics prático, o time de BI e parcerias interfuncionais para otimização de performance.

🌏 Qualquer lugar do mundo

💰 Seed em 2022-04

⏰ Tempo Integral

🟠 Sênior

📊 Cientista de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório