Senior AI Engineer – Agentes, Plataforma & RAG

Job not on LinkedIn

🔥 20 minutes ago

🗣️🇧🇷🇵🇹 Portuguese Required

Apply Now
Find Similar Remote Jobs

📊 Check your resume score for this job

Improve your chances of getting an interview by checking your resume score before you apply.

Logo of Leega

Leega

201 - 500 employees

Founded 2010

🔌 API

🤖 Artificial Intelligence

API • Artificial Intelligence • Cloud Solutions

Leega is a leading technology solutions provider in Latin America, specializing in data analytics and cloud solutions. As the first company in the region certified by Google Cloud for Data Analytics, Leega offers a range of services including application development, machine learning, and risk management analytics. The firm partners with major cloud services such as AWS and Microsoft Azure to help businesses enhance their data management and transition effectively to the cloud, ultimately driving digital transformation and innovation.

📋 Description

• Você vai construir a plataforma de agentes de IA da Guanabara e o ecossistema que distribui IA generativa governada à companhia. • Orquestração de agentes — construir agentes com LangGraph no padrão Supervisor/ReAct, com memória de curto/longo prazo e estado durável (PostgresSaver). • Camada semântica e RAG — evoluir a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking) que ancoram as respostas em dado real. • Skills, subagentes e MCP — criar e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em fluxo spec-driven, conectando agentes a sistemas corporativos. • Verificação e avaliação — manter o verificador (LLM-as-judge) e suítes de eval (offline/online) com amostragem de traces para pegar drift de qualidade. • Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider) otimizando custo e latência. • Adaptação e serving de modelos — quando RAG e prompting não bastam, fazer fine-tuning supervisionado e PEFT (LoRA/QLoRA), quantização e destilação; servir modelos abertos/privados com vLLM e roteamento SLM↔LLM. • Governança e segurança — aplicar guardrails de PII (Presidio), defesa contra prompt injection e observabilidade ponta a ponta (Langfuse).

🎯 Requirements

• Experiência construindo aplicações de IA generativa em produção (agentes ou RAG). • Python e design de APIs (FastAPI/FastMCP). • Frameworks de agentes (LangGraph, LangChain) e function calling estruturado (Pydantic). • RAG e vector databases (Qdrant ou similares). • Gateways/roteamento de LLMs (LiteLLM) e o Model Context Protocol (MCP). • Fine-tuning e adaptação de modelos: PEFT (LoRA/QLoRA), quantização e serving (vLLM). • Autoria de skills e agentes para o Claude Code — central nesta posição. • Camadas semânticas (Cube.js) como fonte de recuperação determinística. • Fine-tuning avançado: instruction tuning, destilação, fine-tuning de embeddings e roteamento SLM↔LLM. • Guardrails de PII (Presidio) e defesa contra prompt injection. • Observabilidade e avaliação (Langfuse, LLM-as-judge, evals). • GraphRAG / Neo4j como evolução híbrida sob demanda. • Plataformas de automação (n8n) e integração com sistemas corporativos.

🏖️ Benefits

• Trabalho Remoto • Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Apply Now

Similar Jobs

🕒 6 days ago

Omie

1001 - 5000

☁️ SaaS

💳 Fintech

🛍️ eCommerce

AI Tech Lead overseeing the Intelligence Artificial team and providing technical guidance. Leading AI/ML projects and implementations while collaborating with teams for innovative solutions.

🗣️🇧🇷🇵🇹 Portuguese Required

AWS

Python

PyTorch

SQL

Tensorflow

🕒 June 3

Arco Educação

1001 - 5000

Lead AI Engineering projects and mentor junior team members at Arco Educação. Focused on developing impactful AI solutions for educational technology.

🗣️🇧🇷🇵🇹 Portuguese Required

Python

🕒 May 29

LatamCent

11 - 50

🎯 Recruiter

🤝 B2B

☁️ SaaS

Senior AI Engineer building and shipping LLM-powered pipelines for a healthcare AI company. Owning AI architecture and ensuring quality in production systems.

AWS

Azure

Cloud

Google Cloud Platform

Python

🕒 May 28

Grupo Boticário

10,000+ employees

💄 Beauty

🛒 Retail

🧘 Wellness

AI Engineer optimizing production precision through generative AI applications at Grupo Boticário. Collaborating on multi-cloud architectures for strategic decision-making.

🗣️🇧🇷🇵🇹 Portuguese Required

Apache

AWS

Cloud

Google Cloud Platform

Java

Kotlin

Python

🕒 May 27

Digibee

51 - 200

☁️ SaaS

🔌 API

🏢 Enterprise

AI Engineer Specialist designing and implementing generative AI models at Digibee. Collaborating with cross-functional teams to deliver innovative AI functionalities.

🇧🇷 Brazil – Remote

💰 $60.5M Series B - Digibee on 2023-06

⏰ Full Time

🟡 Mid-level

🟠 Senior

🤖 AI Engineer

🗣️🇧🇷🇵🇹 Portuguese Required

Python

PyTorch

Tensorflow