Member of Engineering – Pre-training, Data Engineering

🕒 Janeiro 29

🇺🇸 Estados Unidos – Remoto (EUA)

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of poolside

poolside

51 - 200 funcionários

Fundada em 2023

🤖 Inteligência Artificial

🏢 Corporativo

Artificial Intelligence • Enterprise

Poolside é uma aceleradora projetada especificamente para fundadores e builders de Web3. Ela oferece suporte a projetos de finanças descentralizadas (DeFi), games, governança, infraestrutura e NFTs. Com um ecossistema robusto de 20. 000 membros — incluindo mentores, investidores e builders de Web3 — a Poolside co-lançou e apoiou mais de 110 projetos. A aceleradora proporciona acesso diferenciado a mentoria e expertise técnica para ajudar projetos Web3 a escalar e alcançar lançamentos bem-sucedidos. A Poolside também se engaja com empresas e protocolos líderes para impulsionar o crescimento e a inovação no espaço Web3.

Descrição

• Build and maintain high-performance pipelines for trillions of tokens. • Deliver diverse and high quality datasets for pre-training foundation models. • Closely work with other teams such as Pretraining, Posttraining, Evals and Product to to ensure alignment on the quality of the models delivered.

🎯 Requisitos

• Strong background in building production-grade, distributed data systems for machine learning, with experience in: • Orchestration: Slurm, Airflow, or Dagster • Observability & Reliability: CI/CD, Grafana, Prometheus, etc. • Infra: Git, Docker, k8s, cloud managed services • Batched inference (ex: vLLM) • Performance obsession, especially with large-scale GPU clusters and distributed pipelines • Expert-level python knowledge and ability to write clean and maintainable code • Strong algorithmic foundations • Proficiency with libraries like Polars, Dask, or PySpark • Nice to have: • Experience in building trillion-scale SOTA pretraining datasets • Experience translating research to production at scale • Experience with OCR, web crawling, or evals • Prior experience pre-training LLMs

🏖️ Benefícios

• Fully remote work & flexible hours • 37 days/year of vacation & holidays • Health insurance allowance for you and dependents • Company-provided equipment • Wellbeing, always-be-learning and home office allowances • Frequent team get togethers • Great diverse & inclusive people-first culture

Candidatar-se

Vagas Similares

🕒 Janeiro 27

EvenUp

51 - 200

🤖 Inteligência Artificial

☁️ SaaS

Data Migration Specialist role at EvenUp focuses on planning and executing customer data migrations. Collaborates with teams to ensure accurate and efficient data transfer and ongoing support.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $66.000 - $106.000 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Janeiro 21

Veltris

501 - 1000

🤖 Inteligência Artificial

🤝 B2B

Senior Data Engineer leading design and implementation of data pipelines for telecom operations. Building data models and analytics solutions using SQL, Hevo, and Tableau for insights.

🇺🇸 Estados Unidos – Remoto (EUA)

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Janeiro 20

Palantir

1 - 10

⚡ Energia

☁️ SaaS

🏢 Corporativo

Palantir Foundry Architect responsible for platform ownership and architecture at a non-profit. Leading enterprise analytics transformation in healthcare and community-focused sectors.

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Janeiro 15

Quanata

201 - 500

🤖 Inteligência Artificial

☁️ SaaS

Senior Data Engineer delivering data science services and streaming data pipelines. Creating data pipelines for risk evaluation and enabling model training at Quanata.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $215.000 - $300.000 / ano

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Janeiro 15

Eton Technologies

51 - 200

🤝 B2B

🏢 Corporativo

🤖 Inteligência Artificial

Data Engineering Consultant leading and delivering modern data platforms for global clients. Requires strong expertise in Snowflake, Databricks, and cloud platforms (AWS, Azure, or GCP).

🇺🇸 Estados Unidos – Remoto (EUA)

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

🚰 Engenheiro de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório