Publier un Poste Partenaires

Rechercher des emplois à distance

In Tandem

Site Web LinkedIn Tous les Emplois

51 - 200 employés

👥 B2C

☁️ SaaS

⚡ Productivité

B2C • SaaS • Productivity

In Tandem est une plateforme technologique mondiale qui développe des outils numériques et des applications pour accompagner les familles à travers les étapes clés et la vie quotidienne. L'entreprise crée et gère des solutions familiales axées sur les consommateurs, y compris des applications de coparentalité, d'organisation familiale, de communication et de gestion des horaires parentaux, destinées à améliorer la connexion, la coordination et la tranquillité d'esprit des familles modernes. Les produits d'In Tandem sont conçus pour simplifier les routines, soutenir la coparentalité et la communication familiale, ainsi que fournir des ressources durant les périodes difficiles.

Ingénieur IA

🕒 il y a 1 mois

🇫🇷 France – Télétravail

💵 €60 000 - €80 000 / an

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🤖 Ingénieur IA

🗣️🇺🇸🇬🇧 Anglais requis

AWS

Docker

Python

Postuler Maintenant

Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

In Tandem

Site Web LinkedIn Tous les Emplois

51 - 200 employés

👥 B2C

☁️ SaaS

⚡ Productivité

B2C • SaaS • Productivity

Description

• Exploiter et optimiser notre stack d'inférence auto‑hébergée • Exécuter la couche de serving d'inférence sur notre propre matériel GPU : choisir et paramétrer la stack de serving (vLLM, SGLang, TensorRT-LLM) pour un haut débit et une faible latence. • Optimiser de façon agressive : parallélisme tensoriel, quantification (FP8, AWQ, GPTQ), KV-cache et mise en cache des préfixes, batchs continus, décodage spéculatif, réglage de la concurrence. • Servir plusieurs modèles et fonctionnalités sur du matériel partagé : multi‑LoRA, routage et ordonnancement des requêtes pour équilibrer les charges internes et le trafic produit sensible à la latence. • Rendre nos charges IA efficaces : améliorer la latence, le débit et l'utilisation GPU pour tirer le meilleur parti de nos ressources. • Construire la visibilité : instrumenter les performances et l'utilisation de nos surfaces IA afin d'obtenir des données claires sur le fonctionnement global. • Mettre en évidence les compromis techniques (performances, latence, efficience) pour fournir aux décideurs les éléments nécessaires à leurs choix. • Déployer la couche d'agents intégrée à l'application qui aide les familles à se coordonner : relances proactives, suggestions intelligentes, agents qui résument, rédigent, planifient et agissent pour les parents occupés. • Construire la couche sous-jacente : outils, gestion de mémoire, orchestration, garde‑fous et dispositifs d'évaluation, intégrés proprement aux API de production avec l'équipe d'architecture. • Travailler en binômes agiles avec les responsables de fonctionnalités, en mettant en place tout ce qui est nécessaire pour tester une idée, y compris une interface (UI) « vibe‑coded » quand c'est le moyen le plus rapide d'atteindre un client réel. Livrer rapidement, apprendre vite, fiabiliser ce qui fonctionne.

🎯 Exigences

• Minimum 5 ans d'expérience dans le déploiement de logiciels en production, incluant un travail significatif en IA ou en ML appliqués. • Expérience avérée dans l'exploitation et l'optimisation de LLM auto‑hébergés sur matériel multi‑GPU dédié : maîtrise d'une stack de serving (vLLM, SGLang ou TensorRT‑LLM) et des optimisations associées (parallélisme tensoriel, quantification, batching, KV‑cache). • Antécédents prouvés d'optimisation des performances et de l'efficacité d'inférence (latence, débit, utilisation GPU). • Solides compétences en Python et en génie logiciel, avec une capacité full‑stack pour mettre en place rapidement une UI, et la volonté réelle de travailler sur des fonctionnalités applicatives et pas uniquement sur l'infrastructure. • Expérience pratique des frameworks d'agents (Claude Agent SDK, LangGraph ou équivalent), des API LLM, des embeddings et du RAG. • À l'aise avec AWS et le devops lié au poste : Docker, CI/CD, monitoring et observabilité. • Expérience de création d'outils internes ou de plateformes utilisées par d'autres équipes. Bonus pour les applications Slack, MCP ou l'orchestration d'agents à l'échelle d'une équipe.

🏖️ Avantages

• Mutuelle santé : In Tandem prend en charge 100 % de la cotisation pour l'employé ET 99 % pour chaque membre de la famille supplémentaire. • Plan d'épargne retraite (type 401k) : abondement jusqu'à 4 % avec acquisition immédiate. • Congé payé pour tous les nouveaux parents. • Indemnité de formation et développement pour les employés. • Congés payés : 11 jours fériés + Repos hivernal (3 jours) + Congé bénévole (1 jour) + Jour flottant (1 jour). • Congés personnels : 15 jours pour 0–1 an d'ancienneté, 20 jours pour 1–3 ans d'ancienneté. • Environnement de travail bienveillant et flexible – possibilité de travailler depuis n'importe où !

Postuler Maintenant

Emplois Similaires

Ingénieur Full-stack (x/f/m) — Outils pour développeurs IA

🕒 il y a 1 mois

Alan

501 - 1000

🏥 Santé

🛡️ Assurance

⚕️ Assurance santé

Site Web LinkedIn Tous les Emplois

Ingénieur Full-stack développant des outils IA pour une plateforme d'assurance santé. Vous travaillerez au sein d'une équipe d'ingénierie talentueuse pour créer des solutions fiables et à fort impact.

🇫🇷 France – Télétravail

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🤖 Ingénieur IA

🗣️🇺🇸🇬🇧 Anglais requis

Postuler

Voir l'Emploi

Ingénieur IA Playables

🕒 il y a 2 mois

Voodoo

501 - 1000

🎮 Jeux vidéo

📱 Médias

👥 B2C

Site Web LinkedIn Tous les Emplois

Ingénieur IA Playables créant des expériences publicitaires interactives chez Voodoo. Association de compétences en développement de playables et d'expertise en IA appliquée.

🇫🇷 France – Télétravail

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🤖 Ingénieur IA

🗣️🇺🇸🇬🇧 Anglais requis

JavaScript

TypeScript

Unity

Postuler

Voir l'Emploi

Ingénieur logiciel Fullstack (H/F/X) — Plateforme Ops AI

🕒 il y a 5 mois

Alan

501 - 1000

🏥 Santé

🛡️ Assurance

⚕️ Assurance santé

Site Web LinkedIn Tous les Emplois

Ingénieur produit créant des agents IA fiables pour des tâches opérationnelles chez Alan, transformant la gestion des avantages santé grâce à une technologie innovante.

🇫🇷 France – Télétravail

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🤖 Ingénieur IA

🗣️🇺🇸🇬🇧 Anglais requis

Postuler

Voir l'Emploi

Voir Plus d'Emplois Ingénieur IA

Développé par Lior Neu-ner. J'aimerais beaucoup recevoir vos retours — contactez-moi en DM ou par e-mail [email protected]