Ingénieur IA

Emploi pas sur LinkedIn

🔥 il y a 15 minutes

🇫🇷 France – Télétravail

💵 €60 000 - €80 000 / an

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🤖 Ingénieur IA

🗣️🇺🇸🇬🇧 Anglais requis

Postuler Maintenant
Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

Logo of In Tandem

In Tandem

51 - 200 employés

👥 B2C

☁️ SaaS

⚡ Productivité

B2C • SaaS • Productivity

In Tandem est une plateforme technologique mondiale qui développe des outils numériques et des applications pour accompagner les familles à travers les étapes clés et la vie quotidienne. L'entreprise crée et gère des solutions familiales axées sur les consommateurs, y compris des applications de coparentalité, d'organisation familiale, de communication et de gestion des horaires parentaux, destinées à améliorer la connexion, la coordination et la tranquillité d'esprit des familles modernes. Les produits d'In Tandem sont conçus pour simplifier les routines, soutenir la coparentalité et la communication familiale, ainsi que fournir des ressources durant les périodes difficiles.

Description

• Exploiter et optimiser notre stack d'inférence auto‑hébergée • Exécuter la couche de serving d'inférence sur notre propre matériel GPU : choisir et paramétrer la stack de serving (vLLM, SGLang, TensorRT-LLM) pour un haut débit et une faible latence. • Optimiser de façon agressive : parallélisme tensoriel, quantification (FP8, AWQ, GPTQ), KV-cache et mise en cache des préfixes, batchs continus, décodage spéculatif, réglage de la concurrence. • Servir plusieurs modèles et fonctionnalités sur du matériel partagé : multi‑LoRA, routage et ordonnancement des requêtes pour équilibrer les charges internes et le trafic produit sensible à la latence. • Rendre nos charges IA efficaces : améliorer la latence, le débit et l'utilisation GPU pour tirer le meilleur parti de nos ressources. • Construire la visibilité : instrumenter les performances et l'utilisation de nos surfaces IA afin d'obtenir des données claires sur le fonctionnement global. • Mettre en évidence les compromis techniques (performances, latence, efficience) pour fournir aux décideurs les éléments nécessaires à leurs choix. • Déployer la couche d'agents intégrée à l'application qui aide les familles à se coordonner : relances proactives, suggestions intelligentes, agents qui résument, rédigent, planifient et agissent pour les parents occupés. • Construire la couche sous-jacente : outils, gestion de mémoire, orchestration, garde‑fous et dispositifs d'évaluation, intégrés proprement aux API de production avec l'équipe d'architecture. • Travailler en binômes agiles avec les responsables de fonctionnalités, en mettant en place tout ce qui est nécessaire pour tester une idée, y compris une interface (UI) « vibe‑coded » quand c'est le moyen le plus rapide d'atteindre un client réel. Livrer rapidement, apprendre vite, fiabiliser ce qui fonctionne.

🎯 Exigences

• Minimum 5 ans d'expérience dans le déploiement de logiciels en production, incluant un travail significatif en IA ou en ML appliqués. • Expérience avérée dans l'exploitation et l'optimisation de LLM auto‑hébergés sur matériel multi‑GPU dédié : maîtrise d'une stack de serving (vLLM, SGLang ou TensorRT‑LLM) et des optimisations associées (parallélisme tensoriel, quantification, batching, KV‑cache). • Antécédents prouvés d'optimisation des performances et de l'efficacité d'inférence (latence, débit, utilisation GPU). • Solides compétences en Python et en génie logiciel, avec une capacité full‑stack pour mettre en place rapidement une UI, et la volonté réelle de travailler sur des fonctionnalités applicatives et pas uniquement sur l'infrastructure. • Expérience pratique des frameworks d'agents (Claude Agent SDK, LangGraph ou équivalent), des API LLM, des embeddings et du RAG. • À l'aise avec AWS et le devops lié au poste : Docker, CI/CD, monitoring et observabilité. • Expérience de création d'outils internes ou de plateformes utilisées par d'autres équipes. Bonus pour les applications Slack, MCP ou l'orchestration d'agents à l'échelle d'une équipe.

🏖️ Avantages

• Mutuelle santé : In Tandem prend en charge 100 % de la cotisation pour l'employé ET 99 % pour chaque membre de la famille supplémentaire. • Plan d'épargne retraite (type 401k) : abondement jusqu'à 4 % avec acquisition immédiate. • Congé payé pour tous les nouveaux parents. • Indemnité de formation et développement pour les employés. • Congés payés : 11 jours fériés + Repos hivernal (3 jours) + Congé bénévole (1 jour) + Jour flottant (1 jour). • Congés personnels : 15 jours pour 0–1 an d'ancienneté, 20 jours pour 1–3 ans d'ancienneté. • Environnement de travail bienveillant et flexible – possibilité de travailler depuis n'importe où !

Postuler Maintenant

Emplois Similaires

🕒 il y a 12 jours

Databricks

1001 - 5000

🤖 Intelligence artificielle

🏢 Entreprise

☁️ SaaS

Ingénieur IA développant des solutions GenAI de pointe pour Databricks. Collaboration avec les clients et les équipes pour renforcer les stratégies IA et la feuille de route produit.

🇫🇷 France – Télétravail

💰 €1 600 000 000 Series H en 2021-08

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🤖 Ingénieur IA

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 12 jours

Alan

501 - 1000

⚕️ Assurance santé

💳 Fintech

☁️ SaaS

Ingénieur Full-stack développant des outils IA pour une plateforme d'assurance santé. Vous travaillerez au sein d'une équipe d'ingénierie talentueuse pour créer des solutions fiables et à fort impact.

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

360Learning

201 - 500

📚 Éducation

⚡ Productivité

☁️ SaaS

Piloter le développement et la mise en production de systèmes GenAI/LLM pour une plateforme à grande échelle. Travaillez avec Python, intégrations LLM, MongoDB, Node.js, Vue.js et TypeScript au sein d’une équipe R&D favorable au télétravail.

🇫🇷 France – Télétravail

💰 €200 000 000 Private Equity Round en 2021-10

⏰ Temps Plein

🟢 Junior

🟡 Intermédiaire

🤖 Ingénieur IA

🚫👨‍🎓 Aucun diplôme requis

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

Voodoo

501 - 1000

🎮 Jeux vidéo

📱 Médias

👥 B2C

Ingénieur IA Playables créant des expériences publicitaires interactives chez Voodoo. Association de compétences en développement de playables et d'expertise en IA appliquée.

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Ingénieur IA recherché pour la refonte complète du site web de Hector Kitchen. Nécessite une prise en charge complète du projet et une expérience des sites grand public, avec un focus sur les outils d'IA.

🗣️🇺🇸🇬🇧 Anglais requis