Data Scientist | Ingénieur LLM

🔥 il y a 1 minute

🌏 N'importe où dans le monde

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

📊 Data Scientist

🗣️🇺🇸🇬🇧 Anglais requis

Postuler Maintenant
Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

Logo of TEKEVER

TEKEVER

1001 - 5000 employés

Fondée en 2001

🚀 Aérospatiale

🔧 Matériel

🤝 B2B

💰 €534 202 302 Venture Round - TEKEVER en 2025-05

Aerospace • Hardware • B2B

<TEKEVER> est une entreprise technologique spécialisée dans les systèmes sans pilote et les systèmes satellitaires de nouvelle génération, offrant des solutions matérielles et logicielles intégrées ainsi que des services associés. La société propose des services de transformation numérique, d'ingénierie de plates-formes et de logiciels, de navigabilité, d'impression 3D, de formation et de conseil pour des clients commerciaux et gouvernementaux dans plusieurs pays à l'international. TEKEVER se concentre sur les systèmes et services intégrés aux matériels pour des applications critiques dans le domaine de l'aérospatiale et de la défense.

Description

• Développer, implémenter et optimiser des algorithmes, modèles et fonctionnalités avancés permettant aux équipes d'automatiser leurs charges de travail. • Travailler sur une variété de projets impliquant la compréhension, le traitement et la génération du langage humain pour résoudre des problèmes complexes et créer des solutions innovantes. • Concevoir, développer et mettre en œuvre des algorithmes et modèles de pointe dans le domaine des modèles de langage. • Concrétiser de nouvelles fonctionnalités basées sur l'IA dans des domaines tels que l'aide à la décision, la planification de mission et l'automatisation de flux de travail. • Entraîner et optimiser des grands modèles de langage en utilisant d'importants volumes de données textuelles, en garantissant performance et précision. • Réaliser des tâches de prétraitement des données telles que la tokenisation, le stemming, la lemmatisation et la normalisation pour préparer les jeux de données pour l'entraînement et l'évaluation. • Se tenir informé des dernières avancées en LLM et en traitement du langage naturel (NLP) et appliquer de nouvelles techniques pour améliorer les modèles existants et développer de nouvelles solutions. • Collaborer étroitement avec les data engineers, développeurs logiciels, product managers et autres parties prenantes pour comprendre les besoins des projets et livrer des solutions efficaces. • Évaluer la performance des modèles à l'aide de métriques et de techniques appropriées et améliorer itérativement leur précision et leur efficacité. • Travailler avec les équipes d'ingénierie pour déployer les modèles en environnements de production et assurer leur robustesse et leur scalabilité. • Maintenir une documentation complète des modèles, algorithmes et processus pour référence future et reproductibilité.

🎯 Exigences

• Licence ou Master en informatique, data science ou domaine connexe. Un doctorat (PhD) est un plus. • Au moins 3 ans d'expérience en data science, avec un accent sur les grands modèles de langage et le NLP. • Solides compétences en programmation Python, avec expérience des bibliothèques NLP et LLM telles que spaCy, Hugging Face (Transformers, Datasets, PEFT, TRL) et des principales familles de modèles (par ex. GPT, Claude, Gemini, Llama, Mistral, Qwen, Gemma), via API et poids ouverts. • Maîtrise des frameworks de deep learning, principalement PyTorch (Keras/TensorFlow en complément), et familiarité avec l'optimisation d'inférence (quantisation, TensorRT-LLM). • Expérience du prétraitement, de la curation et de la tokenisation pour des charges de travail LLM, incluant la construction et le nettoyage de jeux de données pour le fine-tuning et la recherche (chunking, embeddings, déduplication, génération de données synthétiques). • Bonne compréhension des architectures Transformer et du mécanisme d'attention, avec connaissance opérationnelle des techniques de fine-tuning et d'alignement (full fine-tuning, LoRA/QLoRA, instruction tuning, RLHF/DPO). • La connaissance des RNN et CNN est un plus mais n'est pas une exigence principale. • Expérience de l'entraînement et du fine-tuning de LLMs et de la création de systèmes RAG et basés sur des agents, y compris les frameworks d'orchestration (LangChain, LlamaIndex, LangGraph), les bases vectorielles (par ex. Qdrant, Weaviate, pgvector) et le tool/function calling. • Expérience des outils d'expérimentation et de suivi : notebooks Jupyter ainsi que le suivi d'expériences et de prompts (MLflow, Weights & Biases) et l'évaluation de LLM (par ex. Ragas, LangSmith/Langfuse, bancs d'évaluation personnalisés). • Connaissance des plateformes cloud (AWS, Azure, Google Cloud) et de leurs services IA, avec un focus sur Google Cloud (Vertex AI, model garden, managed endpoints). • Expérience du déploiement en production de LLM auto-hébergés et à poids ouverts, en utilisant des frameworks de serving tels que vLLM, TGI, Ollama ou llama.cpp, avec une bonne connaissance du dimensionnement GPU, des formats de quantisation (GGUF, AWQ, GPTQ) et des contraintes on-premise ou air-gapped. • Connaissance opérationnelle des pratiques MLOps/LLMOps et DevOps : Git, CI/CD, containerisation (Docker, Kubernetes), ainsi que télémétrie, monitoring et observabilité pour la performance des modèles et de l'inférence. • Excellentes capacités analytiques et de résolution de problèmes, avec la capacité de concevoir des solutions innovantes à des problèmes complexes. • Expérience ou sensibilité aux enjeux d'éthique de l'IA, d'équité et de stratégies d'atténuation des biais dans le contexte du NLP et des LLM. • Excellentes compétences en communication orale et écrite, avec la capacité d'expliquer des concepts techniques complexes à des interlocuteurs non techniques. • Capacité à travailler efficacement au sein d'équipes transverses et pluridisciplinaires. • Grande attention aux détails et engagement à garantir la précision et la qualité du travail. • Capacité à évoluer dans un environnement dynamique et à gérer plusieurs projets simultanément.

🏖️ Avantages

• Un excellent environnement de travail et une opportunité d'avoir un impact réel dans le monde • Une entreprise d'ingénierie véritablement high-tech et à la pointe, avec une structure plate et sans politique interne • Travailler avec les toutes dernières technologies en Data & IA, y compris Edge AI et Swarming — tant au sein de nos plateformes logicielles que dans nos systèmes embarqués à bord • Modalités de travail flexibles • Opportunités de développement professionnel • Environnement de travail collaboratif et inclusif • Rémunération en adéquation avec le niveau d'expérience démontré

Postuler Maintenant

Emplois Similaires

🕒 il y a 28 jours

BlueThrone

51 - 200

👥 B2C

Responsable Analytics pilotant la mesure et l'analytics pour le portefeuille d'applications mobiles rentables de BlueThrone. Dirige les analyses opérationnelles, l'équipe BI et les partenariats transverses pour optimiser la performance.

🌏 N'importe où dans le monde

💰 Seed en 2022-04

⏰ Temps Plein

🟠 Senior

📊 Data Scientist

🗣️🇺🇸🇬🇧 Anglais requis