Skip to main content

Stage Détection avancée de fraude par analyse de séries temporelles et IA hybride

Job ID REF37295E Date posted 12/12/2024 Location France Category Technical expertise, R&D, Laboratory

Stage Détection avancée de fraude par analyse de séries temporelles et IA hybride

Le groupe Veolia est la référence mondiale de la gestion optimisée des ressources. Présent sur les 5 continents avec 220 000 salariés, le Groupe conçoit et déploie des solutions utiles et concrètes pour la gestion de l'eau, des déchets et de l'énergie.  L'économie des   ressources est un enjeu majeur des prochaines années.  La gestion des déchets, aujourd’hui, c'est   46 millions d'habitants desservis, 61 millions de tonnes de déchets traités, 533 759 entreprises clientes, 823 unités de traitement exploitées. Notre expertise dans la  gestion des déchets nous permet de collecter, trier, traiter et valoriser chaque année des   millions   de tonnes de déchets ménagers et industriels. Nous développons des filières de valorisation qui permettent de réintroduire ces déchets dans de nouveaux cycles de consommation ou de production devenant ainsi de nouvelles ressources.

Objectifs

Dans le cadre d'un projet innovant de détection de fraude basé sur l'analyse de consommation multifluide, nous cherchons à améliorer notre modèle existant. L'objectif de ce stage est de développer et d'intégrer un modèle de détection d'anomalies spécialisé dans l'analyse de séries temporelles de consommation, puis de le combiner avec notre modèle supervisé actuel pour créer une solution hybride performante.

Votre mission sera de concevoir, implémenter et optimiser cette approche, en utilisant des techniques de pointe en machine learning et en analyse de séries temporelles. Vous travaillerez sur des données réelles de consommation, avec pour défi d'identifier efficacement les patterns anormaux indicateurs de fraude potentielle dans un contexte où la gestion des incertitudes et la précision des prédictions sont cruciales.
 

Missions principales

  • Appropriation du contexte du projet et des enjeux spécifiques à la détection de fraude sur données de consommation ;

  • Analyse approfondie des séries temporelles de consommation multifluide ;

  • Recherche et implémentation d'algorithmes de détection d'anomalies adaptés aux séries temporelles

  • Développement d'un modèle non supervisé spécialisé dans la détection d'anomalies sur les profils de consommation temporels ;

  • Intégration du modèle de détection d'anomalies avec le modèle supervisé existant pour créer une solution hybride ;

  • Évaluation comparative des performances entre l'approche existante et la nouvelle approche hybride ;

  • Optimisation fine des modèles pour maximiser la précision de détection tout en minimisant les faux positifs ;

  • Documentation détaillée de l'approche et présentation des résultats à l'équipe projet.

Formation

Niveau Bac+5 (université ou école d'ingénieur) :

en data science, machine learning, et/ou mathématiques appliquées.

 

Vos compétences 

Vous possédez :

  • Une solide expérience en machine learning, particulièrement dans les techniques avancées de détection d'anomalies et l'analyse de séries temporelles ;

  • Des compétences avancées en programmation Python et dans l'utilisation des bibliothèques de data science (Numpy, Pandas, Scikit-learn, etc.) ;

  • Des compétences approfondies en deep learning, notamment dans l'implémentation et l'optimisation de modèles complexes comme les Transformers et les GAN pour les séries temporelles ;

  • Une maîtrise des frameworks de deep learning (TensorFlow, PyTorch, Keras) et une capacité à implémenter des architectures de réseaux de neurones avancées ;

  • Une connaissance des dernières avancées en matière de modèles de détection d'anomalies pour les séries temporelles, y compris les approches basées sur l'attention et les modèles génératifs ;

  • Une familiarité avec les outils de versioning (Git) et les environnements de développement collaboratif ;

  • Des capacités à travailler avec des bases de données et à effectuer des requêtes SQL ;

  • Une aisance dans la visualisation de données et la création de dashboards ;

  • Des compétences en communication pour présenter efficacement les résultats techniques à un public non-technique.

 

Vos qualités, votre savoir-être

Vous êtes : 

  • Passionné(e) par l'application de techniques avancées de machine learning et d'analyse de séries temporelles à des problématiques concrètes ;

  • Capable de penser de manière créative pour adapter les algorithmes existants aux spécificités des données de consommation ;

  • Doté(e) d'un esprit analytique pointu, avec une capacité à identifier des patterns subtils dans les données temporelles ;

  • Capable de suivre, comprendre et implémenter rapidement les dernières avancées en matière de détection d'anomalies dans les séries temporelles publiées dans la littérature scientifique ;

  • Capable de communiquer clairement vos idées et vos résultats, en mettant l'accent sur l'interprétabilité des modèles ;

  • Motivé(e) par les enjeux éthiques liés à la détection de fraude et conscient(e) de l'impact potentiel de vos analyses.

En tant qu'entreprise inclusive, Veolia s’engage pour la diversité et accorde la même considération à toutes les candidatures, sans discrimination.