Retour

Tracking et prédiction du prix du carburant

PySparkMachine LearningBig DataGeoPandasScikit-Learn

Objectifs

Analyser et modéliser les variations des prix des carburants en France sur la période 2019-2021. Collecter et intégrer trois sources de données (Prix, Stations, Services), créer des indices de prix normalisés et prédire les prix futurs.

Méthodes & Analyse

Traitement efficace de plus de 11 millions d'enregistrements avec Spark. Développement d'une fonction custom Dataloader, nettoyage contextuel, et création de features complexes comme l'indice de prix normalisé via des fenêtres glissantes temporelles.

Mon Rôle

Data Engineer & Data Scientist

Résultats & Commentaires

Infrastructure analytique big data solide avec des visualisations géospatiales. Les modèles (Random Forest, Regression) ont permis d'identifier des tendances structurelles claires (ex: chute du gazole en 2020 de 11.4%, hausse en 2021 de 13.1%).

Voir le Projet