Chez MP Data, nous sommes une équipe passionnée d'experts en données, spécialisée dans l'acquisition, le traitement et la valorisation des données pour nos clients industriels. Depuis 2015, nous mettons notre savoir-faire technique et notre engagement au service de missions et de projets pour les grands groupes. Notre approche repose sur les valeurs d'Excellence, de Partage et d'Engagement.
Suite à la forte croissance de MP Data et une forte demande de nos clients en Belgique nous recherchons un(e) Data Engineer pour rejoindre notre équipe à Liège.
Votre role :
* Pipeline Engineering : Concevoir, développer et optimiser des pipelines de données (ETL/ELT) massifs et performants en utilisant principalement Python et PySpark.
* Orchestration : Mettre en place et maintenir des workflows robustes avec Apache Airflow pour garantir l'automatisation et la fiabilité de l'ensemble de la chaîne de données.
* Architecture Data Mesh : Contribuer activement à la migration et à l'évolution de notre plateforme vers un modèle Data Mesh, en assurant que les données sont traitées comme des produits de haute qualité.
* Cloud AWS : Gérer les services de stockage et de calcul sur notre infrastructure AWS (notamment S3).
* Qualité & Robustesse : Assurer la fiabilité du code par l'implémentation rigoureuse de tests unitaires et des mécanismes de contrôle de qualité des données.