Explorateur du marché de l'emploi
Analyse des offres d'emploi pour une meilleure compréhension du marché du travail
Pourquoi ce projet ?
Avoir marre de dix-mille fenêtres ouvertes sur mon navigateur pour chercher des offres d'emploi, c'est le point de départ de ce projet. J'ai voulu créer un outil qui me permette de centraliser, analyser et visualiser les offres d'emploi de manière efficace.
L'objectif est de mieux comprendre les tendances du marché du travail, d'identifier les compétences recherchées, et de faciliter la recherche d'emploi. Ce projet est aussi un support pour monter en compétences en data engineering, API, web scraping et déploiement cloud.
Ce que j'ai fait concrètement
- Collecte automatisée d'offres d'emploi via l'API France Travail
- Collecte complémentaire d'offres via web scraping (Welcome to the Jungle)
- Nettoyage, normalisation et structuration des données brutes
- Conception d'un schéma relationnel PostgreSQL pour le stockage des données
- Mise en place d'un pipeline d'ingestion reproductible (Python → PostgreSQL)
- Production d'indicateurs analytiques et de visualisations : volumétrie des offres, dynamiques territoriales, compétences dominantes, bornes salariales, cartographie des emplois et rapprochement de métiers par similarité sémantique
- Développement d'un tableau de bord interactif pour l'exploration du marché de l'emploi
Compétences mobilisées
Data engineering
- Collecte de données via API (France Travail)
- Web scraping ciblé (Welcome to the Jungle)
- Nettoyage, normalisation et contrôle qualité des données (Python)
- Modélisation relationnelle et contraintes d'intégrité (PostgreSQL)
- Pipelines d'ingestion reproductibles et versionnés
Back-end, API & déploiement
- Développement d'une API REST avec Django REST Framework
- Conteneurisation de l'application avec Docker
- Connexion à une base PostgreSQL hébergée (Supabase)
- Déploiement de services sur le cloud (Render)
Analyse, visualisation
- Analyse exploratoire et indicateurs du marché de l'emploi (Pandas)
- Visualisations interactives et cartographie (Plotly)
- Application analytique avec Streamlit
- Documentation technique du projet avec Sphinx
Ressources
© Linh Dinh, 2026