Enquête sur les changements dans le bonheur global suite à la pandémie de COVID-19
Posté le 15. Juillet 2021 • 3 minutes • 505 mots
À la suite de mon projet d’analyse de données sur l’impact mondial de la pandémie, j’ai voulu voir si le bonheur mondial était également affecté par le virus.
L’ensemble des données
utilisé dans ce projet contient des données actualisées du World Happiness Report
et réalisée par l’utilisateur Kaggle mathurinache
. Les données ont été collectées sur une période de 8 ans (2015 à 2022).
Plan du projet
- Ingestion et nettoyage des données
- Analyse et visualisation des données exploratoires
- Prédiction du score de bonheur par régression
- Analyse de regroupement basée sur les facteurs affectant le bonheur
- Résumé
Résumé et conclusions du projet
Curation des données
Après l’ingestion et le nettoyage des données, le jeu de données contenait 10 colonnes et ~1300 enregistrements.
Variables | Description |
---|---|
Year | Année de référence |
Country | Pays |
Happiness Score | Note de bonheur |
Economy (GDP per Capita) | Score basé sur le bénéfice intérieur brut du pays |
Family | Score basé sur les systèmes de soutien social du pays |
Health (Life Expectancy) | Score basé sur l’espérance de vie du pays |
Freedom | Score basé sur la liberté du citoyen de faire ses choix de vie |
Trust (Government Corruption) | Score basé sur la perception par le citoyen de la corruption au sein du gouvernement |
Generosity | Score basé sur la perception de la générosité par les citoyens |
Happiness Rank | Les performances globales du pays par rapport aux autres nations |
Exploration et analyse des données
Pour étudier les différences dans le bonheur mondial avant et après la pandémie, j’ai divisé l’ensemble de données en deux périodes (pré : 2015 à 2018 et post : 2019 à 2022). Globalement, aucun changement significatif n’a été observé dans le classement du bonheur entre les deux périodes.
En général, les pays développés, dont les États-Unis, le Canada, l’Australie et les pays scandinaves (Norvège, Finlande) ont obtenu les scores de bonheur les plus élevés du monde. En revanche, les pays du tiers monde, notamment les nations africaines, seraient les moins heureux du monde.
Regression and Clustering Analysis
Après l’EDA, j’ai évalué la performance de cinq modèles de régression pour prédire le score de bonheur d’une nation en fonction de son économie, et d’autres facteurs
.
Results:
Model | Précision (%) |
---|---|
LinearRegression | 77.1 |
SVR | 79.5 |
DecisionTreeRegressor | 54.6 |
RandomForestRegressor | 78.4 |
MLPRegressor | 72.2 |
Dans l’ensemble, les modèles SVR et Random Forest ont obtenu de meilleurs résultats que les autres modèles de régression avec des précisions de prédiction de ~80%. Le régresseur Decision Tree a obtenu des résultats médiocres par rapport aux autres modèles, avec une précision de ~55 %.
J’ai également voulu mettre en évidence les caractéristiques qui séparent les pays “heureux” des autres nations du monde. J’ai donc effectué une analyse de regroupement sur l’ensemble des données à l’aide de l’algorithme KMeans. Il est intéressant de noter que le bonheur global est fortement corrélé avec le PIB d’un pays, qui à son tour influence d’autres facteurs pris en compte, notamment l’espérance de vie et la générosité. Il est donc probable qu’il existe un biais dans la façon dont nous, les humains, déterminons le bonheur à l’échelle mondiale.