Cynthia Fonderson
15. Juillet 2021

Enquête sur les changements dans le bonheur global suite à la pandémie de COVID-19

Posté le 15. Juillet 2021  •  3 minutes  • 505 mots

À la suite de mon projet d’analyse de données sur l’impact mondial de la pandémie, j’ai voulu voir si le bonheur mondial était également affecté par le virus.

L’ensemble des données utilisé dans ce projet contient des données actualisées du World Happiness Report et réalisée par l’utilisateur Kaggle mathurinache. Les données ont été collectées sur une période de 8 ans (2015 à 2022).

Plan du projet

  1. Ingestion et nettoyage des données
  2. Analyse et visualisation des données exploratoires
  3. Prédiction du score de bonheur par régression
  4. Analyse de regroupement basée sur les facteurs affectant le bonheur
  5. Résumé

Résumé et conclusions du projet

Curation des données

Après l’ingestion et le nettoyage des données, le jeu de données contenait 10 colonnes et ~1300 enregistrements.

Variables Description
Year Année de référence
Country Pays
Happiness Score Note de bonheur
Economy (GDP per Capita) Score basé sur le bénéfice intérieur brut du pays
Family Score basé sur les systèmes de soutien social du pays
Health (Life Expectancy) Score basé sur l’espérance de vie du pays
Freedom Score basé sur la liberté du citoyen de faire ses choix de vie
Trust (Government Corruption) Score basé sur la perception par le citoyen de la corruption au sein du gouvernement
Generosity Score basé sur la perception de la générosité par les citoyens
Happiness Rank Les performances globales du pays par rapport aux autres nations



Exploration et analyse des données

Pour étudier les différences dans le bonheur mondial avant et après la pandémie, j’ai divisé l’ensemble de données en deux périodes (pré : 2015 à 2018 et post : 2019 à 2022). Globalement, aucun changement significatif n’a été observé dans le classement du bonheur entre les deux périodes. ranks

corr_mat

En général, les pays développés, dont les États-Unis, le Canada, l’Australie et les pays scandinaves (Norvège, Finlande) ont obtenu les scores de bonheur les plus élevés du monde. En revanche, les pays du tiers monde, notamment les nations africaines, seraient les moins heureux du monde. happiness

Regression and Clustering Analysis

Après l’EDA, j’ai évalué la performance de cinq modèles de régression pour prédire le score de bonheur d’une nation en fonction de son économie, et d’autres facteurs
.

Results:

Model Précision (%)
LinearRegression 77.1
SVR 79.5
DecisionTreeRegressor 54.6
RandomForestRegressor 78.4
MLPRegressor 72.2

Dans l’ensemble, les modèles SVR et Random Forest ont obtenu de meilleurs résultats que les autres modèles de régression avec des précisions de prédiction de ~80%. Le régresseur Decision Tree a obtenu des résultats médiocres par rapport aux autres modèles, avec une précision de ~55 %.

J’ai également voulu mettre en évidence les caractéristiques qui séparent les pays “heureux” des autres nations du monde. J’ai donc effectué une analyse de regroupement sur l’ensemble des données à l’aide de l’algorithme KMeans. Il est intéressant de noter que le bonheur global est fortement corrélé avec le PIB d’un pays, qui à son tour influence d’autres facteurs pris en compte, notamment l’espérance de vie et la générosité. Il est donc probable qu’il existe un biais dans la façon dont nous, les humains, déterminons le bonheur à l’échelle mondiale. clusters

Projet complet

Contact me / Contactez-moi

I work on everything data / J'aime tout ce qui concerne la science des données.