Objective The data {rsample} Grouped and stratified train/test split and resamples {doMC} Set up parallel processing Logistic Regression with formula pre-processor Reproducing “non-tidymodels” specs in tidymodels GLM (unweighted) GLM (weighted) GAM (with splines) (weighted) XGBoost (weighted) lightgbm (unweighted) lightgbm weighted (not implemented in tidymodels) Use workflow_set to fit all logitics models specification on all resamples Add hyperparameter tuning to the workflow_set Logistic Regression with recipe pre-processor Tweedie regression Estimate tweedie “p” parameter Reproducing “non-tidymodels” specs in tidymodels GLM weighted GAM (with splines) weighted XGBoost weighted TODO: Poisson regression Reproducing “non-tidymodels” specs in tidymodels GLM weighted GAM (with splines) weighted xgboost weighted TODO: Gamma regression resources Objective I want to implement a tweedie regression similar to what one would face in the insurance industry using the {tidymodels} ecosystem.
Aujourd’hui, on vous annonce deux nouveaux outils fiscaux qui ne s’appliqueront qu’aux gens ayant plus d’un million de dollars d’actifs nets: un impôt sur les grandes fortunes et un impôt sur les grandes successions. #qc2022
— Gabriel Nadeau-Dubois (@GNadeauDubois) September 6, 2022 Résultat des courses: 95% des Québécois ne paieront rien de plus. Le 5% le plus riche devra payer un peu plus. Ce n’est pas un impôt sur les riches, c’est un impôt sur les ultra-riches.
Données annuelles aggrégées Évolution du don moyen
## [1] "/home/simon/git/snippets/content/post/2022-09-05-regardons-donc-les-dons/output/evolution_des_dons.png" Données annuelles par circonscriptions Rétention et attraction Rétention: Quel est le pourcentage de donateurs qui de 2021 qui ont aussi donné en 2022 ? Attraction: Quel est le pourcentage des donateurs de 2022 qui n’avaient pas donné en 2021 ?
## # A tibble: 5 × 7 ## entite_politique pct_retention pct_nouveau total_donneurs_… don_2021_seul ## <chr> <dbl> <dbl> <int> <int> ## 1 Québec solidaire 0.