Pendant cette formation, nous utiliserons le jeu de données du recensement de la population de Nouvelle-Calédonie. Ainsi, les exemples vous serons parlants, et nous pourrons créer des fonctions ,figures, etc, que vous pourrez recycler plus tard !
Voici ce qu’on peut lire sur le site de l’ISEE à propos des données du recensement :
Ces jeux de données anonymisées au format .csv permettent aux utilisateurs avertis un usage personnalisé des données du recensement de la population : analyses exploratoires de données ; modélisation des comportements ; tabulation sur une sous-population particulière…
here() starts at D:/utils/noe.barthelemy/Bureau/Formation_R_Quarto/01_code
Rows: 18353 Columns: 43
── Column specification ────────────────────────────────────────────────────────
Delimiter: ";"
chr (7): APE, DIPL, PROV, PROVRA, PROVTRA, SECT10, SECT21
dbl (35): ID, IDLOG, AGEA, AGER, ANNINS, CNAT, COUPLE, CPAYSN, CS24, CS42, C...
lgl (1): CPAYSRA
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Voyons voir ce que ça donne pour la Province des Îles :
head(RP2019NC_OD_ind_Iles)
# A tibble: 6 × 43
ID IDLOG AGEA AGER ANNINS APE CNAT COUPLE CPAYSN CPAYSRA CS24 CS42
<dbl> <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <lgl> <dbl> <dbl>
1 14 84903 34 34 NA <NA> NA 1 NA NA 61 63
2 19 24049 13 12 NA <NA> NA NA NA NA NA NA
3 82 23420 1 0 NA <NA> NA NA NA NA NA NA
4 86 21287 1 0 NA <NA> NA NA NA NA NA NA
5 99 59443 17 17 NA <NA> NA 2 NA NA NA NA
6 106 98101 54 54 NA <NA> NA 1 NA NA NA NA
# ℹ 31 more variables: CS8 <dbl>, CSSAL <dbl>, DIPL <chr>, EMPL <dbl>,
# EXER <dbl>, GAD <dbl>, GAQ <dbl>, GENRE <dbl>, ILN <dbl>, IRA <dbl>,
# MINE <dbl>, NAT <dbl>, PROV <chr>, PROVRA <chr>, PROVTRA <chr>, RECH <dbl>,
# SAL <dbl>, SCOL <dbl>, SECT10 <chr>, SECT21 <chr>, SECT5 <dbl>, STAT <dbl>,
# STATANT <dbl>, STM <dbl>, TACT <dbl>, TP <dbl>, TRAANT <dbl>, TRANS <dbl>,
# TYP <dbl>, TYPEMPL <dbl>, TYPMENR <dbl>
Ok, on dirait qu’on aura besoin d’un dictionnaire de variables. Le voici :
Et voici le bulletin individuel rempli par nos concitoyens, bien généreux de nous avoir fourni toutes ces informations:
Voila, on n’a plus qu’à analyser tout ça …
AVERTISSEMENT : En application de l’arrêté du 10 septembre 2021 relatif à la diffusion des résultats du recensement de la population de Nouvelle-Calédonie de 2019, les lieux d’habitation et de travail que ces fichiers contiennent ne sont donnés qu’au niveau de localisation de la province. En outre, ces fichiers ne comportent pas les données des questions 6, 7 et 8 du bulletin individuel relatives à la communauté et à la tribu d’appartenance des personnes.