Evaluation de la qualité des données sur la fécondité récente tirées des recensements
Introduction
Avant d’évaluer la qualité des données sur la fécondité récente recueillies dans un recensement, il importe d’examiner le libellé précis des questions utilisées pour saisir l’information sur les naissances récentes en consultant le questionnaire. Des questions très différentes ont été utilisées au gré des pays et des vagues successives de recensements. La formulation peut affecter la validité des estimations et le sens et l’ampleur des biais ou des erreurs dans les données.
Les formes génériques des questions sur la fécondité récente dans les recensements appartiennent à trois grandes catégories :
- Avez-vous donné naissance à un enfant au cours de la dernière année (ou une autre période de référence) ?
Cette question produit une réponse binaire simple. Les naissances multiples au cours de la même période de référence ne sont pas saisies. Celles-ci peuvent résulter soit de la naissance de jumeaux ou de triplés lors d’une seule grossesse soit d’un très court intervalle séparant deux grossesses différentes. Aucune de ces éventualités n’est susceptible d’affecter substantiellement les taux fécondité car les intervalles entre naissances inférieurs à un an sont rares et la probabilité qu’une grossesse donne lieu à des naissances multiples est inférieure à 2 % dans la plupart des populations (à l’exception peut-être de l’Afrique sub-saharienne). Face à des données collectées sous cette forme, il est recommandé de faire l’hypothèse simplificatrice que toutes les naissances ont eu lieu au milieu de la période de référence, et que chaque grossesse ne donne lieu qu’à une naissance.
- A combien d’enfants avez-vous donné naissance au cours de l’année écoulée (ou de toute autre période de référence) ?
Cette question est plus raffinée que la précédente. Elle ne donne pas d’information sur le calendrier de la naissance au cours de la période de référence, mais elle saisit l’information sur les naissances multiples qu’aurait eues une femme, sans distinguer toutefois entre les jumeaux et les intervalles courts entre naissances. Cette fois encore, il est raisonnable pour les calculs de supposer que les naissances se sont produites à la mi-temps de la période de référence.
- Quelle a été la date de votre dernière naissance vivante ?
Cette question cherche à déterminer la date du dernier accouchement avec un plus grand degré de précision, même si, en général, seuls le mois et l’année de la dernière naissance sont enregistrés. S’il y a en outre des questions sur le nombre de naissances qui se sont produites à cette date, l’ensemble donne une information plus précise sur le nombre de naissances récentes.
D’autres questions sont parfois posées (par exemple, sur la survie du dernier né, son sexe ou la date de naissance de l’enfant précédent). On peut en tirer des estimations directes sur les taux de mortalité infantile par sexe ou le rapport de masculinité à la naissance, par exemple.
L’évaluation de la qualité des données sur la fécondité récente peut inclure les contrôles suivants :
- Comparaison du nombre total de naissances avec le nombre attendu (par exemple, avec les nombres tirés du système d’enregistrement à l’état civil ou de l’application d’une série précise de taux de fécondité par âge à la population recensée des femmes – bien que, dans ce cas, le sous-dénombrement systématique des femmes puisse aussi causer une sous-estimation des taux) ;
- Evaluation de la vraisemblance de la distribution des taux de fécondité par âge tirés directement des données. Des distributions plausibles de la fécondité par âge sont presque invariablement uni modales, concaves, légèrement asymétriques à droite, et proches de zéro aux deux âges extrêmes de la période féconde. La distribution doit également présenter une évolution raisonnablement régulière des taux de fécondité d’un âge à l’autre ;
- Contrôle de la vraisemblance des nombres déclarés de naissances dans la période de référence. Dans certains recensements (par exemple l’Afrique du sud 1996), une proportion significative de répondantes confondent les questions sur le nombre total d’enfants déjà nés et celles sur la fécondité récente et donnent la même réponse aux deux questions. Cette erreur se manifeste par une forte diagonale dans les tableaux croisés des nombres d’enfants déjà nés par les nombres d’enfants nés dans l’année écoulée par âge de la mère (Moultrie and Timæus 2002) ;
- Si les données ont été recueillies sur le sexe du dernier né, le rapport de masculinité à la naissance doit faire l’objet d’un contrôle. Le rapport de masculinité à la naissance est habituellement de l’ordre de 1,05, mais peut n’être que de 0,95 dans les populations africaines, et atteindre 1,1 dans certaines populations d’Asie. Des valeurs hors de l’intervalle 0,99-1,06 doivent être examinées soigneusement.
Dans tous les cas, il est indispensable d’identifier précisément l’univers des femmes à qui sont adressées les questions (en particulier les âges et l’état matrimonial des répondantes éligibles), ainsi que les règles d’enregistrement et de codage des non réponses et des données incorrectes.
Evaluation de la qualité des données sur la fécondité actuelle
Avant d’analyser les taux de fécondité par âge, il est recommandé d’évaluer dans quelle mesure les données sur les naissances récentes sont manquantes ou peu vraisemblables. L’absence de toute donnée manquante indique presque certainement que les données ont été corrigées. Si c’est le cas, d’autres recherches doivent porter sur l’ampleur des corrections et/ou des imputations dans la mesure du possible, par exemple, en examinant la distribution de valeurs imputées lorsque des étiquettes d’imputation ont été ajoutées aux données.
La proportion de données manquantes doit aussi être vérifiée. Si elle dépasse 5 % du nombre total des enregistrements permettant d’établir les données de fécondité actuelle, des recherches plus approfondies sont nécessaires. Il faut en particulier examiner la distribution par âge des cas manquants. Si ceux-ci sont concentrés aux jeunes âges ou chez les quadragénaires, on peut penser que les cas manquants correspondent à des femmes qui n’ont pas eu de naissance au cours de la période de référence, l’agent recenseur n’ayant pas enregistré de réponse au lieu d’indiquer zéro. C’est une erreur de même type que celle conduisant à la correction d’el Badry.
Quand les données donnent lieu à des tableaux par nombre de naissances dans la période de référence (plutôt que d’indiquer simplement si, oui ou non, une naissance a eu lieu au cours de la période de référence), on doit s’attacher aux nombres respectifs de naissances simples et multiples. En général, moins de 2 % des grossesses donnent naissance à plusieurs enfants. Les triplés et plus sont extrêmement rares (moins de 0,5 % des accouchements). Si la proportion de naissances multiples au cours de la période de référence semble trop élevée, il est recommandé d’établir des tableaux croisant le nombre total d’enfants déjà nés et les naissances au cours de l’année écoulée dans chaque groupe d’âge de femmes. Si le total d’enfants déjà nés et les naissances de l’année écoulée sont identiques dans une large proportion de cas, même pour des parités de deux ou plus, on peut penser que les personnes recensées ou les agents recenseurs n’ont pas compris la distinction entre les questions sur la descendance et sur la fécondité récente. Il se peut toutefois qu’une large proportion de jeunes femmes n’ayant qu’un enfant déjà né ait eu la naissance correspondante au cours de la période de référence, et une coïncidence fréquente entre des descendances d’un seul enfant et des déclarations d’une naissance récente par les jeunes femmes peut très bien ne pas indiquer des erreurs de déclaration.
Mesure directe de la fécondité à partir des données de recensement
Quand la qualité des données est suffisante, on peut estimer directement les taux de fécondité par âge. Quand la qualité des données est médiocre, les taux de fécondité par âge obtenus par calcul direct sont incorporés dans diverses méthodes visant à produire des estimations plus fiables du niveau de fécondité par recours à des techniques indirectes.
La forme exacte des taux de fécondité par âge qu’on peut calculer dépend de la nature des données recueillies. Un taux de fécondité par âge à un âge (ou dans un groupe d’âge) donné est le rapport du nombre de naissances des femmes de cet âge (dans ce groupe d’âge) dans une période définie au nombre de femmes-années vécues par les femmes du même âge (dans le même groupe d’âge) dans la même période. Pour que le calcul soit exact, il faut connaître de façon fiable les dates de naissance des mères (pour déterminer l’âge de la mère) et de leurs enfants. On peut alors calculer précisément l’âge de la mère à la naissance de son enfant, et allouer son exposition au risque aux âges ou groupes d’âge appropriés au long de la période couverte par la recherche.
Les données nécessaires pour ces calculs précis ne sont généralement pas disponibles dans les micro-données de recensement, soit parce que les dates complètes ne sont pas recueillies sur le terrain, soit parce qu’il y aurait un risque de violation de la confidentialité si les dates de naissance complètes étaient accessibles aux utilisateurs finaux des données. En outre, les données de recensement sont rarement de qualité suffisante pour justifier un tel surcroit de précision. L’attraction exercée par certains mois de naissance (par exemple janvier) ainsi que certaines années de naissance (par exemple celles finissant par 0 ou 5) pose fréquemment problème. Des périodes de dénombrement étendues peuvent créer des problèmes quand il s’agit de passer de la période de référence (par exemple les douze mois écoulés jusqu’à la date d’interview) à une période calendaire (par exemple 2008). En outre, les questions rétrospectives sur les naissances récentes posées dans un recensement excluent évidemment l’information relative aux naissances des mères qui sont décédées ou ont quitté le pays depuis leur accouchement.
Il y a quatre combinaisons possibles d’ informations essentielles relatives à la mère et aux naissances récentes (Tableau 1).
Tableau 1 Taxonomie des données relatives à la mère et aux enfants pour l’estimation de la fécondité récente
|
|
Informations sur la mère |
|
|
|
Age révolu au recensement |
Date de naissance
|
Information sur les enfants nés au cours de la période précédant le recensement(*) |
Nombre d’enfants nés
|
(1) |
(2) |
Date de naissance du
dernier né |
(3) |
(4) |
(*)En général la période précédant le recensement est de 12 mois, mais l’analyste doit être attentif à la possibilité de périodes non-standards, fondée par exemple sur le temps écoulé depuis un événement national important.
Même dans le cas (4) du tableau 1, qui repose sur les informations les plus détaillées, le souci de calculer précisément l’exposition au risque ne donne pas forcément des résultats garantis, du fait que l’attraction exercée par certains mois lors de la déclaration des dates et autres problèmes de qualité des données peuvent sévèrement altérer les estimations. Le recours à de simples approximations pour le calcul des taux de fécondité à partir des données de recensement est généralement suffisant. Dans la section sur la mesure directe de la fécondité à partir des données d’enquête [13], nous décrivons le calcul plus précis de l’exposition au risque et l’estimation des taux de fécondité à partir de données de bonne qualité.
Cas 1 et 2 : Estimation des taux de fécondité par âge directement à partir de données ne fournissant pas d’information sur la date de naissance de l’enfant
Dans les cas (1) et (2) du tableau 1, ce qui est connu sur la fécondité récente de la mère se limite au fait qu’elle a donné naissance (ou non) à au moins un enfant au cours de la période précédant le recensement. Dans des variantes plus informatives de la question sur la fécondité récente, la mère peut être interrogée sur le nombre de naissances vivantes qu’elle a eues dans la période précédant le recensement. Une telle question permet d’identifier à la fois les naissances multiples issues d’une même grossesse (jumeaux, triplés, etc.), et les cas où plus d’une grossesse arrive à son terme au cours de la période de référence.
Comme l’âge de la mère à l’accouchement n’est pas connu, l’approximation couramment utilisée consiste à classer les taux de fécondité selon l’âgé déclaré par la mère à la date du recensement. On fait alors l’hypothèse supplémentaire que les naissances ont toutes eu lieu au milieu de l’intervalle en question. Ceci signifie qu’au moment du recensement les mères sont, en moyenne, plus âgées de la moitié de la durée de l’intervalle. Il en résulte que les âges auxquels les taux de fécondité se réfèrent réellement sont plus jeunes que les âges des femmes déclarés au recensement. La plupart des méthodes standards d’estimation indirecte de la fécondité corrigent les âges de ce décalage.
L’information supplémentaire (sur le mois et l’année de naissance de la mère) dont on dispose dans le deuxième cas ne permet guère d’affiner les estimations de la fécondité car on continue d’avoir besoin d’hypothèses supplémentaires d’uniformité de la distribution des dates de naissance des enfants. Donc, dans le cas (2) comme dans le cas (1) du tableau 1, les taux de fécondité sont estimés en divisant le nombre de naissances déclarées au cours de la période de référence (classées par âge de la mère à la date du recensement) par le nombre de femmes de cet âge. Le nombre total de naissances au cours de la période de référence déclaré par les femmes âgées x à la date du recensement, Bx, est donné par
où k est le nombre déclaré de naissances au cours de la période de référence, ω est la valeur maximale de k dans les données et Nx,k est le nombre de femmes âgées de x au recensement déclarant avoir eu k naissances au cours de la dernière année. Si ω est exprimé comme un intervalle ouvert, par exemple 3 naissances ou plus au cours de la période de référence, les femmes dans cette catégorie sont supposées avoir eu le nombre de naissances qui ouvre cet intervalle (soit 3 naissances ici). L’erreur qui en résulte est de nouveau faible.
Le nombre de femmes âgées de x est donné par
Les femmes dont les naissances récentes ne sont pas connues ou n’ont pas été déclarées doivent être exclues à la fois du numérateur et du dénominateur, avec l’hypothèse implicite que leur fécondité ne diffère pas de celle des femmes dont la fécondité récente est connue. Les taux de fécondité par âge x sont égaux à
Dans l’intervalle d’âge conventionnel (de 15 ans à 49 ans, inclus), l’indice synthétique de fécondité (TF) calculé à partir des taux par année d’âge est égal à
L’indice synthétique de fécondité désigne le nombre d’enfants qu’une femme aurait si elle survivait jusqu’à 50 ans (considéré comme la fin de la période féconde) en ayant, au long de sa vie reproductive, les taux de fécondité par âge observés au cours de la période précédant immédiatement le recensement.
Il convient de calculer et de représenter graphiquement les taux de fécondité par année d’âge afin de vérifier la cohérence interne des données. Les taux de fécondité par âge sont en général moins erratiques que les numérateurs ou les dénominateurs eux-mêmes et ils peuvent indiquer des niveaux et des distributions vraisemblables de la fécondité. Une série de taux par âge fortement erratique, s’écartant fortement de la forme prévisible en n, laisse fortement supposer que les données de fécondité récente posent problème et invite à pousser les recherches plus avant.
Enfin on peut calculer des taux de fécondité par groupes d’âges quinquennaux, 5fx, où x = 15, 20,…, 45 :
où l’indice i est égal à i=(x/5) - 2. La mesure de l’indice synthétique de fécondité est donc
Alors que l’indice synthétique est une mesure de la fécondité standardisée par l’âge (la distribution par âge de la population féminine d’âge fécond étant supposée implicitement uniforme par groupe d’âge), le taux de fécondité de chaque groupe d’âge n’est pas standardisé au sein du groupe. Il peut en résulter un léger écart entre les indices synthétiques résultant respectivement d’un calcul par groupe d’âge et par année d’âge, mais cet écart ne porte généralement que sur la deuxième ou la troisième décimale.
L’indice synthétique de fécondité doit être comparé aux estimations tirées d’autres sources de données pour le même pays (par exemple des EDS). Il faut toutefois se souvenir que les taux de fécondité par âge et les indices synthétiques obtenus par cette méthode ne prennent pas en compte la vraie exposition au risque dans la détermination du dénominateur. En outre, le numérateur inclut des événements ayant eu lieu pendant la période de référence classés selon l’âge de la mère à la fin de celle-ci, et non par son âge au moment où l’événement a eu lieu. La plupart des méthodes d’estimation indirecte de la fécondité corrigent les taux de fécondité calculés pour tenir compte de ce décalage. Dans des comparaisons de base visant à évaluer les forme et le niveau des distributions de fécondité), les différences dans les classements par âge ont peu d’importance. La variante F-seulement du modèle relationnel de Gompertz offre toutefois une méthode pour ne pas décaler les taux de fécondité lors de leur lissage, si on le souhaite.
Exemple : Calcul direct de la fécondité
Au recensement de 2008 au Cambodge, les femmes ont été interrogées sur le nombre d’enfants qu’elles ont eu l’année précédente. L’âge des mères est l’âge à la date du recensement. Les données figurent au tableau 2.
Tableau 2 Fécondité récente par âge de la mère à la date du recensement, Cambodge, recensement de 2008.
|
Naissances au cours de l’année précédente |
|
|
|
|||||
Age |
0 |
1 |
2 |
3 |
4 |
Manquant |
Naissances |
Femmes |
Taux* |
15 |
160 980 |
120 |
0 |
0 |
0 |
80 |
120 |
161 180 |
0,0007 |
16 |
152 710 |
500 |
0 |
0 |
0 |
50 |
500 |
153 260 |
0,0033 |
17 |
144 970 |
1 250 |
10 |
10 |
0 |
20 |
1 300 |
146 260 |
0,0089 |
18 |
182 500 |
3 540 |
20 |
0 |
0 |
40 |
3 580 |
186 100 |
0,0192 |
19 |
127 840 |
5 640 |
10 |
0 |
0 |
30 |
5 660 |
133 520 |
0,0424 |
20 |
147 990 |
8 840 |
80 |
0 |
0 |
90 |
9 000 |
157 000 |
0,0574 |
21 |
123 960 |
9 500 |
30 |
0 |
0 |
70 |
9 560 |
133 560 |
0,0716 |
22 |
126 030 |
11 600 |
80 |
0 |
0 |
30 |
11 760 |
137 740 |
0,0854 |
23 |
123 750 |
11 830 |
70 |
10 |
0 |
110 |
12 000 |
135 770 |
0,0885 |
24 |
121 820 |
11 010 |
150 |
10 |
20 |
80 |
11 420 |
133 090 |
0,0859 |
25 |
137 460 |
12 420 |
100 |
0 |
0 |
60 |
12 620 |
150 040 |
0,0841 |
26 |
115 370 |
11 320 |
110 |
0 |
0 |
80 |
11 540 |
126 880 |
0,0910 |
27 |
117 840 |
11 580 |
190 |
0 |
0 |
40 |
11 960 |
129 650 |
0,0923 |
28 |
118 270 |
10 690 |
110 |
0 |
10 |
30 |
10 950 |
129 110 |
0,0848 |
29 |
82 990 |
7 600 |
120 |
0 |
0 |
40 |
7 840 |
90 750 |
0,0864 |
30 |
77 690 |
5 950 |
40 |
10 |
0 |
30 |
6 060 |
83 720 |
0,0724 |
31 |
58 800 |
4 820 |
50 |
20 |
0 |
30 |
4 980 |
63 720 |
0,0782 |
32 |
67 110 |
4 480 |
150 |
20 |
0 |
110 |
4 840 |
71 870 |
0,0674 |
33 |
67 080 |
4 240 |
40 |
0 |
0 |
50 |
4 320 |
71 410 |
0,0605 |
34 |
67 010 |
3 800 |
30 |
10 |
10 |
70 |
3 930 |
70 930 |
0,0555 |
35 |
90 720 |
4 570 |
60 |
20 |
0 |
30 |
4 750 |
95 400 |
0,0498 |
36 |
77 950 |
3 800 |
10 |
10 |
0 |
30 |
3 850 |
81 800 |
0,0471 |
37 |
81 320 |
4 070 |
50 |
10 |
10 |
10 |
4 240 |
85 470 |
0,0496 |
38 |
92 290 |
3 780 |
30 |
20 |
30 |
30 |
4 020 |
96 180 |
0,0418 |
39 |
74 030 |
2 920 |
50 |
0 |
0 |
30 |
3 020 |
77 030 |
0,0392 |
40 |
88 940 |
2 720 |
70 |
10 |
10 |
50 |
2 930 |
91 800 |
0,0319 |
41 |
71 250 |
2 140 |
0 |
0 |
0 |
20 |
2 140 |
73 410 |
0,0292 |
42 |
81 560 |
2 010 |
30 |
0 |
0 |
60 |
2 070 |
83 660 |
0,0248 |
43 |
72 930 |
1 270 |
10 |
0 |
0 |
30 |
1 290 |
74 240 |
0,0174 |
44 |
69 660 |
930 |
10 |
0 |
0 |
50 |
950 |
70 650 |
0,0135 |
45 |
84 290 |
760 |
30 |
10 |
10 |
30 |
890 |
85 130 |
0,0105 |
46 |
67 330 |
510 |
0 |
50 |
30 |
40 |
780 |
67 960 |
0,0115 |
47 |
66 220 |
270 |
10 |
0 |
10 |
0 |
330 |
66 510 |
0,0050 |
48 |
74 790 |
310 |
10 |
10 |
0 |
30 |
360 |
75 150 |
0,0048 |
49 |
57 600 |
120 |
0 |
20 |
10 |
20 |
220 |
57 770 |
0,0038 |
TOTAL |
3 473 050 |
170 910 |
1 760 |
250 |
150 |
1 600 |
175 780 |
3 647 720 |
1,6157 |
* Taux de fécondité par âge |
La colonne « Manquant » indique que seulement 1 600 femmes sur près de 3,65 millions âgées entre 15 et 49 ans n’ont pas eu leur fécondité récente enregistrée. Ceci représente 0,04 % de l’ensemble des femmes et n’aura pas d’impact sur la fécondité estimée des femmes au Cambodge. Un contrôle supplémentaire portant sur la distribution par âge de ces cas ne fait pas apparaître de schéma particulier d’omission. Le nombre de naissances est égal à la somme pondérée des femmes déclarant 1, 2, 3 ou 4 accouchements, sur la dernière ligne. 173 070 femmes (170 910 + 1 760 + 250 + 150) ont eu un total de 175 780 naissances (1x170 910 + 2×1 760 + 3×250 + 4×150) au cours de l’année précédant le recensement. Parmi ces femmes, 98,8 % (170 910 / 173 070) ont eu une seule naissance, 1,0 % ont eu des jumeaux et 0,2 % des triplés ou plus. L’éventualité de quintuplés (ou de cinq naissances en deux accouchements au cours de la période) est si faible qu’elle peut être ignorée. Si le recensement n’avait pas comptabilisé les naissances multiples séparément, le taux brut de natalité aurait été sous-estimé par un facteur de 173 070/175 780 = 0,984. La sous-estimation est donc de 1,6 %.
A partir des données ci-dessus, la série des taux de fécondité par année d’âge est obtenue en divisant le nombre total de naissances issues des femmes de chaque âge par le nombre de femmes ayant déclaré leur fécondité récente, c’est-à-dire en excluant les femmes qui n’ont pas déclaré combien de naissances elles ont eu au cours de l’année passée. Les taux sont représentés sur la figure 1. Alors que le nombre de femmes dénombrées à chaque âge est erratique, les taux de fécondité par année d’âge sont relativement lisses, avec un schéma de fécondité clairement défini et un pic caractéristique aux environs de 25 ans.
Selon ces données, l’indice synthétique de fécondité est de 1,61 enfants par femme. Le calcul conduit par groupes d’âges quinquennaux donne le même résultat (tableau 3), même si les mesures diffèrent à la troisième décimale, comme on l’a évoqué plus haut.
Tableau 3 Taux de fécondité par groupes d’âge quinquennaux, Cambodge, recensement de 2008 et Enquêtes Démographiques et de Santé 2005 et 2010
Groupe d’âge |
Femmes |
Manquant |
Naissances |
Taux |
|
EDS2005 |
EDS2010 |
15-19 |
780 320 |
220 |
11 160 |
0,014 |
|
0,047 |
0,046 |
20-24 |
697 160 |
380 |
53 740 |
0,077 |
|
0,175 |
0,173 |
25-29 |
626 430 |
250 |
54 910 |
0,088 |
|
0,180 |
0,167 |
30-34 |
361 650 |
290 |
24 130 |
0,067 |
|
0,142 |
0,121 |
35-39 |
435 880 |
130 |
19 880 |
0,046 |
|
0,091 |
0,071 |
40-44 |
393 760 |
210 |
9 380 |
0,024 |
|
0,041 |
0,028 |
45-49 |
352 520 |
120 |
2 580 |
0,007 |
|
0,005 |
0,004 |
TF |
|
|
1,61 |
|
3,41 |
3,05 |
|
Source: Recensement, nos calculs ; EDS, StatCompiler (www.statcompiler.com) |
Même en l’absence de contrôle externe, les résultats tirés des données du recensement de 2008 font apparaître des niveaux de fécondité invraisemblablement bas au Cambodge. Les données sont également incohérentes avec les parités moyennes calculées plus haut à la section sur l’évaluation de la qualité des données sur les descendances. Ceci suggère que les données sur la fécondité récente recueillies dans ce recensement sont fortement déficientes. Des contrôles externes le confirment, sous forme d’estimations de fécondité tirées de deux EDS réalisées avant et après le recensement. Selon les données des deux dernières colonnes du tableau 3, l’indice synthétique de fécondité estimé à partir de l’EDS 2010 (fondé sur les naissances des trois ans précédant l’enquête) est de 3,1 enfants par femme. L’estimation à partir de l’EDS de 2005 était de 3,4 enfants par femme. Seulement la moitié environ des naissances survenues dans l’année précédant le recensement ont été déclarées aux agents recenseurs.
Le graphique de gauche sur la figure 2 représente les taux de fécondité par âge calculés à partir du recensement de 2008 et des deux EDS. Les taux tirés du recensement diffèrent clairement de ceux tirés des EDS. Ces derniers, de leur côté, présentent un schéma plutôt étrange d’évolution de la fécondité en cinq ans, marquée par des réductions à peu près constante entre 25 et 44 ans. Le graphique de droite de la figure 2 représente les même taux mais ramenés à un même indice synthétique de fécondité de un enfant par femme. Malgré des différences fortes dans le niveau global de la fécondité, la forme des trois distributions par âge est très semblable, la seule réelle différence entre elles étant à 20-24 ans. C’est pourquoi il semble peu vraisemblable qu’il y ait d’importantes différences dans la qualité de la déclaration de la fécondité récente selon l’âge des femmes dans le recensement de 2008 au Cambodge.
Même si le niveau de la fécondité tiré des données du recensement de 2008 est sérieusement biaisé, la forme de la distribution par âge de la fécondité est raisonnablement précise. Ceci est une condition préalable à l’application de nombreuses méthodes indirectes d’estimation de la fécondité.
Cas 3 et 4 : Estimation des taux de fécondité par âge quand la date de naissance de l’enfant est connue
Si les données sont classées par date de naissance du dernier né des femmes, il convient de choisir une période appropriée pour les analyses sur la fécondité. En général, il est conseillé de ne pas prendre des périodes beaucoup plus longues qu’un an car des périodes plus longues accroissent la probabilité que les femmes aient eu plus d’une grossesse au cours de cette période. Les naissances ayant eu lieu plus anciennement sont donc omises (la condition requise étant de déclarer la date de naissance du dernier né, pas de tous les enfants nés au cours de la période), ce qui signifie que les estimations de la fécondité excluront systématiquement des naissances dans le passé le plus ancien. En outre, si la fécondité a évolué rapidement, allonger la période de recherche au-delà d’un an signifie que les estimations représenteront une sorte de moyenne de la fécondité au long de la période. Si le recensement a eu lieu assez tôt ou assez tard dans l’année, il peut être intéressant de calculer les taux sur les naissances depuis le début de l’année précédente ou de l’année courante car ce choix ne nécessite pas que les femmes se souviennent précisément du mois de naissance de leur enfant. Le nombre de naissances déclaré au cours de la période de référence peut alors être ramené à une estimation des naissances annuelles par un calcul au prorata. On peut calculer les taux à la fois de cette façon et en s’appuyant sur une période de référence de 12 mois puis comparer les résultats.
Le scénario (3) au tableau 1 ne permet pas d’obtenir une mesure tout à fait précise de la fécondité puisque l’âge de la mère à la naissance de l’enfant ne peut pas être établi précisément. La connaissance de la date de naissance de l’enfant permet bien, toutefois, de déterminer plus soigneusement le dénominateur des taux de fécondité par âge.
Dans la situation courante où la question posée porte sur le mois et l’année de naissance du dernier enfant, une démarche plus soigneuse peut permettre de déterminer le nombre de naissances au cours de l’année passée. En général la date du recensement est fixée conventionnellement. Les questions dans le questionnaire de recensement se réfèrent généralement à un jour particulier, même si le processus effectif de dénombrement prend plusieurs semaines. Une liste des dates de recensement pour les trois dernières vagues de recensement a été établie par les Nations Unies : http://unstats.un.org/unsd/demographic/sources/census/censusdates.htm ; une liste des dates de recensement pour les données diffusées par IPUMS est disponible à https://international.ipums.org/international/samples.shtml.
Lors de la détermination du numérateur, toutes les naissances déclarées dans le mois du recensement, et une proportion au prorata des naissances déclarées s’être produites le mois équivalent un an plus tôt doivent être incluses. Pour tirer cette information des données de recensement, en fonction de la capacité de traitement des dates des logiciels statistiques utilisés, on peut recourir à la procédure de numérotation des mois à partir du début du siècle des EDS.
Tableau 4 Naissances déclarées chaque mois par âge de la mère à la date de recensement (24-25 août 1999), Kenya, recensement de 1999
|
Age de la mère au recensement |
||||||
Mois |
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
Août 1998 |
13 240 |
31,300 |
23,120 |
13,940 |
8,940 |
3,220 |
560 |
Septembre 1998 |
9 800 |
22,900 |
17,260 |
9,560 |
6,180 |
2,080 |
680 |
Octobre 1998 |
9 240 |
21,580 |
15,520 |
9,600 |
5,880 |
1,880 |
500 |
Novembre 1998 |
9 040 |
21,940 |
16,060 |
9,880 |
5,280 |
1,660 |
540 |
Décembre 1998 |
10 200 |
23,700 |
18,000 |
10,580 |
5,940 |
2,080 |
480 |
Janvier1999 |
14 720 |
28,620 |
20,620 |
12,260 |
7,300 |
2,180 |
660 |
Février 1999 |
20 740 |
42,140 |
30,860 |
17,400 |
11,220 |
4,560 |
2,060 |
Mars 1999 |
15 620 |
31,480 |
21,320 |
12,520 |
7,340 |
2,820 |
520 |
Avril 1999 |
18 660 |
33,160 |
24,260 |
12,240 |
7,820 |
2,860 |
720 |
Mai 1999 |
19 660 |
33,880 |
22,860 |
13,960 |
7,440 |
2,480 |
760 |
Juin 1999 |
20 100 |
32,140 |
23,380 |
12,580 |
7,300 |
2,720 |
560 |
Juillet 1999 |
21 600 |
32,360 |
23,860 |
13,800 |
7,060 |
2,640 |
520 |
Août 1999 |
15 900 |
25,020 |
16,720 |
9,280 |
5,840 |
1,620 |
360 |
Naissances estimées l’année passée |
188 269,68 |
355 987,74 |
255 940,65 |
146 807,74 |
86 618,71 |
30 307,10 |
8 486,45 |
Nombre de femmes |
1 700 060 |
1 495 180 |
1 205 060 |
849 620 |
725 780 |
519 740 |
417 500 |
Taux de fécondité par âge |
0,1107 |
0,2381 |
0,2124 |
0,1728 |
0,1193 |
0,0583 |
0,0203 |
Lors du recensement de 1999 au Kenya, la date de référence officielle était la nuit du 24 au 25 août 1999. Pour estimer les naissances survenues dans l’année précédant le recensement, toutes les naissances déclarées entre septembre 1998 et août 1999 doivent être incluses, ainsi que 1-24/31 (=7/31) des naissances déclarées en août 1998. Ceci suppose que les naissances sont uniformément réparties au long du mois (Tableau 4). Par exemple, le nombre estimé de naissances au cours de l’année précédant le recensement dans le groupe 30-34 ans est donné par
En l’absence d’information supplémentaire sur la date de naissance de la mère, les données ci-dessus sont classées selon le groupe d’âge de la mère à la date du recensement. Comme on l’a dit précédemment, les taux ainsi calculés doivent faire l’objet d’un décalage d’une demi-année.
Les taux de fécondité par âge sont obtenus en divisant ces naissances par le nombre de femmes dans chaque groupe d’âge. Les estimations de l’indice synthétique de fécondité qui en résultent sont sensiblement éloignées des autres estimations de la fécondité dans le pays vers cette époque. Comme au Cambodge, ceci donne à penser que les naissances au cours de l’année précédant le recensement sont fortement sous-déclarées.
On ne peut prendre une mesure précise de la fécondité que dans le cas (4), quand on dispose d’une information détaillée sur la date de naissance aussi bien de la mère que de l’enfant. Mais si certaines dates de naissance (par exemple le 1er janvier) exercent une forte attraction, le recours à des mesures affinées ne sert à rien car elles seront biaisées par l’attraction. Comme il y a peu de chances que la qualité et la cohérence interne des données recueillies lors d’un recensement soient aussi bonnes que dans une EDS, il est inutile d’appliquer le même calcul précis que celui qu’on utilise dans une EDS. Il y a toutefois des situations où l’attraction lors de la déclaration des dates de naissance et les autres erreurs dans les données jouent un rôle suffisamment limité pour qu’il vaille la peine de faire un calcul direct des estimations de fécondité. Dans ces cas, on doit appliquer les principes décrits pour le calcul des estimations de la fécondité récente à partir des données d’enquête [13].
Références
Moultrie, Tom A. and Ian M. Timæus. 2002. Trends in South African Fertility between 1970 and 1998: An Analysis of the 1996 Census and the 1998 Demographic and Health Survey. Cape Town: Medical Research Council. http://www.mrc.ac.za/bod/trends.pdf. Accessed 1 May 2011.
- Version imprimable
- ?
- Login or register to post comments
- English