Les questions sur la fécondité généralement posées dans les recensements fournissent des données à la fois sur les naissances récentes et sur la fécondité cumulée au long de la vie. Dans les années 1960, Brass et ses collègues ont noté que ces données sont très souvent affectées par les mêmes erreurs. En particulier, les mères de tous âges tendent à déclarer de façon erronée leurs naissances récentes, suite à une combinaison d’erreurs sur la période de référence (les répondantes interprétant mal l’intervalle de temps sur lequel elles sont interrogées) et d’omission des décès néonataux.
Les femmes tendent également à sous déclarer leur nombre d’enfants déjà nés. On peut penser que ce défaut augmente avec l’âge. Les raisons avancées pour expliquer ce biais incluent la surestimation de leur âge par les mères adolescentes, l’omission des enfants décédés et l’omission des enfants âgés qui ont quitté le domicile parental. Une sur-déclaration des enfants déjà nés peut se produire quand les mères incluent abusivement des enfants accueillis parmi leurs ‘propres’ enfants et des mort-nés parmi leurs naissances vivantes.
Dans cette section, nous décrivons les recherches qui doivent être conduites pour évaluer la qualité des données sur la fécondité recueillies dans un recensement. Nous décrivons successivement
Le premier type de question sur la fécondité posée dans les recensements concerne la descendance des femmes. Celles-ci sont interrogées sur leur nombre total de naissances vivantes. En vue de réduire la sous-déclaration des enfants décédés ou absents (qui représente généralement une proportion plus élevée des enfants nés des femmes âgées que des femmes jeunes) et d’éviter la sous déclaration des filles, l’interrogation prend souvent la forme d’une série de six questions sur le nombre de fils et de filles :
La somme des réponses aux questions sur les enfants vivants, présents et absents, donne le nombre total d’enfants nés et survivants. Quand on y ajoute les nombres déclarés d’enfants décédés, on obtient le nombre total d’enfants déjà nés de la femme. En faisant l’addition de ces réponses, on doit prendre garde à ne pas assimiler les codes des valeurs erronées ou manquantes à des réponses numériques. Par exemple, si une valeur manquante est codée « 9 », la procédure pour établir le total des enfants déjà nés, survivants et décédés doit expressément exclure ces codes.
Les tabulations des nombres d’enfants déclarés en réponse à ces six questions sont souvent tronquées au-delà d’un nombre d’enfants relativement élevé (par exemple 9 ou +). Quand c’est le cas, la seule hypothèse plausible est que les femmes dans cette catégorie ont eu un nombre d’enfants égal à la limite inférieure de l’intervalle ouvert. Les erreurs qui en résultent sont généralement faibles, même quand la fécondité est extrêmement forte, sauf si la troncature s’applique au nombre total d’enfants déjà nés, plutôt qu’aux catégories séparées de garçons et filles présents, absents et décédés.
En évaluant la qualité des données sur la descendance, l’analyste doit être attentif aux parités peu probables et peu vraisemblables compte tenu de l’âge de la mère. En particulier aux jeunes âges, un petit nombre de jeunes femmes déclarant des nombres excessivement élevés d’enfants déjà nés peut avoir un impact sur le nombre moyen estimé d’enfants déjà nés. Il peut s’agir de déclarations erronées ou d’erreurs de saisie des données, que celle-ci soit manuelle ou automatique. En pratique, il est recommandé de limiter le nombre maximum de naissances vivantes qu’une femme peut avoir eu à une naissance tous les 18 mois depuis l’âge de 12 ans, en arrondissant vers le bas au nombre entier le plus proche. Selon ce principe, au 20ème anniversaire (une fois passé le groupe 15-19 ans), une femme ne peut avoir eu plus de 5 enfants, au 25ème (à l’issue des 20-24 ans), 8. Si la descendance déclarée dépasse ce maximum, elle doit être recodée en ‘valeur manquante’.
Une autre erreur courante dans l’enregistrement de la descendance survient lorsque, en l’absence d’enfants, l’agent recenseur laisse en blanc l’espace de réponse sur le questionnaire de recensement au lieu d’y inscrire un ‘zéro’. On ne peut alors savoir avec certitude si le blanc signifie que l’agent recenseur a omis de poser la question ou de reporter la réponse ou s’il s’agit d’une absence d’enfants. Cette erreur est généralement plus courante dans les données des jeunes femmes, qui ont davantage de chances d’être sans enfants ou de répondre zéro aux six questions ci-dessus. L’erreur survient parfois parce que l’agent recenseur présume que la question ne s’applique pas aux jeunes femmes, ou parce qu’il est mal à l’aise pour la poser. On recommande souvent dans ce cas un ajustement spécifique des données, la correction d’el Badry [2]. Toutefois, si dans chaque groupe d’âge le nombre de femmes qui n’ont pas déclaré de nombre d’enfants est faible (disons moins de 2 % du total), cette erreur de déclaration aura peu d’impact sur le nombre moyen et pourra être ignorée lors des calculs ultérieurs. Ceci équivaut à faire l’hypothèse explicite que les femmes n’ayant pas déclaré de parité ont le même nombre moyen d’enfants que celles qui, dans le même groupe d’âge, l’ont déclarée.
Les proportions de femmes sans enfants doivent être calculées par groupe d’âge de la mère. Les proportions doivent reculer fortement quand l’âge augmente. Dans la plupart des cas, environ 3 à 10 % des femmes restent sans enfants dans les groupes d’âge les plus élevés, du fait de la stérilité primaire et de l’infécondité volontaire. Dans les pays de faible fécondité, la proportion de femmes sans enfants à 45-49 ans peut même être plus élevée. Quand les proportions de femmes sans enfants dépassent 10 % aux âges élevés, des recherches complémentaires sont nécessaires, car cela peut indiquer d’importantes erreurs dans les données.
Une distribution vraisemblable des nombres moyens d’enfants vivants et décédés par groupe d’âge de la mère est une indication essentielle de la cohérence des données sur la descendance. En général, on s’attend à ce que les parités moyennes (le nombre moyen total d’enfants nés, présents, absents et décédés) s’accroissent continuellement avec l’âge des femmes. La forme de la distribution par âge doit être sigmoïde, avec des sections un peu plus plates au début et à la fin, du fait d’une moindre fécondité aux âges les plus jeunes et les plus avancés auxquels les femmes ont des enfants. D’importantes augmentations du nombre d’enfants à ces âges – c’est-à-dire de forts accroissements des parités moyennes entre groupes d’âge successifs – sont peu vraisemblables.
On peut aussi s’attendre à ce que les nombres moyens d’enfants vivants et d’enfants décédés, ainsi que la proportion d’enfants décédés augmentent avec l’âge.
Un deuxième contrôle consiste à comparer les parités observées aux résultats obtenus dans des Enquêtes Démographiques et de Santé (EDS), ou lors de recensements antérieurs ou dans d’autres enquêtes. On peut alors comparer les parités moyennes dans des générations féminines réelles. Ainsi, si deux recensements sont réalisés à 10 ans d’intervalle, les parités moyennes des femmes âgées de x à x+4 au premier recensement peuvent être comparées à celles des femmes âgées de x+10 à x+14 au second. Non seulement les nombres moyens d’enfants devraient s’accroitre continuellement avec l’âge à chaque recensement, mais il devrait aussi y avoir un accroissement raisonnable du nombre d’enfants au sein des cohortes entre deux recensements.
Si on dispose de données pour des femmes âgées de 50 ans et plus, on peut comparer directement la cohérence des nombres moyens des femmes qui ont terminé leur période féconde – par exemple en comparant les parités moyennes des femmes âgées de 45-49 ans dans un recensement avec celles des femmes âgées de 55-59 ans au second recensement dix ans plus tard. Lors de telles comparaisons, en particulier lorsqu’elles impliquent des femmes âgées, l’analyste doit être attentif à d’éventuelles différences de mortalité entre les femmes ayant eu des nombres d’enfants différents, soit du fait d’un lien direct, soit parce que forte fécondité et statut socio-économique peuvent être corrélés. Ceci peut empêcher de tirer des conclusions définitives sur les tendances de la descendance finale.
Feeney (1991) a suggéré un perfectionnement de l’analyse lorsque on dispose d’informations sur la parité moyenne de femmes ayant terminé leur vie féconde : il s’agit de situer ces moyennes approximativement dans le temps et de les représenter graphiquement. La localisation dans le temps consiste à situer les parités moyennes en un point du temps défini en retranchant le point médian de chaque groupe d’âge à la date du recensement et en supposant que toutes les naissances dans chaque génération se sont produites à l’âge moyen à la maternité, m. En supposant par exemple m = 27,5 ans, si un recensement a eu lieu en 1960, les nombres moyens des femmes âgées de 50-54 ans se rapportent (à peu près) à 1960 – 52,5 + 27,5, soit 1935.
La parité moyenne des femmes d’un âge donné x, Px, est calculée en divisant le nombre total d’enfants déjà nés des femmes âgées de x à la date du recensement par le nombre de femmes âgées de x au recensement :
où Nx,j est le nombre de femmes âgées de x et ayant j enfants dans la population, et oméga (ω) est la limite supérieure du nombre d’enfants déclaré dans la population, après exclusion des valeurs numériques considérées comme des codes erronés dans les données. Avec des groupes groupes d’âges quinquennaux, le nombre moyen d’enfants des femmes dans chaque groupe d’âge est égal à
pour x = 15, 20, …, 45.
Pour simplifier l’exposé de nombreuses méthodes, les nombres moyens d’enfants par groupes d’âges quinquennaux, 15-19, 20-24, … sont souvent désignés par P(i), i=1, 2 …, où P(1) se réfère au groupe 15-19 ans, P(2) au groupe 20-24 ans, etc.
Si d’autres données sur la fécondité sont disponibles pour le même pays à peu près à la même date, il est bon de comparer les estimations. Si elles divergent significativement, l’analyste doit s’efforcer de comprendre pourquoi, mais il sera souvent impossible de conclure définitivement laquelle des deux sources est déficiente.
Un dernier contrôle résulte de la comparaison de la parité moyenne des femmes de 45-49 ans avec une estimation de l’indice synthétique de fécondité tirée des données sur la fécondité récente. Si la fécondité est constante depuis longtemps et que les données sont déclarées précisément, les deux mesures doivent être proches l’une de l’autre puisque la fécondité du moment et celle des cohortes doivent être égales dans ces conditions. Si la fécondité a baissé, la parité moyenne des femmes âgées doit être supérieure à l’indice synthétique de fécondité. Comme la sous-déclaration de la fécondité récente réduit artificiellement l’indice synthétique, alors que l’omission des naissances par les femmes âgées réduit la parité moyenne dans ce groupe, il est important de vérifier que chacune des deux mesures est plausible. Une des méthodes pour le faire s’appuie sur le modèle relationnel de Gompertz [4]pour étudier les distributions des fécondités et des parités et leurs relations.
L’exemple ci-dessous repose sur les données tirées du recensement de 2008 au Cambodge diffusées par IPUMS. Les données (pondérées, pour tenir compte du fait que les données d’IPUMS ne sont qu’un échantillon de l’ensemble des données) figurent au tableau 1.
Tableau 1 Nombre total d’enfants déjà nés par groupe d’âge de la mère, Cambodge, recensement de 2008
|
Groupe d’âge de la mère |
|||||||
Parité |
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
Total |
0 |
743 190 |
426 760 |
191 720 |
58 530 |
46 650 |
36 050 |
28 780 |
1 531 680 |
1 |
29 560 |
167 810 |
142 720 |
44 310 |
34 530 |
25 790 |
21 740 |
466 460 |
2 |
4 240 |
78 410 |
171 450 |
90 990 |
79 080 |
51 980 |
36 680 |
512 830 |
3 |
1 200 |
16 940 |
82 960 |
84 220 |
98 640 |
67 690 |
48 190 |
399 840 |
4 |
830 |
4 020 |
26 870 |
48 510 |
79 480 |
70 400 |
56 190 |
286 300 |
5 |
430 |
1 340 |
6 910 |
21 010 |
49 250 |
56 980 |
51 500 |
187 420 |
6 |
270 |
630 |
2 150 |
8 710 |
26 020 |
37 070 |
41 420 |
116 270 |
7 |
120 |
380 |
630 |
3 410 |
12 530 |
23 730 |
29 680 |
70 480 |
8 |
80 |
200 |
400 |
1 000 |
5 450 |
12 180 |
18 320 |
37 630 |
9 |
60 |
100 |
120 |
350 |
2 410 |
6 030 |
10 040 |
19 110 |
10 |
40 |
120 |
140 |
190 |
1 090 |
3 120 |
5 660 |
10 360 |
11 |
50 |
0 |
70 |
70 |
360 |
1 420 |
2 010 |
3 980 |
12 |
20 |
50 |
20 |
30 |
170 |
670 |
1 350 |
2 310 |
13 |
10 |
10 |
0 |
10 |
60 |
270 |
410 |
770 |
14 |
0 |
10 |
10 |
0 |
10 |
60 |
190 |
280 |
15 |
0 |
0 |
10 |
0 |
20 |
90 |
150 |
270 |
16 |
0 |
0 |
0 |
0 |
0 |
10 |
30 |
40 |
17 |
0 |
0 |
0 |
0 |
0 |
10 |
30 |
40 |
18 |
0 |
0 |
0 |
0 |
0 |
0 |
20 |
20 |
19 |
0 |
0 |
0 |
0 |
0 |
0 |
10 |
10 |
20 |
0 |
0 |
0 |
20 |
0 |
0 |
0 |
20 |
Inconnue |
220 |
380 |
250 |
290 |
130 |
210 |
120 |
1 600 |
TOTAL |
780 320 |
697 160 |
626 430 |
361 650 |
435 880 |
393 760 |
352 520 |
3 647 720 |
Les nombres en italiques rouges correspondent à des parités peu vraisemblables selon la règle pratique exposée plus haut. Les valeurs dans ces cellules sont ajoutées aux effectifs de femmes de chaque groupe d’âge dont la parité est inconnue. Les valeurs originelles sont ensuite mises à zéro, le résultat figurant au tableau 2.
Table 2 Nombre total d’enfants déjà nés par groupe d’âge de la mère après correction pour les parités peu vraisemblables, Cambodge, recensement de 2008.
Groupe d’âge de la mère |
||||||||
Parité |
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
Total |
0 |
743 190 |
426 760 |
191 720 |
58 530 |
46 650 |
36 050 |
28 780 |
1 531 680 |
1 |
29 560 |
167 810 |
142 720 |
44 310 |
34 530 |
25 790 |
21 740 |
466 460 |
2 |
4 240 |
78 410 |
171 450 |
90 990 |
79 080 |
51 980 |
36 680 |
512 830 |
3 |
1 200 |
16 940 |
82 960 |
84 220 |
98 640 |
67 690 |
48 190 |
399 840 |
4 |
830 |
4 020 |
26 870 |
48 510 |
79 480 |
70 400 |
56 190 |
286 300 |
5 |
430 |
1 340 |
6 910 |
21 010 |
49 250 |
56 980 |
51 500 |
187 420 |
6 |
0 |
630 |
2 150 |
8 710 |
26 020 |
37 070 |
41 420 |
116 000 |
7 |
0 |
380 |
630 |
3 410 |
12 530 |
23 730 |
29 680 |
70 360 |
8 |
0 |
200 |
400 |
1 000 |
5 450 |
12 180 |
18 320 |
37 550 |
9 |
0 |
0 |
120 |
350 |
2 410 |
6 030 |
10 040 |
18 950 |
10 |
0 |
0 |
140 |
190 |
1 090 |
3 120 |
5 660 |
10 200 |
11 |
0 |
0 |
70 |
70 |
360 |
1 420 |
2 010 |
3 930 |
12 |
0 |
0 |
20 |
30 |
170 |
670 |
1 350 |
2 240 |
13 |
0 |
0 |
0 |
10 |
60 |
270 |
410 |
750 |
14 |
0 |
0 |
0 |
0 |
10 |
60 |
190 |
260 |
15 |
0 |
0 |
0 |
0 |
20 |
90 |
150 |
260 |
16 |
0 |
0 |
0 |
0 |
0 |
10 |
30 |
40 |
17 |
0 |
0 |
0 |
0 |
0 |
10 |
30 |
40 |
18 |
0 |
0 |
0 |
0 |
0 |
0 |
20 |
20 |
19 |
0 |
0 |
0 |
0 |
0 |
0 |
10 |
10 |
20 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
Inconnue |
870 |
670 |
270 |
310 |
130 |
210 |
120 |
2,580 |
TOTAL |
780 320 |
697 160 |
626 430 |
361 650 |
435 880 |
393 760 |
352 520 |
3 647 720 |
Proportion manquante |
0,111% |
0,096% |
0,043% |
0,086% |
0,030% |
0,053% |
0,034% |
|
Proportion ss enfants |
95,24% |
61,21% |
30,61% |
16,18% |
10,70% |
9,16% |
8,16% |
|
Parités moyennes |
0,0604 |
0,5833 |
1,4382 |
2,4035 |
3,1670 |
3,8126 |
4,3184 |
La proportion de femmes dont la parité est inconnue après cet ajustement figure sur l’antépénultième ligne du tableau 2. Dans chaque groupe d’âge, cette proportion est insignifiante. Elle est un peu plus élevée chez les jeunes femmes que chez les plus âgées, mais même chez les 15-19 ans seules 0,11 % des femmes ont une parité inconnue ou peu vraisemblable. Il n’est donc pas nécessaire de faire une correction d’el Badry et les cas inconnus peuvent être exclus du calcul des parités moyennes, en supposant donc implicitement que les femmes dont les données sont manquantes ou peu vraisemblables ont les mêmes parités moyennes que les autres femmes du même âge. (Les données présentées ici ont été choisies parce qu’une correction d’el Badry n’était pas nécessaire. La section du manuel traitant de la correction d’el Badry [2] présente le cas d’un autre pays dont les données de parité ne sont pas d’aussi bonne qualité.)
La proportion de femmes sans enfants, à l’avant dernière ligne du tableau 2, recule rapidement avec l’âge ; à 40 ans, moins de 10 % des femmes n’ont pas eu d’enfants. Comme attendu, cette proportion ne diminue que lentement ensuite entre les deux derniers groupes d’âge : peu de femme débutent leur vie féconde après 40 ans. La proportion de femmes sans enfants à 45-49 ans (8,2 %) est relativement élevée. Les parités moyennes laissent penser que la fécondité des adolescentes est très faible, la descendance finale atteignant par ailleurs 4,3 enfants par femme dans le groupe 45-49 ans. La représentation graphique des parités moyennes a une forme sigmoïde, les hausses de descendance les plus fortes se produisant entre 20 et 35 ans, aux âges où la fécondité est généralement la plus élevée. (Figure 1).
Sur la figure 1, on a également représenté les parités moyennes par groupe d’âge d’après les Enquêtes Démographiques et de Santé du Cambodge en 2005 et 2010 (disponibles sur le site internet des EDS www.statcompiler.com [6]. Les parités moyennes au recensement et dans l’EDS de 2010 sont très voisines. Deux caractéristiques suggèrent cependant qu’il faut être prudent avant de conclure que ces données sont de bonne qualité. Premièrement, étant donné les dates des trois sources, les données du recensement devraient se situer à peu près à mi-chemin entre les estimations des deux EDS, ce qui n’est pas le cas. Deuxièmement, la descendance des femmes âgées de 40-44 ans à l’enquête EDS de 2005 est un peu plus élevée (de 0,2 enfant) que celle des femmes âgées de 45-49 ans à l’enquête EDS de 2010. La fécondité est faible chez les femmes à l’approche de la cinquantaine et des erreurs aléatoires ne sont pas à exclure, mais dans tous les cas ces résultats poussent à un certain scepticisme à l’égard des données. Toutefois dans l’ensemble, les parités moyennes tirées des deux EDS ne contredisent pas fondamentalement celles tirées des recensements.
Feeney G. 1991. "Child
survivorship estimation: Methods and data analysis", Asian and Pacific
Population Forum 5(2-3):51-55, 76-87. http://hdl.handle.net/10125/3600 [7].
La correction d’el Badry consiste à corriger les erreurs dans les données sur les enfants déjà nés dues au fait que les agents recenseurs laissent vide la réponse à la question sur la descendance, quand il faudrait indiquer ‘zéro’. Quand ceci survient, la réponse est codée ‘manquante’ ou ‘inconnue’ lors de l’exploitation des données, même s’il était évident pour l’agent recenseur au moment de la collecte des données que la bonne réponse était ‘zéro’. La méthode répartit le nombre de femmes dont la parité est enregistrée comme ‘manquante’ entre celles dont la parité est considérée comme réellement inconnue, et celles qui auraient dû être enregistrées comme sans enfants mais dont les réponses ont été laissées vides. Cette répartition est faite au niveau agrégé, pas au niveau individuel.
La méthode s’appuie sur le nombre d’enfants déjà nés, classé par groupe d’âge de la mère, y compris les femmes dont les données sont manquantes (c’est-à-dire dont la réponse a été laissée vide ou a été codée hors de l’intervalle des possibles ou a été codée ‘non réponse’ ou ‘refus’).
La méthode suppose qu’une proportion constante de femmes à chaque âge n’a effectivement pas répondu à la question sur la parité lors de la collecte des données. Les autres femmes sans réponse sont supposées être à tort considérées comme non répondantes, alors qu’elles sont en fait sans enfants.
La méthode repose sur l’existence d’une relation linéaire entre les proportions de femmes dont la parité n’est pas déclarée et celles des femmes déclarées sans enfants. Si on observe une telle relation linéaire, le dénominateur ajusté utilisé dans le calcul des parités moyennes doit exclure les femmes dont la parité (après correction) continue d’être considérée comme inconnue. Ceci reflète l’hypothèse implicite que la distribution de ces femmes par parité ne diffère pas de celle des femmes du même âge dont la parité est connue.
Lorsque les données indiquent la nécessité d’une correction parce que la proportion d’informations manquantes sur la parité est importante, mais que la méthode ne peut pas être appliquée (par exemple parce qu’on n’a pas de données par âge ou parce que l’hypothèse de linéarité n’est pas respectée), les femmes de parité inconnue doivent être incluses dans le dénominateur utilisé pour calculer les parités moyennes. L’hypothèse implicite est alors que la parité de ces femmes est nulle (c’est-à-dire que toutes les femmes de parité inconnue sont sans enfants). Il en résulte évidemment une sous-estimation des parités moyennes, puisque en fait une partie des femmes de parité inconnue ne sont pas sans enfants.
Nous définissons
comme étant le nombre de femmes dans le groupe d’âge i dans la population, pour a = 15, 20, …, 45 et i = a/5-2. Ainsi, N1 représente le nombre de femmes âgées de 15-19 ans dans la population. Nous notons Ni,j le nombre de femmes du groupe d’âge i de parité j et Ni,u le nombre de femmes du groupe d’âge i dont la parité est inconnue.
Extraire des données du recensement un tableau du nombre d’enfants déjà nés (j) par groupe d’âge des femmes (i) pour obtenir Ni,j. Pour chaque groupe d’âge, les données où la parité manque (c’est-à-dire les réponses laissées vides et les codes non valables) doivent être combinées aux codes de parité non déclarée pour établir Ni,u. La proportion de femmes du groupe d’âge i dont la parité est inconnue est alors
La proportion de femmes du groupe d’âge i qui se sont déclarées sans enfants (c’est-à-dire de parité zéro) est donnée par
Si les Ui sont faibles (moins de 2 % dans chaque groupe d’âge), la correction n’en vaut pas la peine. Dans ce cas, les parités moyennes doivent être calculées en supposant que la distribution par parité des femmes dont la parité est inconnue est la même que celle des femmes dont la parité est connue, en omettant les femmes dont la parité est inconnue du dénominateur lors du calcul. Ainsi, si Pi est la parité moyenne des femmes du groupe d’âge i,
Si les proportions de femmes dont la parité n’est pas établie dépassent 2 %, il est utile de voir s’il est possible d’appliquer la correction.
Pour que la méthode fonctionne correctement, la série de points (Zi, Ui) doit se situer sur une droite, ou très proche d’une droite. Dans certains cas, une courbure peut être observée aux points correspondant soit aux jeunes âges soit aux âges avancés. Si la courbure affecte seulement les âges avancés, même si elle est forte, on peut exclure de l’ajustement le groupe d’âge le plus élevé, ou les deux plus élevés, et ajuster une droite sur les points restants puisque la méthode a son impact absolu le plus fort sur les proportions non déclarées aux plus jeunes âges. Si la courbure est surtout prononcée chez les jeunes femmes, le recours à la méthode est impossible car une régression excluant les points relatifs aux femmes âgées de 15-24 ans conduirait à une extrapolation hors de l’échantillon, qui pourrait suggérer des ajustements illogiques dans ces groupes d’âge.
Si on ne peut pas identifier clairement une relation, même après avoir exclu un ou deux points relatifs aux femmes âgées, la méthode ne peut pas être appliquée. Dans un tel cas, il est préférable de supposer que toutes les femmes sans parité établie sont sans enfants, et de les inclure dans le dénominateur du calcul de la parité moyenne
Le rapport d’analyse doit indiquer qu’il a été procédé ainsi, et que par conséquent les valeurs des parités moyennes sont susceptibles d’être sous-estimées.
La pente (γ) et l’ordonnée à l’origine (β) de la droite d’ajustement sont déterminées au moyen d’une régression linéaire de Ui sur Zi appliquée aux points retenus, c’est-à-dire
L’ordonnée à l’origine (β), qui est indépendante de l’âge (i), est l’estimation de la proportion des femmes dans chaque groupe d’âge de parité inconnue dont la parité est considérée comme réellement inconnue, et non mal déclarée.
La proportion ajustée des femmes du groupe d’âge i qu’on a estimées être vraiment sans enfants est donnée par
La proportion révisée de femmes de parité zéro est donc égale à la proportion effectivement déclarée de parité zéro, à laquelle s’ajoute la proportion de femmes de ce groupe d’âge de parité non déclarée et se retranche la proportion estimée de femmes dont la parité est considérée comme vraiment inconnue. L’estimation révisée du nombre de femmes sans enfants dans le groupe d’âge i est donnée par
L’estimation de la proportion réelle de femmes de chaque groupe d’âge dont la parité est inconnue est donc donnée par
Les
pour les autres parités (j > 0) restent inchangées.
Si une correction d’el Badry a été appliquée aux données, les parités moyennes sont données par :
reflétant l’hypothèse selon laquelle les femmes dans le groupe d’âge i qui restent de parité inconnue, βNi – qui sont omises au dénominateur – ont la même parité moyenne que les femmes du groupe d’âge i dont la parité est connue.
La valeur de β mesure la proportion estimée de femmes dont la parité n’est réellement pas déclarée. Plus β est élevé, moins bonne est la qualité des données.
La méthode peut parfois avoir un effet contraire, en donnant à penser que le nombre de femmes de parité non déclarée est sous-estimé et que le nombre de femmes ayant déclaré une parité zéro doit être réduit. C’est le cas lorsque β > Ui. La correction ne doit alors pas être appliquée dans ce groupe d’âge.
La feuille de calcul jointe [8] met la méthode en application sur les données du recensement du Kenya en 1989, diffusées par IPUMS. Les données originelles sont au tableau 1.
Tableau 1 Enfants déjà nés, par groupe d’âge de la mère à la date de recensement, Kenya, recensement de 1989
|
Groupe d’âge (i) |
||||||||||
|
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
||||
Parité |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
||||
0 |
597 560 |
198 600 |
59 400 |
23 120 |
14 580 |
11 040 |
9 560 |
||||
1 |
134 700 |
224 660 |
83 140 |
26 140 |
13 620 |
9 460 |
7 740 |
||||
2 |
38 120 |
202 300 |
120 940 |
38 340 |
19 180 |
13 240 |
9 280 |
||||
3 |
11 120 |
126 500 |
150 500 |
53 880 |
28 020 |
17 000 |
12 440 |
||||
4 |
6 820 |
59 700 |
146 500 |
73 280 |
37 340 |
21 400 |
14 800 |
||||
5 |
1 740 |
33 720 |
102 300 |
87 720 |
48 140 |
28 980 |
18 560 |
||||
6 |
0 |
12 480 |
58 980 |
83 580 |
56 520 |
35 260 |
26 280 |
||||
7 |
0 |
0 |
57 180 |
91 800 |
56 240 |
41 260 |
28 640 |
||||
8 |
0 |
0 |
0 |
64 740 |
56 560 |
42 700 |
32 920 |
||||
9 |
0 |
0 |
0 |
0 |
40 780 |
39 480 |
33 000 |
||||
10 |
0 |
0 |
0 |
0 |
26 840 |
32 240 |
27 920 |
||||
11 |
0 |
0 |
0 |
0 |
14 920 |
22 840 |
21 920 |
||||
12 |
0 |
0 |
0 |
0 |
8 280 |
14 660 |
14 720 |
||||
13 |
0 |
0 |
0 |
0 |
3 740 |
7 900 |
8 920 |
||||
14 |
0 |
0 |
0 |
0 |
2 180 |
4 080 |
4 900 |
||||
15 |
0 |
0 |
0 |
0 |
1 260 |
2 100 |
2 860 |
||||
16 |
0 |
0 |
0 |
0 |
960 |
1 200 |
1 540 |
||||
17 |
0 |
0 |
0 |
0 |
520 |
680 |
1 000 |
||||
18 |
0 |
0 |
0 |
0 |
420 |
520 |
620 |
||||
19 |
0 |
0 |
0 |
0 |
140 |
340 |
380 |
||||
20 |
0 |
0 |
0 |
0 |
160 |
300 |
280 |
||||
21 |
0 |
0 |
0 |
0 |
240 |
160 |
280 |
||||
22 |
0 |
0 |
0 |
0 |
40 |
100 |
60 |
||||
23 |
0 |
0 |
0 |
0 |
20 |
20 |
80 |
||||
24 |
0 |
0 |
0 |
0 |
60 |
20 |
80 |
||||
25 |
0 |
0 |
0 |
0 |
60 |
40 |
0 |
||||
26 |
0 |
0 |
0 |
0 |
60 |
40 |
80 |
||||
27 |
0 |
0 |
0 |
0 |
80 |
40 |
60 |
||||
28 |
0 |
0 |
0 |
0 |
20 |
40 |
40 |
||||
29 |
0 |
0 |
0 |
0 |
20 |
0 |
40 |
||||
30 |
0 |
0 |
0 |
0 |
340 |
440 |
360 |
||||
Non déclarée |
402 780 |
147 540 |
61 920 |
31 580 |
20 240 |
15 420 |
12 960 |
||||
TOTAL |
1 192 840 |
1 005 500 |
840 860 |
574 180 |
451 580 |
363 000 |
292 320 |
||||
L’examen des données montre qu’elles ont été corrigées pour éliminer les déclarations de parités élevées par les femmes de moins de 35 ans. La règle de correction appliquée lors de la phase préparatoire a été plus stricte que celle que nous avons suggérée à la section sur l’évaluation de la qualité des données sur les descendances [9]. Ainsi les déclarations de femmes âgées de 20-24 ans ont été limitées aux parités 6 ou moins (plutôt que 8), les déclarations des femmes âgées de 25-29 ans ont été tronquées à la parité 7 (au lieu de 12) et celles des femmes âgées de 30-34 ans à la parité 8 (et non 15). En revanche, des parités peu vraisemblables ont été conservées à partir de 35 ans. C’est pourquoi nous pouvons corriger légèrement les données en italiques du tableau 1 en plaçant dans la catégorie Non déclarée les déclarations de parité supérieures à 18 pour le groupe 35-39 ans, supérieures à 22 dans le groupe 40-44 ans, et supérieures à 25 dans le dernier groupe, 45-49 ans.
Vous pouvez sélectionner une option dans le tableau Introduction de la feuille de calcul pour transférer les parités peu vraisemblables dans la catégorie « Non déclarée » avant l’application de la méthode.
Le tableau 2 présente les données révisées, en même temps que le calcul de la proportion de femmes de parité zéro, et de parité nulle dans chaque groupe d’âge.
Tableau 2 Correction des données de parité, et calcul de la proportion de femmes de parité zéro et de parité non déclarée, Kenya, recensement de 1989
|
Groupe d’âge (i) |
||||||
|
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
Parité |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
0 |
597 560 |
198 600 |
59 400 |
23 120 |
14 580 |
11 040 |
9 560 |
1 |
134 700 |
224 660 |
83 140 |
26 140 |
13 620 |
9 460 |
7 740 |
2 |
38 120 |
202 300 |
120 940 |
38 340 |
19 180 |
13 240 |
9 280 |
3 |
11 120 |
126 500 |
150 500 |
53 880 |
28 020 |
17 000 |
12 440 |
4 |
6 820 |
59 700 |
146 500 |
73 280 |
37 340 |
21 400 |
14 800 |
5 |
1 740 |
33 720 |
102 300 |
87 720 |
48 140 |
28 980 |
18 560 |
6 |
0 |
12 480 |
58 980 |
83 580 |
56 520 |
35 260 |
26 280 |
7 |
0 |
0 |
57 180 |
91 800 |
56 240 |
41 260 |
28 640 |
8 |
0 |
0 |
0 |
64 740 |
56 560 |
42 700 |
32 920 |
9 |
0 |
0 |
0 |
0 |
40 780 |
39 480 |
33 000 |
10 |
0 |
0 |
0 |
0 |
26 840 |
32 240 |
27 920 |
11 |
0 |
0 |
0 |
0 |
14 920 |
22 840 |
21 920 |
12 |
0 |
0 |
0 |
0 |
8 280 |
14 660 |
14 720 |
13 |
0 |
0 |
0 |
0 |
3 740 |
7 900 |
8 920 |
14 |
0 |
0 |
0 |
0 |
2 180 |
4 080 |
4 900 |
15 |
0 |
0 |
0 |
0 |
1 260 |
2 100 |
2 860 |
16 |
0 |
0 |
0 |
0 |
960 |
1 200 |
1 540 |
17 |
0 |
0 |
0 |
0 |
520 |
680 |
1 000 |
18 |
0 |
0 |
0 |
0 |
420 |
520 |
620 |
19 |
0 |
0 |
0 |
0 |
0 |
340 |
380 |
20 |
0 |
0 |
0 |
0 |
0 |
300 |
280 |
21 |
0 |
0 |
0 |
0 |
0 |
160 |
280 |
22 |
0 |
0 |
0 |
0 |
0 |
100 |
60 |
23 |
0 |
0 |
0 |
0 |
0 |
0 |
80 |
24 |
0 |
0 |
0 |
0 |
0 |
0 |
80 |
25 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
U |
402 780 |
147 540 |
61 920 |
31 580 |
21 480 |
16 060 |
13 540 |
TOTAL |
1 192 840 |
1 005 500 |
840 860 |
574 180 |
451 580 |
363 000 |
292 320 |
Ui |
0,338 |
0,147 |
0,074 |
0,055 |
0,048 |
0,044 |
0,046 |
Zi |
0,501 |
0,198 |
0,071 |
0,040 |
0,032 |
0,030 |
0,033 |
Les données incluent des proportions élevées de femmes de parité non déclarée à 15-19 ans
, à 20-24 ans (0,147) et, dans une moindre mesure, dans les groupes d’âge plus avancé. La proportion de femmes se déclarant sans enfants (Zi) recule rapidement, de 50 % environ dans le premier groupe d’âge à 3 % environ à la fin de la période féconde. Sur cette base, il est utile de voir si une correction d’el Badry peut être appliquée aux données.
Les points correspondant à chaque paire de Zi et Ui sont portés sur la figure 1 (sous forme de losanges bleus). La ligne droite ajustée aux points est représentée en rouge. Si un point est exclu de l’ajustement, il est représenté sur la feuille de calcul par un losange sans couleur.
La régression linéaire de Ui sur Zi pour les points sélectionnés donne comme valeur de l’ordonnée à l’origine (béta) 0,02745. Ce résultat conduit à penser qu’environ 2,7 % des données sur les parités des femmes peuvent être considérées comme réellement manquantes.
Le nombre révisé de femmes de parité zéro est donné par
, alors que les nombres révisés des femmes de parité inconnue sont calculés en multipliant le nombre total de femmes dans chaque groupe d’âge par β, comme le montre le tableau 3. Par exemple, le nombre de femmes âgées de 20-24 ans qu’on estime vraiment de parité inconnue est donné par 0,02745*1 005 500=27 603. L’estimation corrigée du nombre de femmes sans enfants âgées de 15-19 ans est donnée par 1 192 840*(0,501+0,338-0,027)=967 594.
Tableau 3 Estimations révisées des nombres de femmes de parité non déclarée et de femmes sans enfants par âge, Kenya, recensement de 1989
|
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
Parité non déclarée révisée |
32 746 |
27 603 |
23 084 |
15 763 |
12 397 |
9 965 |
8 025 |
Parité zéro révisée |
967 594 |
318 537 |
98 236 |
38 937 |
23 663 |
17 135 |
15 075 |
Par exemple, le nombre de femmes âgées de 20-24 ans qu’on estime vraiment de parité inconnue est donné par 0,02745*1 005 500=27 603. L’estimation corrigée du nombre de femmes sans enfants âgées de 15-19 ans est tirée de 1 192 840*(0,501+0,338-0,027)=967 594.
Puisqu’on a appliqué une correction d’el Badry, l’équation 2 permet d’obtenir les parités moyennes corrigées figurant au tableau 4.
Tableau 4 Parités moyennes corrigées par groupe d’âge, Kenya, recensement de 1989
|
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
Parité moyenne |
0,242 |
1,525 |
3,214 |
4,760 |
6,239 |
7,120 |
7,510 |
Par rapport aux parités moyennes obtenues sans application de la correction (en supposant donc que les femmes sans parité déclarée sont de parité zéro), la correction accroit les parités dans chaque groupe d’âge par une constante, 1/(1−β ).
La méthode est décrite entièrement dans el Badry (1961). L’idée fondamentale d’el Badry est que, si on peut supposer que :
1) Il existe une relation linéaire entre les proportions de femmes sans enfants d’un âge donné dans la population et la proportion de femmes dont la parité n’est pas déclarée, et
2) La proportion réelle, inconnue, de femmes dont la parité n’est pas connue est une constante indépendante de l’âge, alors
où αZ*i est la proportion de femmes réellement sans enfants déclarées de parité inconnue, et β est la proportion réelle, constante, de femmes sans parité déclarée.
Donc, si αZ*i ont été classées par erreur comme non déclarées, alors qu’elles sont vraiment sans enfants, alors
et donc
et en remplaçant dans l’équation 3,
où gamma peut être considéré comme la probabilité qu’une femme sans enfants soit classée comme étant de parité inconnue.
Donc une régression de Zi sur Ui donnera des estimations de β (ainsi que de γ et α).
De l’équation 3, nous tirons alors
et donc
et
Notons que, bien que nous ayons deux identités incluant Zi, elles vont donner une seule et même réponse si l’ajustement est exact. Par convention nous préférons utiliser l’équation 3 plutôt que l’équation 4 parce qu’elle repose sur les valeurs ajustées de β (la proportion estimée des parités vraiment non déclarées), plutôt que sur la valeur de α, qui est difficile à interpréter intuitivement.
Une fois obtenues les valeurs corrigées de Z*i et U*i les parités moyennes peuvent être calculées à partir de l’équation 2.
En appliquant la correction, on doit s’assurer que, dans chaque groupe d’âge, le nombre ajusté de femmes sans enfants (c’est-à-dire de parité zéro) est inférieur au nombre de femmes ne déclarant pas d’enfants au cours de la période de référence, en réponse à la question sur la fécondité récente. Le Z*i révisé peut donc être utilisé pour déterminer le nombre minimum de femmes qui ne pourraient pas avoir eu de naissance dans la période de référence précédant le recensement.
L’annexe II du Manuel X (Division de la population des NU 1984) donne une version de la correction d’el Badry adaptée aux situations (désormais rares) où les questions sur les nombres d’enfants déjà nés ne sont posées qu’aux femmes mariées.
Division de la Population des Nations Unies. 1984. Manuel X. Techniques indirectes d’estimation démographique. New York : Nations Unies, Département des affaires économiques et sociales internationales, ST/ESA/SER.A/81. http://unstats.un.org/unsd/demographic/standmeth/handbooks/Manuel_X-fr.pdf [11]
el-Badry MA. 1961. “Failure of enumerators to make entries of zero: errors in recording childless cases in population censuses”, Journal of the American Statistical Association 56(296):909–924. doi: http://dx.doi.org/10.1080/01621459.1961.10482134 [12]
Avant d’évaluer la qualité des données sur la fécondité récente recueillies dans un recensement, il importe d’examiner le libellé précis des questions utilisées pour saisir l’information sur les naissances récentes en consultant le questionnaire. Des questions très différentes ont été utilisées au gré des pays et des vagues successives de recensements. La formulation peut affecter la validité des estimations et le sens et l’ampleur des biais ou des erreurs dans les données.
Les formes génériques des questions sur la fécondité récente dans les recensements appartiennent à trois grandes catégories :
Cette question produit une réponse binaire simple. Les naissances multiples au cours de la même période de référence ne sont pas saisies. Celles-ci peuvent résulter soit de la naissance de jumeaux ou de triplés lors d’une seule grossesse soit d’un très court intervalle séparant deux grossesses différentes. Aucune de ces éventualités n’est susceptible d’affecter substantiellement les taux fécondité car les intervalles entre naissances inférieurs à un an sont rares et la probabilité qu’une grossesse donne lieu à des naissances multiples est inférieure à 2 % dans la plupart des populations (à l’exception peut-être de l’Afrique sub-saharienne). Face à des données collectées sous cette forme, il est recommandé de faire l’hypothèse simplificatrice que toutes les naissances ont eu lieu au milieu de la période de référence, et que chaque grossesse ne donne lieu qu’à une naissance.
Cette question est plus raffinée que la précédente. Elle ne donne pas d’information sur le calendrier de la naissance au cours de la période de référence, mais elle saisit l’information sur les naissances multiples qu’aurait eues une femme, sans distinguer toutefois entre les jumeaux et les intervalles courts entre naissances. Cette fois encore, il est raisonnable pour les calculs de supposer que les naissances se sont produites à la mi-temps de la période de référence.
Cette question cherche à déterminer la date du dernier accouchement avec un plus grand degré de précision, même si, en général, seuls le mois et l’année de la dernière naissance sont enregistrés. S’il y a en outre des questions sur le nombre de naissances qui se sont produites à cette date, l’ensemble donne une information plus précise sur le nombre de naissances récentes.
D’autres questions sont parfois posées (par exemple, sur la survie du dernier né, son sexe ou la date de naissance de l’enfant précédent). On peut en tirer des estimations directes sur les taux de mortalité infantile par sexe ou le rapport de masculinité à la naissance, par exemple.
L’évaluation de la qualité des données sur la fécondité récente peut inclure les contrôles suivants :
Dans tous les cas, il est indispensable d’identifier précisément l’univers des femmes à qui sont adressées les questions (en particulier les âges et l’état matrimonial des répondantes éligibles), ainsi que les règles d’enregistrement et de codage des non réponses et des données incorrectes.
Avant d’analyser les taux de fécondité par âge, il est recommandé d’évaluer dans quelle mesure les données sur les naissances récentes sont manquantes ou peu vraisemblables. L’absence de toute donnée manquante indique presque certainement que les données ont été corrigées. Si c’est le cas, d’autres recherches doivent porter sur l’ampleur des corrections et/ou des imputations dans la mesure du possible, par exemple, en examinant la distribution de valeurs imputées lorsque des étiquettes d’imputation ont été ajoutées aux données.
La proportion de données manquantes doit aussi être vérifiée. Si elle dépasse 5 % du nombre total des enregistrements permettant d’établir les données de fécondité actuelle, des recherches plus approfondies sont nécessaires. Il faut en particulier examiner la distribution par âge des cas manquants. Si ceux-ci sont concentrés aux jeunes âges ou chez les quadragénaires, on peut penser que les cas manquants correspondent à des femmes qui n’ont pas eu de naissance au cours de la période de référence, l’agent recenseur n’ayant pas enregistré de réponse au lieu d’indiquer zéro. C’est une erreur de même type que celle conduisant à la correction d’el Badry [2].
Quand les données donnent lieu à des tableaux par nombre de naissances dans la période de référence (plutôt que d’indiquer simplement si, oui ou non, une naissance a eu lieu au cours de la période de référence), on doit s’attacher aux nombres respectifs de naissances simples et multiples. En général, moins de 2 % des grossesses donnent naissance à plusieurs enfants. Les triplés et plus sont extrêmement rares (moins de 0,5 % des accouchements). Si la proportion de naissances multiples au cours de la période de référence semble trop élevée, il est recommandé d’établir des tableaux croisant le nombre total d’enfants déjà nés et les naissances au cours de l’année écoulée dans chaque groupe d’âge de femmes. Si le total d’enfants déjà nés et les naissances de l’année écoulée sont identiques dans une large proportion de cas, même pour des parités de deux ou plus, on peut penser que les personnes recensées ou les agents recenseurs n’ont pas compris la distinction entre les questions sur la descendance et sur la fécondité récente. Il se peut toutefois qu’une large proportion de jeunes femmes n’ayant qu’un enfant déjà né ait eu la naissance correspondante au cours de la période de référence, et une coïncidence fréquente entre des descendances d’un seul enfant et des déclarations d’une naissance récente par les jeunes femmes peut très bien ne pas indiquer des erreurs de déclaration.
Quand la qualité des données est suffisante, on peut estimer directement les taux de fécondité par âge. Quand la qualité des données est médiocre, les taux de fécondité par âge obtenus par calcul direct sont incorporés dans diverses méthodes visant à produire des estimations plus fiables du niveau de fécondité par recours à des techniques indirectes.
La forme exacte des taux de fécondité par âge qu’on peut calculer dépend de la nature des données recueillies. Un taux de fécondité par âge à un âge (ou dans un groupe d’âge) donné est le rapport du nombre de naissances des femmes de cet âge (dans ce groupe d’âge) dans une période définie au nombre de femmes-années vécues par les femmes du même âge (dans le même groupe d’âge) dans la même période. Pour que le calcul soit exact, il faut connaître de façon fiable les dates de naissance des mères (pour déterminer l’âge de la mère) et de leurs enfants. On peut alors calculer précisément l’âge de la mère à la naissance de son enfant, et allouer son exposition au risque aux âges ou groupes d’âge appropriés au long de la période couverte par la recherche.
Les données nécessaires pour ces calculs précis ne sont généralement pas disponibles dans les micro-données de recensement, soit parce que les dates complètes ne sont pas recueillies sur le terrain, soit parce qu’il y aurait un risque de violation de la confidentialité si les dates de naissance complètes étaient accessibles aux utilisateurs finaux des données. En outre, les données de recensement sont rarement de qualité suffisante pour justifier un tel surcroit de précision. L’attraction exercée par certains mois de naissance (par exemple janvier) ainsi que certaines années de naissance (par exemple celles finissant par 0 ou 5) pose fréquemment problème. Des périodes de dénombrement étendues peuvent créer des problèmes quand il s’agit de passer de la période de référence (par exemple les douze mois écoulés jusqu’à la date d’interview) à une période calendaire (par exemple 2008). En outre, les questions rétrospectives sur les naissances récentes posées dans un recensement excluent évidemment l’information relative aux naissances des mères qui sont décédées ou ont quitté le pays depuis leur accouchement.
Il y a quatre combinaisons possibles d’ informations essentielles relatives à la mère et aux naissances récentes (Tableau 1).
Tableau 1 Taxonomie des données relatives à la mère et aux enfants pour l’estimation de la fécondité récente
|
|
Informations sur la mère |
|
|
|
Age révolu au recensement |
Date de naissance
|
Information sur les enfants nés au cours de la période précédant le recensement(*) |
Nombre d’enfants nés
|
(1) |
(2) |
Date de naissance du
dernier né |
(3) |
(4) |
(*)En général la période précédant le recensement est de 12 mois, mais l’analyste doit être attentif à la possibilité de périodes non-standards, fondée par exemple sur le temps écoulé depuis un événement national important.
Même dans le cas (4) du tableau 1, qui repose sur les informations les plus détaillées, le souci de calculer précisément l’exposition au risque ne donne pas forcément des résultats garantis, du fait que l’attraction exercée par certains mois lors de la déclaration des dates et autres problèmes de qualité des données peuvent sévèrement altérer les estimations. Le recours à de simples approximations pour le calcul des taux de fécondité à partir des données de recensement est généralement suffisant. Dans la section sur la mesure directe de la fécondité à partir des données d’enquête [13], nous décrivons le calcul plus précis de l’exposition au risque et l’estimation des taux de fécondité à partir de données de bonne qualité.
Dans les cas (1) et (2) du tableau 1, ce qui est connu sur la fécondité récente de la mère se limite au fait qu’elle a donné naissance (ou non) à au moins un enfant au cours de la période précédant le recensement. Dans des variantes plus informatives de la question sur la fécondité récente, la mère peut être interrogée sur le nombre de naissances vivantes qu’elle a eues dans la période précédant le recensement. Une telle question permet d’identifier à la fois les naissances multiples issues d’une même grossesse (jumeaux, triplés, etc.), et les cas où plus d’une grossesse arrive à son terme au cours de la période de référence.
Comme l’âge de la mère à l’accouchement n’est pas connu, l’approximation couramment utilisée consiste à classer les taux de fécondité selon l’âgé déclaré par la mère à la date du recensement. On fait alors l’hypothèse supplémentaire que les naissances ont toutes eu lieu au milieu de l’intervalle en question. Ceci signifie qu’au moment du recensement les mères sont, en moyenne, plus âgées de la moitié de la durée de l’intervalle. Il en résulte que les âges auxquels les taux de fécondité se réfèrent réellement sont plus jeunes que les âges des femmes déclarés au recensement. La plupart des méthodes standards d’estimation indirecte de la fécondité corrigent les âges de ce décalage.
L’information supplémentaire (sur le mois et l’année de naissance de la mère) dont on dispose dans le deuxième cas ne permet guère d’affiner les estimations de la fécondité car on continue d’avoir besoin d’hypothèses supplémentaires d’uniformité de la distribution des dates de naissance des enfants. Donc, dans le cas (2) comme dans le cas (1) du tableau 1, les taux de fécondité sont estimés en divisant le nombre de naissances déclarées au cours de la période de référence (classées par âge de la mère à la date du recensement) par le nombre de femmes de cet âge. Le nombre total de naissances au cours de la période de référence déclaré par les femmes âgées x à la date du recensement, Bx, est donné par
où k est le nombre déclaré de naissances au cours de la période de référence, ω est la valeur maximale de k dans les données et Nx,k est le nombre de femmes âgées de x au recensement déclarant avoir eu k naissances au cours de la dernière année. Si ω est exprimé comme un intervalle ouvert, par exemple 3 naissances ou plus au cours de la période de référence, les femmes dans cette catégorie sont supposées avoir eu le nombre de naissances qui ouvre cet intervalle (soit 3 naissances ici). L’erreur qui en résulte est de nouveau faible.
Le nombre de femmes âgées de x est donné par
Les femmes dont les naissances récentes ne sont pas connues ou n’ont pas été déclarées doivent être exclues à la fois du numérateur et du dénominateur, avec l’hypothèse implicite que leur fécondité ne diffère pas de celle des femmes dont la fécondité récente est connue. Les taux de fécondité par âge x sont égaux à
Dans l’intervalle d’âge conventionnel (de 15 ans à 49 ans, inclus), l’indice synthétique de fécondité (TF) calculé à partir des taux par année d’âge est égal à
L’indice synthétique de fécondité désigne le nombre d’enfants qu’une femme aurait si elle survivait jusqu’à 50 ans (considéré comme la fin de la période féconde) en ayant, au long de sa vie reproductive, les taux de fécondité par âge observés au cours de la période précédant immédiatement le recensement.
Il convient de calculer et de représenter graphiquement les taux de fécondité par année d’âge afin de vérifier la cohérence interne des données. Les taux de fécondité par âge sont en général moins erratiques que les numérateurs ou les dénominateurs eux-mêmes et ils peuvent indiquer des niveaux et des distributions vraisemblables de la fécondité. Une série de taux par âge fortement erratique, s’écartant fortement de la forme prévisible en n, laisse fortement supposer que les données de fécondité récente posent problème et invite à pousser les recherches plus avant.
Enfin on peut calculer des taux de fécondité par groupes d’âges quinquennaux, 5fx, où x = 15, 20,…, 45 :
où l’indice i est égal à i=(x/5) - 2. La mesure de l’indice synthétique de fécondité est donc
Alors que l’indice synthétique est une mesure de la fécondité standardisée par l’âge (la distribution par âge de la population féminine d’âge fécond étant supposée implicitement uniforme par groupe d’âge), le taux de fécondité de chaque groupe d’âge n’est pas standardisé au sein du groupe. Il peut en résulter un léger écart entre les indices synthétiques résultant respectivement d’un calcul par groupe d’âge et par année d’âge, mais cet écart ne porte généralement que sur la deuxième ou la troisième décimale.
L’indice synthétique de fécondité doit être comparé aux estimations tirées d’autres sources de données pour le même pays (par exemple des EDS). Il faut toutefois se souvenir que les taux de fécondité par âge et les indices synthétiques obtenus par cette méthode ne prennent pas en compte la vraie exposition au risque dans la détermination du dénominateur. En outre, le numérateur inclut des événements ayant eu lieu pendant la période de référence classés selon l’âge de la mère à la fin de celle-ci, et non par son âge au moment où l’événement a eu lieu. La plupart des méthodes d’estimation indirecte de la fécondité corrigent les taux de fécondité calculés pour tenir compte de ce décalage. Dans des comparaisons de base visant à évaluer les forme et le niveau des distributions de fécondité), les différences dans les classements par âge ont peu d’importance. La variante F-seulement du modèle relationnel de Gompertz [4] offre toutefois une méthode pour ne pas décaler les taux de fécondité lors de leur lissage, si on le souhaite.
Au recensement de 2008 au Cambodge, les femmes ont été interrogées sur le nombre d’enfants qu’elles ont eu l’année précédente. L’âge des mères est l’âge à la date du recensement. Les données figurent au tableau 2.
Tableau 2 Fécondité récente par âge de la mère à la date du recensement, Cambodge, recensement de 2008.
|
Naissances au cours de l’année précédente |
|
|
|
|||||
Age |
0 |
1 |
2 |
3 |
4 |
Manquant |
Naissances |
Femmes |
Taux* |
15 |
160 980 |
120 |
0 |
0 |
0 |
80 |
120 |
161 180 |
0,0007 |
16 |
152 710 |
500 |
0 |
0 |
0 |
50 |
500 |
153 260 |
0,0033 |
17 |
144 970 |
1 250 |
10 |
10 |
0 |
20 |
1 300 |
146 260 |
0,0089 |
18 |
182 500 |
3 540 |
20 |
0 |
0 |
40 |
3 580 |
186 100 |
0,0192 |
19 |
127 840 |
5 640 |
10 |
0 |
0 |
30 |
5 660 |
133 520 |
0,0424 |
20 |
147 990 |
8 840 |
80 |
0 |
0 |
90 |
9 000 |
157 000 |
0,0574 |
21 |
123 960 |
9 500 |
30 |
0 |
0 |
70 |
9 560 |
133 560 |
0,0716 |
22 |
126 030 |
11 600 |
80 |
0 |
0 |
30 |
11 760 |
137 740 |
0,0854 |
23 |
123 750 |
11 830 |
70 |
10 |
0 |
110 |
12 000 |
135 770 |
0,0885 |
24 |
121 820 |
11 010 |
150 |
10 |
20 |
80 |
11 420 |
133 090 |
0,0859 |
25 |
137 460 |
12 420 |
100 |
0 |
0 |
60 |
12 620 |
150 040 |
0,0841 |
26 |
115 370 |
11 320 |
110 |
0 |
0 |
80 |
11 540 |
126 880 |
0,0910 |
27 |
117 840 |
11 580 |
190 |
0 |
0 |
40 |
11 960 |
129 650 |
0,0923 |
28 |
118 270 |
10 690 |
110 |
0 |
10 |
30 |
10 950 |
129 110 |
0,0848 |
29 |
82 990 |
7 600 |
120 |
0 |
0 |
40 |
7 840 |
90 750 |
0,0864 |
30 |
77 690 |
5 950 |
40 |
10 |
0 |
30 |
6 060 |
83 720 |
0,0724 |
31 |
58 800 |
4 820 |
50 |
20 |
0 |
30 |
4 980 |
63 720 |
0,0782 |
32 |
67 110 |
4 480 |
150 |
20 |
0 |
110 |
4 840 |
71 870 |
0,0674 |
33 |
67 080 |
4 240 |
40 |
0 |
0 |
50 |
4 320 |
71 410 |
0,0605 |
34 |
67 010 |
3 800 |
30 |
10 |
10 |
70 |
3 930 |
70 930 |
0,0555 |
35 |
90 720 |
4 570 |
60 |
20 |
0 |
30 |
4 750 |
95 400 |
0,0498 |
36 |
77 950 |
3 800 |
10 |
10 |
0 |
30 |
3 850 |
81 800 |
0,0471 |
37 |
81 320 |
4 070 |
50 |
10 |
10 |
10 |
4 240 |
85 470 |
0,0496 |
38 |
92 290 |
3 780 |
30 |
20 |
30 |
30 |
4 020 |
96 180 |
0,0418 |
39 |
74 030 |
2 920 |
50 |
0 |
0 |
30 |
3 020 |
77 030 |
0,0392 |
40 |
88 940 |
2 720 |
70 |
10 |
10 |
50 |
2 930 |
91 800 |
0,0319 |
41 |
71 250 |
2 140 |
0 |
0 |
0 |
20 |
2 140 |
73 410 |
0,0292 |
42 |
81 560 |
2 010 |
30 |
0 |
0 |
60 |
2 070 |
83 660 |
0,0248 |
43 |
72 930 |
1 270 |
10 |
0 |
0 |
30 |
1 290 |
74 240 |
0,0174 |
44 |
69 660 |
930 |
10 |
0 |
0 |
50 |
950 |
70 650 |
0,0135 |
45 |
84 290 |
760 |
30 |
10 |
10 |
30 |
890 |
85 130 |
0,0105 |
46 |
67 330 |
510 |
0 |
50 |
30 |
40 |
780 |
67 960 |
0,0115 |
47 |
66 220 |
270 |
10 |
0 |
10 |
0 |
330 |
66 510 |
0,0050 |
48 |
74 790 |
310 |
10 |
10 |
0 |
30 |
360 |
75 150 |
0,0048 |
49 |
57 600 |
120 |
0 |
20 |
10 |
20 |
220 |
57 770 |
0,0038 |
TOTAL |
3 473 050 |
170 910 |
1 760 |
250 |
150 |
1 600 |
175 780 |
3 647 720 |
1,6157 |
* Taux de fécondité par âge |
La colonne « Manquant » indique que seulement 1 600 femmes sur près de 3,65 millions âgées entre 15 et 49 ans n’ont pas eu leur fécondité récente enregistrée. Ceci représente 0,04 % de l’ensemble des femmes et n’aura pas d’impact sur la fécondité estimée des femmes au Cambodge. Un contrôle supplémentaire portant sur la distribution par âge de ces cas ne fait pas apparaître de schéma particulier d’omission. Le nombre de naissances est égal à la somme pondérée des femmes déclarant 1, 2, 3 ou 4 accouchements, sur la dernière ligne. 173 070 femmes (170 910 + 1 760 + 250 + 150) ont eu un total de 175 780 naissances (1x170 910 + 2×1 760 + 3×250 + 4×150) au cours de l’année précédant le recensement. Parmi ces femmes, 98,8 % (170 910 / 173 070) ont eu une seule naissance, 1,0 % ont eu des jumeaux et 0,2 % des triplés ou plus. L’éventualité de quintuplés (ou de cinq naissances en deux accouchements au cours de la période) est si faible qu’elle peut être ignorée. Si le recensement n’avait pas comptabilisé les naissances multiples séparément, le taux brut de natalité aurait été sous-estimé par un facteur de 173 070/175 780 = 0,984. La sous-estimation est donc de 1,6 %.
A partir des données ci-dessus, la série des taux de fécondité par année d’âge est obtenue en divisant le nombre total de naissances issues des femmes de chaque âge par le nombre de femmes ayant déclaré leur fécondité récente, c’est-à-dire en excluant les femmes qui n’ont pas déclaré combien de naissances elles ont eu au cours de l’année passée. Les taux sont représentés sur la figure 1. Alors que le nombre de femmes dénombrées à chaque âge est erratique, les taux de fécondité par année d’âge sont relativement lisses, avec un schéma de fécondité clairement défini et un pic caractéristique aux environs de 25 ans.
Selon ces données, l’indice synthétique de fécondité est de 1,61 enfants par femme. Le calcul conduit par groupes d’âges quinquennaux donne le même résultat (tableau 3), même si les mesures diffèrent à la troisième décimale, comme on l’a évoqué plus haut.
Tableau 3 Taux de fécondité par groupes d’âge quinquennaux, Cambodge, recensement de 2008 et Enquêtes Démographiques et de Santé 2005 et 2010
Groupe d’âge |
Femmes |
Manquant |
Naissances |
Taux |
|
EDS2005 |
EDS2010 |
15-19 |
780 320 |
220 |
11 160 |
0,014 |
|
0,047 |
0,046 |
20-24 |
697 160 |
380 |
53 740 |
0,077 |
|
0,175 |
0,173 |
25-29 |
626 430 |
250 |
54 910 |
0,088 |
|
0,180 |
0,167 |
30-34 |
361 650 |
290 |
24 130 |
0,067 |
|
0,142 |
0,121 |
35-39 |
435 880 |
130 |
19 880 |
0,046 |
|
0,091 |
0,071 |
40-44 |
393 760 |
210 |
9 380 |
0,024 |
|
0,041 |
0,028 |
45-49 |
352 520 |
120 |
2 580 |
0,007 |
|
0,005 |
0,004 |
TF |
|
|
1,61 |
|
3,41 |
3,05 |
|
Source: Recensement, nos calculs ; EDS, StatCompiler (www.statcompiler.com) |
Même en l’absence de contrôle externe, les résultats tirés des données du recensement de 2008 font apparaître des niveaux de fécondité invraisemblablement bas au Cambodge. Les données sont également incohérentes avec les parités moyennes calculées plus haut à la section sur l’évaluation de la qualité des données sur les descendances [1]. Ceci suggère que les données sur la fécondité récente recueillies dans ce recensement sont fortement déficientes. Des contrôles externes le confirment, sous forme d’estimations de fécondité tirées de deux EDS réalisées avant et après le recensement. Selon les données des deux dernières colonnes du tableau 3, l’indice synthétique de fécondité estimé à partir de l’EDS 2010 (fondé sur les naissances des trois ans précédant l’enquête) est de 3,1 enfants par femme. L’estimation à partir de l’EDS de 2005 était de 3,4 enfants par femme. Seulement la moitié environ des naissances survenues dans l’année précédant le recensement ont été déclarées aux agents recenseurs.
Le graphique de gauche sur la figure 2 représente les taux de fécondité par âge calculés à partir du recensement de 2008 et des deux EDS. Les taux tirés du recensement diffèrent clairement de ceux tirés des EDS. Ces derniers, de leur côté, présentent un schéma plutôt étrange d’évolution de la fécondité en cinq ans, marquée par des réductions à peu près constante entre 25 et 44 ans. Le graphique de droite de la figure 2 représente les même taux mais ramenés à un même indice synthétique de fécondité de un enfant par femme. Malgré des différences fortes dans le niveau global de la fécondité, la forme des trois distributions par âge est très semblable, la seule réelle différence entre elles étant à 20-24 ans. C’est pourquoi il semble peu vraisemblable qu’il y ait d’importantes différences dans la qualité de la déclaration de la fécondité récente selon l’âge des femmes dans le recensement de 2008 au Cambodge.
Même si le niveau de la fécondité tiré des données du recensement de 2008 est sérieusement biaisé, la forme de la distribution par âge de la fécondité est raisonnablement précise. Ceci est une condition préalable à l’application de nombreuses méthodes indirectes d’estimation de la fécondité.
Si les données sont classées par date de naissance du dernier né des femmes, il convient de choisir une période appropriée pour les analyses sur la fécondité. En général, il est conseillé de ne pas prendre des périodes beaucoup plus longues qu’un an car des périodes plus longues accroissent la probabilité que les femmes aient eu plus d’une grossesse au cours de cette période. Les naissances ayant eu lieu plus anciennement sont donc omises (la condition requise étant de déclarer la date de naissance du dernier né, pas de tous les enfants nés au cours de la période), ce qui signifie que les estimations de la fécondité excluront systématiquement des naissances dans le passé le plus ancien. En outre, si la fécondité a évolué rapidement, allonger la période de recherche au-delà d’un an signifie que les estimations représenteront une sorte de moyenne de la fécondité au long de la période. Si le recensement a eu lieu assez tôt ou assez tard dans l’année, il peut être intéressant de calculer les taux sur les naissances depuis le début de l’année précédente ou de l’année courante car ce choix ne nécessite pas que les femmes se souviennent précisément du mois de naissance de leur enfant. Le nombre de naissances déclaré au cours de la période de référence peut alors être ramené à une estimation des naissances annuelles par un calcul au prorata. On peut calculer les taux à la fois de cette façon et en s’appuyant sur une période de référence de 12 mois puis comparer les résultats.
Le scénario (3) au tableau 1 ne permet pas d’obtenir une mesure tout à fait précise de la fécondité puisque l’âge de la mère à la naissance de l’enfant ne peut pas être établi précisément. La connaissance de la date de naissance de l’enfant permet bien, toutefois, de déterminer plus soigneusement le dénominateur des taux de fécondité par âge.
Dans la situation courante où la question posée porte sur le mois et l’année de naissance du dernier enfant, une démarche plus soigneuse peut permettre de déterminer le nombre de naissances au cours de l’année passée. En général la date du recensement est fixée conventionnellement. Les questions dans le questionnaire de recensement se réfèrent généralement à un jour particulier, même si le processus effectif de dénombrement prend plusieurs semaines. Une liste des dates de recensement pour les trois dernières vagues de recensement a été établie par les Nations Unies : http://unstats.un.org/unsd/demographic/sources/census/censusdates.htm [17] ; une liste des dates de recensement pour les données diffusées par IPUMS est disponible à https://international.ipums.org/international/samples.shtml [18].
Lors de la détermination du numérateur, toutes les naissances déclarées dans le mois du recensement, et une proportion au prorata des naissances déclarées s’être produites le mois équivalent un an plus tôt doivent être incluses. Pour tirer cette information des données de recensement, en fonction de la capacité de traitement des dates des logiciels statistiques utilisés, on peut recourir à la procédure de numérotation des mois à partir du début du siècle des EDS.
Tableau 4 Naissances déclarées chaque mois par âge de la mère à la date de recensement (24-25 août 1999), Kenya, recensement de 1999
|
Age de la mère au recensement |
||||||
Mois |
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
Août 1998 |
13 240 |
31,300 |
23,120 |
13,940 |
8,940 |
3,220 |
560 |
Septembre 1998 |
9 800 |
22,900 |
17,260 |
9,560 |
6,180 |
2,080 |
680 |
Octobre 1998 |
9 240 |
21,580 |
15,520 |
9,600 |
5,880 |
1,880 |
500 |
Novembre 1998 |
9 040 |
21,940 |
16,060 |
9,880 |
5,280 |
1,660 |
540 |
Décembre 1998 |
10 200 |
23,700 |
18,000 |
10,580 |
5,940 |
2,080 |
480 |
Janvier1999 |
14 720 |
28,620 |
20,620 |
12,260 |
7,300 |
2,180 |
660 |
Février 1999 |
20 740 |
42,140 |
30,860 |
17,400 |
11,220 |
4,560 |
2,060 |
Mars 1999 |
15 620 |
31,480 |
21,320 |
12,520 |
7,340 |
2,820 |
520 |
Avril 1999 |
18 660 |
33,160 |
24,260 |
12,240 |
7,820 |
2,860 |
720 |
Mai 1999 |
19 660 |
33,880 |
22,860 |
13,960 |
7,440 |
2,480 |
760 |
Juin 1999 |
20 100 |
32,140 |
23,380 |
12,580 |
7,300 |
2,720 |
560 |
Juillet 1999 |
21 600 |
32,360 |
23,860 |
13,800 |
7,060 |
2,640 |
520 |
Août 1999 |
15 900 |
25,020 |
16,720 |
9,280 |
5,840 |
1,620 |
360 |
Naissances estimées l’année passée |
188 269,68 |
355 987,74 |
255 940,65 |
146 807,74 |
86 618,71 |
30 307,10 |
8 486,45 |
Nombre de femmes |
1 700 060 |
1 495 180 |
1 205 060 |
849 620 |
725 780 |
519 740 |
417 500 |
Taux de fécondité par âge |
0,1107 |
0,2381 |
0,2124 |
0,1728 |
0,1193 |
0,0583 |
0,0203 |
Lors du recensement de 1999 au Kenya, la date de référence officielle était la nuit du 24 au 25 août 1999. Pour estimer les naissances survenues dans l’année précédant le recensement, toutes les naissances déclarées entre septembre 1998 et août 1999 doivent être incluses, ainsi que 1-24/31 (=7/31) des naissances déclarées en août 1998. Ceci suppose que les naissances sont uniformément réparties au long du mois (Tableau 4). Par exemple, le nombre estimé de naissances au cours de l’année précédant le recensement dans le groupe 30-34 ans est donné par
En l’absence d’information supplémentaire sur la date de naissance de la mère, les données ci-dessus sont classées selon le groupe d’âge de la mère à la date du recensement. Comme on l’a dit précédemment, les taux ainsi calculés doivent faire l’objet d’un décalage d’une demi-année.
Les taux de fécondité par âge sont obtenus en divisant ces naissances par le nombre de femmes dans chaque groupe d’âge. Les estimations de l’indice synthétique de fécondité qui en résultent sont sensiblement éloignées des autres estimations de la fécondité dans le pays vers cette époque. Comme au Cambodge, ceci donne à penser que les naissances au cours de l’année précédant le recensement sont fortement sous-déclarées.
On ne peut prendre une mesure précise de la fécondité que dans le cas (4), quand on dispose d’une information détaillée sur la date de naissance aussi bien de la mère que de l’enfant. Mais si certaines dates de naissance (par exemple le 1er janvier) exercent une forte attraction, le recours à des mesures affinées ne sert à rien car elles seront biaisées par l’attraction. Comme il y a peu de chances que la qualité et la cohérence interne des données recueillies lors d’un recensement soient aussi bonnes que dans une EDS, il est inutile d’appliquer le même calcul précis que celui qu’on utilise dans une EDS. Il y a toutefois des situations où l’attraction lors de la déclaration des dates de naissance et les autres erreurs dans les données jouent un rôle suffisamment limité pour qu’il vaille la peine de faire un calcul direct des estimations de fécondité. Dans ces cas, on doit appliquer les principes décrits pour le calcul des estimations de la fécondité récente à partir des données d’enquête [13].
Moultrie, Tom A. and Ian M. Timæus. 2002. Trends in South African Fertility between 1970 and 1998: An Analysis of the 1996 Census and the 1998 Demographic and Health Survey. Cape Town: Medical Research Council. http://www.mrc.ac.za/bod/trends.pdf [19]. Accessed 1 May 2011.
Liens:
[1] http://demographicestimation.iussp.org/fr/content/evaluation-de-la-qualit%C3%A9-des-donn%C3%A9es-sur-la-parit%C3%A9
[2] http://demographicestimation.iussp.org/fr/content/la-correction-d%E2%80%99el-badry
[3] http://demographicestimation.iussp.org/fr/content/evaluation-de-la-qualit%C3%A9-des-donn%C3%A9es-sur-la-f%C3%A9condit%C3%A9-r%C3%A9cente-tir%C3%A9es-des-recensements
[4] http://demographicestimation.iussp.org/fr/content/le-mod%C3%A8le-relationnel-de-gompertz
[5] http://demographicestimation.iussp.org/sites/new-demographicestimation.iussp.org/files/imagecache/wysiwyg_imageupload_lightbox_preset/sites/demographicestimation.iussp.org/files/wysiwyg_imageupload/3/FE_DIR_CEN_01_FR.png
[6] http://www.statcompiler.com
[7] http://hdl.handle.net/10125/3600
[8] http://demographicestimation.iussp.org/sites/demographicestimation.iussp.org/files/FE_elBadry_FR.xlsx
[9] http://demographicestimation.iussp.org/fr/content/evaluation-de-la-qualit%C3%A9-des-donn%C3%A9es-sur-les-descendances
[10] http://demographicestimation.iussp.org/sites/new-demographicestimation.iussp.org/files/imagecache/wysiwyg_imageupload_lightbox_preset/sites/demographicestimation.iussp.org/files/wysiwyg_imageupload/1657/FE_ELBAD_01_FR.png
[11] http://unstats.un.org/unsd/demographic/standmeth/handbooks/Manuel_X-fr.pdf
[12] http://dx.doi.org/10.1080/01621459.1961.10482134
[13] http://demographicestimation.iussp.org/sites/new-demographicestimation.iussp.org/files/sites/demographicestimation.iussp.org/files/FE_elBadry_6.xlsx
[14] http://demographicestimation.iussp.org/sites/new-demographicestimation.iussp.org/files/sites/demographicestimation.iussp.org/files/FE_elBadry_FR_0.xlsx
[15] http://demographicestimation.iussp.org/sites/new-demographicestimation.iussp.org/files/imagecache/wysiwyg_imageupload_lightbox_preset/sites/demographicestimation.iussp.org/files/wysiwyg_imageupload/1657/FE_DIR_CEN_02_FR.png
[16] http://demographicestimation.iussp.org/sites/new-demographicestimation.iussp.org/files/imagecache/wysiwyg_imageupload_lightbox_preset/sites/demographicestimation.iussp.org/files/wysiwyg_imageupload/1657/FE_DIR_CEN_03_FR.png
[17] http://unstats.un.org/unsd/demographic/sources/census/censusdates.htm%20%5b16
[18] https://international.ipums.org/international/samples.shtml
[19] http://www.mrc.ac.za/bod/trends.pdf
[20] http://demographicestimation.iussp.org/sites/new-demographicestimation.iussp.org/files/imagecache/wysiwyg_imageupload_lightbox_preset/sites/demographicestimation.iussp.org/files/wysiwyg_imageupload/3/df_fig1_1.png