Comparaison des parités par cohorte et des données d’état civil

Mon, 21/12/2015 - 17:46 — Tom Moultrie

Description de la méthode

Le modèle relationnel synthétique de Gompertz présente une méthode pour comparer les parités moyennes avec leurs équivalents calculés à partir des taux de fécondité par période sans avoir à supposer que la fécondité est constante. L’aspect le plus important des cette méthode est que les parités moyennes sont calculées pour une période plutôt que pour une série de cohortes. Elle nécessite cependant la disponibilité de données sur le nombre d’enfants déjà nés à deux dates, à cinq ou dix ans d’écart. S’il n’existe qu’une source de données sur le nombre d’enfants déjà nés, ou si la période entre deux enquêtes n’est pas (au moins approximativement) de cinq ou dix ans, on doit recourir à une procédure alternative qui ne requiert pas l’hypothèse de fécondité constante.

C’est le cas de la méthode présentée ici. Celle-ci a des avantages théoriques spécifiques, mais son application pratique nécessite une assez longue série de données annuelles sur les naissances classées par âge de la mère. Elle est principalement utilisée avec des données sur les naissances enregistrées à l’état civil, généralement la seule source d’information sur les naissances par année sur une période de 20 ans. Mais si des distributions de fécondité sont connues grâce à d’autres sources par intervalles quinquennaux (par exemple des histoires génésiques complètes recueillies à plusieurs reprises), elles peuvent aussi être utilisées. La description faite ici se réfère à des données d’un enregistrement à l’état civil. En général, si on utilise des parités jusqu’à l’âge x, il est nécessaire de disposer de données de fécondité pour au moins les x-15 années précédentes, afin de faire les comparaisons pertinentes.

La méthode s’appuie sur la nature longitudinale des parités moyennes déclarées et les compare avec leurs équivalents (descendances) tirés des taux de fécondité enregistrés appartenant aux cohortes adéquates. Si on considère des femmes âgées de 30-34 ans lors d’un recensement, elles étaient âgées de 20-24 ans dix ans auparavant et de 10-14 ans vingt ans avant le recensement. Si la fécondité débute à 15 ans, les enfants déjà nés déclarés par des femmes âgées jusqu’à 35 ans au moment du recensement reflètent l’expérience cumulée de ces femmes en matière de fécondité au cours des vingt années passées. Si on peut supposer que la mortalité et la migration sont indépendantes de la fécondité de ces femmes et si des taux de fécondité peuvent être calculés pour ces vingt années, des parités moyennes équivalentes (descendances) peuvent être calculées pour chaque cohorte et comparées à la parité moyenne des femmes au moment du recensement.

La difficulté lors de l’application de ce principe général est qu’une cohorte représentée par un groupe d’âge quinquennal conventionnel au moment du recensement n’a pas appartenu à un groupe d’âge quinquennal conventionnel au cours de chacune des années antérieures. Ainsi, la population âgée de 30-34 ans au moment du recensement était âgée de 29-33 ans l’année précédente, de 28-32 ans deux années plus tôt, et ainsi de suite. Si les naissances enregistrées à l’état civil sont classées par année d’âge de la mère, le problème n’est pas important, car on peut calculer des taux de fécondité par année d’âge pour chaque année et les regrouper ensuite relativement facilement par cohorte. L’élaboration des tableaux et les calculs risquent cependant d’être longs et l’attraction de certains âges peut avoir un effet non négligeable sur les taux de fécondité. Il est donc commode de disposer d’une méthode qui puisse être appliquée à des taux par groupe quinquennal conventionnel.

Il est important de noter que la méthode peut être utilisée pour évaluer la complétude de l’enregistrement des naissances à l’état civil.

Dans sa formulation initiale, la méthode posait de nombreux problèmes d’interpolation décrits par le Manuel X (Division de la Population des NU 1984 : 46-56). Sa reformulation ici comme variante du modèle relationnel de Gompertz permet de les contourner.

Données nécessaires

Les données nécessaires pour cette méthode sont :

Le nombre d’enfants déjà nés, ou les parités moyennes, par groupe d’âge quinquennal de la mère, dans un recensement récent.
Les naissances enregistrées à l’état civil par groupe d’âge quinquennal de la mère pour chacune des 15 ou 20 années précédant le recensement.
Le nombre de femmes dans chaque groupe d’âge au recensement, et dans un ou plusieurs recensements antérieurs, pour permettre l’estimation de la population féminine par groupe d’âge quinquennal pour chacune des 15 ou 20 années précédant le recensement récent.

Hypothèses

La plupart des hypothèses sont celles associées au modèle relationnel de Gompertz, à savoir :

Le schéma de fécondité standard choisi pour la procédure d’ajustement reflète de façon appropriée la forme de la distribution de la fécondité dans la population.
Les changements de la fécondité ont été réguliers et graduels et ont affecté tous les groupes d’âge dans une mesure comparable.
Les erreurs dans les taux de fécondité avant ajustement sont proportionnellement les mêmes parmi les femmes dans les groupes d’âge centraux (20-39 ans), de sorte que la forme de la fécondité par âge des naissances récentes déclarées est à peu près correcte.

La méthode repose aussi sur l’hypothèse que les populations au dénominateur des taux de fécondité ont été corrigées du sous-enregistrement et d’autres erreurs. C’est d’autant plus important que le numérateur et le dénominateur proviennent de sources différentes.

Travail préparatoire et rechereches préliminaires

Avant d’entreprendre l’analyse des niveaux de fécondité en recourant à cette méthode, l’analyste doit vérifier la qualité des données au moins sur les points suivants :

structure par âge et sexe de la population ;
naissances déclarées au cours de l’année écoulée, et
parités moyennes et nécessité d’une correction d’el Badry.

Précautions et mises en garde

La méthode vise à estimer les niveaux récents de la fécondité et à mesurer la complétude de l’enregistrement des naissances, en vue d’ajuster les naissances enregistrées récemment pour tenir compte des omissions. Les effets des autres erreurs, comme les variations de la couverture du recensement au fil du temps, doivent donc avoir été corrigés avant de cumuler les taux de fécondité par âge pour comparer le résultat aux parités moyennes. Quand il apparaît que la complétude du dénombrement a varié, les recensements doivent être ajustés autant que possible avant de calculer les dénominateurs des taux. Il ne s’agit pas de corriger chaque recensement du sous-dénombrement absolu ; il suffit de s’assurer que la complétude relative des recensements antérieurs est la même que celle du plus récent.

Application de la méthode

Etape1 : Calculer les parités moyennes déclarées

Calculer les parités moyennes,

_{5} P_{x}

des femmes de chaque groupe d’âge (x, x+5), pour x =15, 20, 45, si ça n’a pas déjà été fait lors des recherches préliminaires.

Etape 2 : Estimer la population féminine par groupe d’âge au milieu de chaque année précédant le dernier recensement

La procédure exacte pour estimer la série des populations féminines par groupe d’âge en milieu d’année dépend des dates des recensements disponibles. Nous présentons donc la procédure seulement en termes généraux.

On suppose que les recensements couvrent, au moins à peu près, les années pour lesquelles on doit cumuler les taux de fécondité enregistrés, car il est préférable que la procédure ci-dessous recoure uniquement à des interpolations de population entre les dates de recensement, plutôt qu’à des extrapolations pour des dates antérieures ou postérieures à celles couvertes par les recensements.

Soit t_a la date de référence de chaque recensement a, tenant compte de la fraction d’année jusques et y compris la date exacte, ou la date de référence centrale du recensement. Par exemple, le nombre représentant la date d’un recensement réalisé la nuit du 9 au 10 octobre 2001 est calculé en additionnant les jours de l’année précédant la nuit du recensement :

2001 + \frac{(31 + 28 + 31 + 30 + 31 + 30 + 31 + 31 + 30 + 9)}{365} = 2001 + \frac{282}{365} = 2001, 773

Le taux de croissance r(i,a) de chaque groupe d’âge i entre le recensement a et le recensement a+1 est alors obtenu en divisant la différence entre les logarithmes naturels de la population féminine du groupe d’âge i au second et au premier recensement, N(i,t_a₊₁) et N(i,t_a) respectivement, par la longueur de la période intercensitaire en années :

r (i, a) = \frac{\ln (N (i, t_{a + 1})) - \ln (N (i, t_{a}))}{t_{a + 1} - t_{a}} = \frac{\ln (\frac{N (i, t_{a + 1})}{N (i, t_{a})})}{t_{a + 1} - t_{a}}

Equation 1

S’il y a trois recensements couvrant la période étudiée, on doit calculer r(i,1) pour la période entre le premier et le deuxième recensement, et r(i,2) pour la période entre le deuxième et le troisième recensement.

La population au milieu de chaque année entre t_a et t_a+1 pour chaque groupe d’âge peut alors être estimée à partir de la population initiale :

N (i, t) = N (i, t_{a}) \exp (r (i, a) (t + 0.5 - t_{a}))

Equation 2

pour t_a< t < t_a+1.

S’il est nécessaire d’extrapoler à des dates avant le premier recensement ou après le dernier, le taux de croissance de l’intervalle intercensitaire le plus proche doit être utilisé.

Les N(i,t) étant des population estimées en milieu d’année au groupe d’âge i au temps t, ils représentent les dénominateurs approchés pour le calcul des taux de fécondité par âge cette année.

Etape 3 : Calculer les taux de fécondité par âge à partir des naissances enregistrées au cours des années antérieures au recensement

On doit disposer de taux de fécondité par âge pour un nombre d’années égal à l’âge le plus élevé pour lequel on souhaite utiliser les parités moins 15 ans. Par exemple, si on utilise des parités jusqu’à 35 ans (c’est-à-dire le groupe 30-34 ans), il est nécessaire de disposer de taux de fécondité remontant à 20 ans en arrière. Le taux pour le groupe d’âge i et l’année civile t, f(i,t), est égal à

f (i, t) = \frac{B (i, t)}{N (i, t)}

où B(i,t) est le nombre de naissances enregistrées, étant survenues chez les femmes du groupe d’âge i l’année t.

Si on ne dispose pas des naissances par âge de la mère pour quelques-unes des vingt années nécessaires, l’application de la méthode n’en sera guère affectée si les taux des années manquantes peuvent être interpolés à partir de ceux des années voisines. Par exemple, si on ne dispose des taux de fécondité que pour les seize dernières années sur les vingt nécessaires pour une analyse de la complétude de l’enregistrement pour les femmes de moins de 35 ans, on peut utiliser les taux de l’année disponible la plus ancienne pour les quatre années précédentes sans grand risque d’introduire des erreurs importantes, car les valeurs imputées qui seront ensuite utilisées dans l’analyse concernent les femmes alors âgées de 15-19 ans, dont la fécondité est généralement relativement faible. En revanche, il faut éviter d’extrapoler les données à partir du passé afin d’imputer des valeurs pour les années les plus récentes car l’imputation concernerait davantage de groupes d’âge, y compris les âges de forte fécondité, où les variations au fil du temps risquent de se produire.

Etape 4 : Cumuler la fécondité enregistrée dans les différentes cohortes féminines afin d’estimer des descendances (parités équivalentes)

Les naissances étant classées par année civile, les taux de fécondité par âge sont obtenus selon le même classement. L’addition des taux jusqu’à la fin de chaque groupe d’âge donne donc des cumuls de fécondité qui correspondent à la fin des années civiles. Il est peu vraisemblable que le recensement dont sont tirées les parités moyennes ait sa date de référence au 31 décembre d’une année, mais comme les parités moyennes d’un groupe d’âge donné évoluent lentement même quand la fécondité change rapidement, on peut considérer que les parités au recensement se réfèrent la fin d’année la plus proche de la date de référence, et les taux enregistrés peuvent être cumulés jusqu’à cette même fin d’année. Ainsi, si le recensement a lieu avant le 1^er juillet, on cumulera les taux enregistrés jusqu’à la fin de l’année précédant la date du recensement, alors que si le recensement a lieu au second semestre, les taux enregistrés seront cumulés jusqu’à la fin de l’année du recensement. Il n’est pas justifié de développer des procédures plus précises et plus raffinées (en recourant par exemple à des extrapolations exponentielles), compte tenu des incertitudes et des erreurs qui affectent la méthode.

Pour estimer les descendances à partir de la fécondité des périodes, on applique un modèle relationnel de Gompertz aux taux de fécondité par âge obtenus à l’étape précédente. Les taux de fécondité par âge sont d’abord cumulés chaque année jusqu’à 20, 25, 30 et 35 ans. On prend ensuite les gompits des rapports entre les estimations adjacentes de la fécondité cumulée, comme on le fait dans la version standard du modèle relationnel de Gompertz. Ces rapports correspondent aux z(x) de la formulation conventionnelle du modèle.

Dans un deuxième temps, les estimations des paramètres sont tirées des valeurs de z(x) calculées pour chaque année. On procède de la même manière que lors de l’ajustement d’un modèle relationnel de Gompertz sur les seuls F-points dans la formulation conventionnelle du modèle. Nous supposons à nouveau une série de 20 ans de données d’état civil à 15-34 ans. Une régression de z(x) - e(x) sur g(x), où e(x) et g(x) sont tirés du schéma de fécondité standard, à 20, 25 et 30 ans, permet ensuite d’estimer α(t) et β(t). β(t) est la pente de la régression linéaire fondée sur les trois valeurs de z(x) l’année t ; l’ordonnée à l’origine est égale à α(t)+(β(t) - 1)².c/2, où c’est une constante tirée du standard de fécondité utilisé.

Troisièmement, le modèle relationnel de Gompertz sert à estimer la fécondité par année d’âge pour chaque année civile. Les valeurs de α(t) et β(t) calculées lors de la précédente étape servent à déterminer la forme du schéma de fécondité, alors que le niveau est tiré des cumuls de fécondité à chaque âge, 25, 30 et 35 ans. L’estimation de l’indice synthétique de fécondité associé à la fécondité cumulée jusqu’à l’âge x l’année t est donnée par

T F (x, t) = \frac{F (x, t)}{\exp (- \exp (- α (t) - β (t) Y^{s} (x)))}

Equation 3

où F(x,t) est la fécondité cumulée à l’âge x l’année t et Y^s(x) est le gompit à l’âge x du schéma standard de fécondité modifié par Zaba. Il en résulte trois estimations de l’indice synthétique de fécondité dont la moyenne détermine l’indice synthétique de fécondité chaque année. Il est ensuite simple d’estimer la fécondité entre les âges x et x+1 au temps t, f(x,t) :

\begin{array}{l} f (x, t) \\ = T F (x, t) \cdot (\begin{array}{l} e x p (- e x p (- α (t) - β (t) Y s (x + 1))) \\ - e x p (- e x p (- α (t) - β (t) Y s (x))) \end{array}) . \end{array}

Equation 4

Quatrièmement, les descendances sont obtenues en additionnant les taux de fécondité par année d’âge et année civile pour chaque cohorte quinquennale, et en divisant par cinq (largeur de l’intervalle d’âge). Si on note E(i,s) ces descendances, où i=1 correspond au groupe 15-19 ans, i=2 au groupe 20-24 ans, etc., s désigne la dernière année pour laquelle les estimations sont calculées, alors

E (i) = \sum_{j = 0}^{5 i + 3} \sum_{m = 5 i + 9}^{5 i + 13} f (m - j, s - j)

Equation 5

Etape 5 : Estimer la complétude de l’enregistrement des naissances

On a construit la fécondité cumulée par cohorte à partir des naissances enregistrées, E(i), calculée à l’étape précédente, de sorte qu’elle soit comparable à la parité déclarée par cohorte, P(i), au dernier recensement. Le rapport E(i)/P(i) donne donc une mesure de la complétude moyenne de l’enregistrement des naissances dans la cohorte i. Si la complétude de l’enregistrement est restée à peu près constante pendant une quinzaine d’années, les rapports E/P auront plus ou moins les mêmes valeurs pour toutes les cohortes, et une moyenne des rapports pour les groupes 20-24, 25-29 et 30-34 ans peut être utilisée comme estimation de la complétude de l’enregistrement à l’état civil au long de la période. Son inverse peut être utilisé comme facteur d’ajustement pour les taux de fécondité par âge calculés à l’étape 3.

L’interprétation de ces rapports E/P est prise entre deux forces contradictoires. D’un côté, en général, si la complétude de l’enregistrement des naissances s’est améliorée au fil du temps, les rapports E/P seront plus élevés pour les cohortes jeunes que pour les plus âgées. Dans un tel cas, on peut ajuster la distribution de fécondité la plus récente (fondée sur les naissances enregistrées) par P(2)/E(2), le rapport reflétant le niveau de complétude le plus récent. (On évitera en général d’utiliser P(1)/E(1) comme facteur d’ajustement, compte tenu de la difficulté intrinsèque à approximer E(1) correctement.) Cependant, lorsque les rapports E/P indiquent une amélioration de la complétude de l’enregistrement au fil du temps, il n’existe pas de base évidente pour ajuster les distributions de fécondité des périodes anciennes.

Seconde force en jeu : les rapports E/P peuvent être moins élevés pour les femmes jeunes que pour les plus âgées du fait d’un enregistrement moins fiable et moins ponctuel des naissances par les jeunes mères. Si c’est le cas, le rapport E/P aux jeunes âges donne une mauvaise représentation de la complétude des données d’état civil. Au contraire, les estimations de complétude fondées sur les déclarations des femmes de 25-29 et 30-34 ans sont relativement peu affectées par les fortes omissions aux jeunes âges et il peut être judicieux de déterminer la complétude en faisant la moyenne de ces deux rapports E/P.

Interprétation et diagnostics

Une hypothèse importante dans cette méthode est que les dénominateurs utilisés dans le calcul des taux de fécondité par âge sont précis. Comme le numérateur et le dénominateur des taux viennent de deux sources différentes, la distribution par âge des taux de fécondité du moment sera déformée si des erreurs dans la déclaration des âges jouent différemment lors de l’enregistrement des naissances et lors du dénombrement des populations. Des variations erratiques des taux de croissance par âge peuvent suggérer des problèmes de déclaration des âges, mais les effets de ces mauvaises déclarations sur les estimations finales de complétude sont très difficiles à prédire. Les dénominateurs peuvent aussi être déformés par des variations dans la complétude du dénombrement d’un recensement à l’autre et une complétude différentielle du dénombrement selon l’âge peut affecter les résultats. Les variations dans la complétude du dénombrement peuvent aussi jouer sur les parités moyennes. Si par exemple les mères sont mieux dénombrées que les femmes sans enfants, les parités moyennes s’en trouvent surévaluées.

Exemple

Nous utilisons les données tirées de trois recensements réalisés au Chili en avril 1970, avril 1982 et avril 1992 respectivement. Les tableaux originaux figurent dans les Annuaires démographiques de la Division statistique des NU ; ils portent sur le nombre de femmes par groupe d’âge aux différents recensements ; les naissances déclarées par âge de la mère et année ; le nombre moyen d’enfants déjà nés au dernier recensement . La mise en œuvre de la méthode fait l’objet d’un dossier Excel.

Etape1 : Calculer les parités moyennes déclarées à 15-19, …, 30-34 ans au dernier recensement

Les parités moyennes par âge au recensement de 1992 (tableau 1) sont tirées de l’Annuaire démographique.

Tableau 1 Parités moyennes, Chili, recensement de 1992

Groupe d’âge	15-19	20-24	25-29	30-34
Parité moyenne	0,14	0,69	1,37	2,02

Aucun contrôle de ces données n’est possible, en l’absence des tableaux originaux.

Etape 2 : Estimer la population féminine par groupe d’âge au milieu de chaque année précédant le dernier recensement

Les nombres de femmes dénombrées par groupe d’âge à chacun des trois recensements (tableau 2) sont tirés de l’Annuaire démographique.

Tableau 2 Nombres de femmes par groupe d’âge dénombrées aux recensements de 1970, 1982 et 1992, Chili

a	*Date du recensement (t_a)*	Groupe d’âge
a	*Date du recensement (t_a)*	15-19	20-24	25-29	30-34
1	22-avril-70	466 736	398 383	324 130	267 312
2	22-avril-82	652 552	595 598	479 199	399 344
3	22-avril-92	600 563	608 933	623 305	576 710

Les dates de référence des recensements sont : 1970,304 ; 1982,304 et 1992,306. La date de référence est légèrement différente en 1992 car l’année était bissextile. Elle est calculée de la façon suivante : 1992 + (31 + 29 + 31 + 21)/366=1992,306, la date du recensement se référant à la nuit du 21-22 avril.

Le taux de croissance de chaque période intercensitaire (tableau 3) est calculé à partir de l’équation 1.

Tableau 3 Taux de croissance intercensitaires par âge, Chili, recensements de 1970, 1982 et 1992

Période intercensitaire	Groupe d’âge
Période intercensitaire	15-19	20-24	25-29	30-34
1970-1982	0,0279	0,0335	0,0326	0,0335
1982-1992	-0,0083	0,0022	0,0263	0,0367

Par exemple le taux de croissance à 30-34 ans entre les recensements de 1982 et 1992 est égal à

r (3, 2) = \frac{\ln (\frac{576 710}{399 344})}{1992, 306 - 1982, 304} = 0, 0367.

Les taux de croissance augmentent avec l’âge et diminuent au fil du temps. Ceci suggère une baisse de la fécondité ayant débuté quelques décennies plus tôt, ce qui renforce la pertinence d’une méthode analytique qui ne postule pas une fécondité constante.

Sur la base de ces taux de croissance, on peut estimer la population des femmes par groupe d’âge au milieu de chaque année en utilisant l’équation 2. Les valeurs résultantes N(i,t) figurent au tableau 4.

Tableau 4 Populations par groupe d’âge estimées en milieu d’année, Chili

Année	Groupe d’âge
Année	15-19	20-24	25-29	30-34
1972	496 255	428 806	348 169	287 686
1973	510 309	443 420	359 700	297 472
1974	524 761	458 532	371 612	307 591
1975	539 623	474 159	383 919	318 054
1976	554 906	490 318	396 633	328 873
1977	570 621	507 029	409 769	340 060
1978	586 781	524 308	423 340	351 628
1979	603 400	542 177	437 359	363 589
1980	620 488	560 655	451 844	375 957
1981	638 061	579 762	466 808	388 746
1982	651 492	599 521	482 267	401 969
1983	646 106	597 177	494 503	417 283
1984	640 765	598 500	507 674	432 902
1985	635 469	599 827	521 196	449 104
1986	630 215	601 156	535 078	465 913
1987	625 006	602 489	549 331	483 352
1988	619 839	603 824	563 962	501 443
1989	614 715	605 162	578 984	520 211
1990	609 634	606 503	594 405	539 681
1991	604 595	607 847	610 238	559 880

Par exemple, la population des femmes de 15-19 ans, mi-1990, est égale à

N (1, 1990) = 652 552 \exp (- 0, 0083 (1990, 5 - 1982, 3)) = 609 634 .

Etape 3 : Calculer les taux de fécondité par âge à partir des naissances enregistrées au cours des années antérieures au recensement

Le nombre de naissances déclarées par groupe d’âge et année (tableau 5) est tiré de l’Annuaire démographique.

Tableau 5 Naissances déclarées par groupe d’âge de la mère et année, Chili

Année	Groupe d’âge
Année	15-19	20-24	25-29	30-34
1972	39 839	80 430	64 624	38 937
1973	40 241	82 108	63 949	38 499
1974	39 884	79 316	63 477	37 880
1975	39 086	75 519	59 365	35 863
1976	37 658	73 889	57 171	34 129
1977	36 104	71 445	53 467	32 190
1978	37 138	73 224	53 725	31 832
1979	36 833	75 905	55 361	32 537
1980	38 562	79 724	59 771	33 769
1981	40 252	86 037	64 849	36 494
1982	39 298	86 061	68 029	38 406
1983	36 077	81 213	65 236	37 506
1984	37 571	83 960	67 266	39 105
1985	34 946	80 735	69 180	39 828
1986	35 925	83 434	72 876	42 605
1987	35 633	84 674	75 416	45 037
1988	37 354	87 484	80 527	48 290
1989	39 095	86 990	82 919	50 875
1990	39 543	85 292	84 336	52 942
1991	38 324	79 406	81 907	53 425

Les taux de fécondité par âge sont obtenus en divisant les naissances (tableau 5) par la population estimée en milieu d’année pour chaque groupe d’âge et année (tableau 4). Les résultats figurent au tableau 6.

Tableau 6 Taux de fécondité par groupe d’âge et année, Chili

Année	Groupe d’âge
Année	15-19	20-24	25-29	30-34
1972	0,0803	0,1876	0,1856	0,1353
1973	0,0789	0,1852	0,1778	0,1294
1974	0,0760	0,1730	0,1708	0,1232
1975	0,0724	0,1593	0,1546	0,1128
1976	0,0679	0,1507	0,1441	0,1038
1977	0,0633	0,1409	0,1305	0,0947
1978	0,0633	0,1397	0,1269	0,0905
1979	0,0610	0,1400	0,1266	0,0895
1980	0,0621	0,1422	0,1323	0,0898
1981	0,0631	0,1484	0,1389	0,0939
1982	0,0603	0,1435	0,1411	0,0955
1983	0,0558	0,1360	0,1319	0,0899
1984	0,0586	0,1403	0,1325	0,0903
1985	0,0550	0,1346	0,1327	0,0887
1986	0,0570	0,1388	0,1362	0,0914
1987	0,0570	0,1405	0,1373	0,0932
1988	0,0603	0,1449	0,1428	0,0963
1989	0,0636	0,1437	0,1432	0,0978
1990	0,0649	0,1406	0,1419	0,0981
1991	0,0634	0,1306	0,1342	0,0954

Etape 4 : Cumuler la fécondité enregistrée dans les différentes cohortes féminines afin d’estimer des descendances (parités équivalentes)

Le calcul des descendances est fait selon la procédure suivante. Les taux de fécondité par âge du tableau 6 sont cumulés jusqu’à la limite supérieure de chaque groupe d’âge. Par exemple, la fécondité cumulée jusqu’à 25 ans en 1972 est égale à 5(0,0803 + 0,1876) = 1,3392. La fécondité cumulée jusqu’à 30 ans en 1972 est égale à 5(0,0803 + 0,1876 + 0,1856) = 2,2673. Les taux cumulés figurent au tableau 7.

Tableau 7 Fécondité cumulée jusqu’à l’âge x, par année, Chili

Année	Âge
Année	20	25	30	35
1972	0,4014	1,3392	2,2673	2,9440
1973	0,3943	1,3201	2,2091	2,8562
1974	0,3800	1,2449	2,0990	2,7147
1975	0,3622	1,1585	1,9317	2,4954
1976	0,3393	1,0928	1,8135	2,3324
1977	0,3164	1,0209	1,6733	2,1466
1978	0,3165	1,0147	1,6493	2,1019
1979	0,3052	1,0052	1,6381	2,0856
1980	0,3107	1,0217	1,6831	2,1322
1981	0,3154	1,0574	1,7520	2,2214
1982	0,3016	1,0193	1,7247	2,2024
1983	0,2792	0,9592	1,6188	2,0682
1984	0,2932	0,9946	1,6571	2,1087
1985	0,2750	0,9479	1,6116	2,0550
1986	0,2850	0,9790	1,6600	2,1172
1987	0,2851	0,9878	1,6742	2,1401
1988	0,3013	1,0257	1,7397	2,2212
1989	0,3180	1,0367	1,7528	2,2418
1990	0,3243	1,0275	1,7369	2,2274
1991	0,3169	0,9701	1,6412	2,1183

On calcule, pour chaque année, le rapport de la fécondité cumulée dans un groupe d’âge à celle dans le groupe d’âge immédiatement supérieur. Dans l’exemple du paragraphe précédent, le rapport de la fécondité cumulée à 25 ans à celle cumulée à 30 ans est égal à 1,3392/2,2673 = 0,5907. Les rapports figurent dans les trois premières colonnes du tableau 8.

On applique ensuite une transformation gompit (log-log négatif) aux rapports pour obtenir une valeur de z(x) pour chaque âge 25, 30 et 35 ans, chaque année. Sur le même exemple, la valeur de z(25) en 1972 est –ln(ln(0,5907)) = 0,6415. Les gompits sont dans les trois dernières colonnes du tableau 8.

Tableau 8 Rapports des fécondités cumulées à l’âge x et leurs gompits, par année, Chili

Année	Rapports			Gompits z(x)
Année	20	25	30	20	25	30
1972	0,2997	0,5907	0,7701	-0,1864	0,6415	1,3425
1973	0,2987	0,5976	0,7734	-0,1893	0,6639	1,3590
1974	0,3053	0,5931	0,7732	-0,1711	0,6493	1,3577
1975	0,3126	0,5997	0,7741	-0,1508	0,6709	1,3622
1976	0,3105	0,6026	0,7775	-0,1566	0,6802	1,3798
1977	0,3099	0,6101	0,7795	-0,1583	0,7050	1,3900
1978	0,3119	0,6153	0,7847	-0,1529	0,7222	1,4167
1979	0,3036	0,6136	0,7855	-0,1756	0,7167	1,4209
1980	0,3041	0,6070	0,7894	-0,1742	0,6948	1,4417
1981	0,2983	0,6035	0,7887	-0,1904	0,6833	1,4381
1982	0,2959	0,5910	0,7831	-0,1971	0,6427	1,4085
1983	0,2911	0,5925	0,7827	-0,2104	0,6475	1,4065
1984	0,2948	0,6002	0,7858	-0,2001	0,6724	1,4228
1985	0,2901	0,5882	0,7842	-0,2132	0,6336	1,4145
1986	0,2911	0,5898	0,7840	-0,2102	0,6386	1,4135
1987	0,2886	0,5900	0,7823	-0,2173	0,6393	1,4044
1988	0,2938	0,5896	0,7832	-0,2029	0,6381	1,4092
1989	0,3067	0,5915	0,7819	-0,1670	0,6441	1,4022
1990	0,3156	0,5916	0,7798	-0,1425	0,6444	1,3914
1991	0,3267	0,5911	0,7748	-0,1122	0,6429	1,3658

Les valeurs de e(x) et g(x) sont déterminées sans décalage des âges puisque les données de fécondité proviennent d’un système d’enregistrement à l’état civil et se réfèrent donc à l’âge de la mère au moment de la naissance de l’enfant. Les valeurs sont tirées de la version du standard de fécondité de Booth modifiée par Zaba, le seul standard actuellement disponible pour les femmes qui ait été validé. (Le standard et la procédure de détermination de e(x) et g(x) sont décrits en détail dans la présentation de la méthode relationnelle de Gompertz). Les valeurs de e(x) et g(x) pour les âges nécessaires à l’ajustement d’un modèle relationnel de Gompertz aux données de fécondité observées figurent au tableau 9.

Tableau 9 Valeurs de e(x) et g(x) à partir du standard modifié par Zaba (pas de décalage des âges), certains âges

Âge x	e(x)	g(x)
20	1,3539	-1,3753
25	1,4127	-0,6748
30	1,2750	0,0393

On peut donc déterminer les valeurs de z(x) – e(x) pour les trois âges, et les régresser sur les valeurs de g(x) aux mêmes âges. Dans le modèle relationnel de Gompertz, β est la pente de l’équation de régression, et α est estimé à partir de

α = intercept - {(β - 1)}^{2} . \frac{c}{2}

où c est une constante (=0,95739) tirée du standard de fécondité modifié par Zaba. Il en résulte les valeurs de α et β qui figurent aux deux premières colonnes du tableau 10.

Tableau 10 Paramètres Alpha et Beta d’un modèle relationnel de Gompertz ajusté à 20, 25 et 30 ans, Chili

Année	Alpha	Beta	Indice synthétique fondé sur le cumulant à l’âge			Moyenne
Année	Alpha	Beta	25	30	35	Moyenne
1972	0,0049	1,1367	3,5205	3,5525	3,5434	3,5388
1973	0,0242	1,1504	3,4057	3,4173	3,4130	3,4120
1974	0,0177	1,1367	3,2326	3,2701	3,2598	3,2542
1975	0,0270	1,1255	2,9825	3,0074	3,0004	2,9968
1976	0,0430	1,1420	2,7704	2,7897	2,7840	2,7814
1977	0,0585	1,1503	2,5509	2,5508	2,5498	2,5505
1978	0,0828	1,1653	2,4796	2,4782	2,4773	2,4784
1979	0,0844	1,1843	2,4518	2,4466	2,4462	2,4482
1980	0,0912	1,1982	2,4761	2,4973	2,4902	2,4879
1981	0,0850	1,2071	2,5762	2,5995	2,5916	2,5891
1982	0,0516	1,1910	2,5607	2,6054	2,5928	2,5863
1983	0,0520	1,1990	2,4083	2,4396	2,4300	2,4260
1984	0,0712	1,2032	2,4537	2,4750	2,4677	2,4654
1985	0,0527	1,2067	2,3781	2,4227	2,4099	2,4035
1986	0,0537	1,2038	2,4538	2,4963	2,4840	2,4781
1987	0,0479	1,2024	2,4892	2,5248	2,5141	2,5094
1988	0,0506	1,1956	2,5788	2,6257	2,6124	2,6057
1989	0,0472	1,1654	2,6166	2,6728	2,6579	2,6491
1990	0,0388	1,1404	2,6152	2,6780	2,6617	2,6516
1991	0,0179	1,1009	2,5207	2,5856	2,5689	2,5584

L’équation 3 permet d’obtenir les estimations de l’indice synthétique de fécondité associées à la fécondité cumulée jusqu’à l’âge x. Ainsi, la fécondité cumulée à 25 ans en 1972 implique un indice synthétique de

\frac{1, 3392}{\exp (- \exp (- 0, 0049 - 1, 1367 Y^{s} (x)))} = 3, 5205.

La moyenne des trois estimations donne l’estimation finale de l’indice synthétique de chaque année. En combinant cette dernière avec les estimations de α and β, on peut déterminer une série de taux de fécondité par année d’âge pour chaque année civile grâce une fois de plus au modèle relationnel de Gompertz.

Les taux de fécondité par année d’âge pour chaque année civile sont obtenus par l’équation 4. Il en résulte une large matrice (20 années par 25 âges), dont nous ne reproduisons qu’un extrait au tableau 11.

Tableau 11 Taux de fécondité par année d’âge et année civile, Chili

Année	Âge
Année	10	11	12	13	14	15	16	17	18
1982	0,0000	0,0000	0,0000	0,0001	0,0012	0,0081	0,0290	0,0574	0,0883
1983	0,0000	0,0000	0,0000	0,0000	0,0010	0,0072	0,0263	0,0530	0,0822
1984	0,0000	0,0000	0,0000	0,0000	0,0011	0,0078	0,0282	0,0562	0,0864
1985	0,0000	0,0000	0,0000	0,0000	0,0009	0,0067	0,0253	0,0517	0,0809
1986	0,0000	0,0000	0,0000	0,0000	0,0010	0,0071	0,0265	0,0538	0,0839
1987	0,0000	0,0000	0,0000	0,0000	0,0010	0,0071	0,0264	0,0538	0,0841
1988	0,0000	0,0000	0,0000	0,0000	0,0011	0,0079	0,0285	0,0571	0,0884
1989	0,0000	0,0000	0,0000	0,0001	0,0016	0,0099	0,0325	0,0615	0,0919
1990	0,0000	0,0000	0,0000	0,0001	0,0021	0,0113	0,0348	0,0634	0,0927
1991	0,0000	0,0000	0,0000	0,0002	0,0027	0,0129	0,0363	0,0627	0,0890

Par exemple, le taux de fécondité entre 16 et 17 ans en 1990 est égal à

\begin{array}{l} f (16, 1990) \\ = T F (16, 1990) . (\begin{array}{l} \exp (- \exp (- α (1990) - β (1990) Y^{s} (17))) \\ - \exp (- \exp (- α (1990) - β (1990) Y^{s} (16))) \end{array}) \\ = 2, 6516 . (\begin{array}{l} \exp (- \exp (- 0, 0388 - 1, 1404 Y^{s} (17))) \\ - \exp (- \exp (- 0, 0388 - 1, 1404 Y^{s} (16))) \end{array}) \\ = 0, 0348 \end{array}

Enfin, les valeurs de E(i) sont obtenues en appliquant l’équation 5 aux taux de fécondité du tableau 11. E(1), descendance à 15-19 ans, est donc obtenue ainsi

\begin{array}{l} E (1) = \sum_{j = 0}^{8} \sum_{m = 14}^{18} f (m - j, s - j) \\ = f (14, 1991) + f (15, 1991) + ... + f (18, 1991) + \\ f (13, 1990) + ... f (17, 1990) + ... + f (6, 1983) + ... f (10, 1983) \\ = 0, 07394 . \end{array}

La fécondité aux âges avant 10 ans est certainement nulle, mais nous l’avons incluse dans la formule pour faciliter la présentation.

Etape 5 : Estimer la complétude de l’enregistrement des naissances

Pour chaque cohorte (définie par l’âge à la fin de l’année terminale), la complétude de l’enregistrement des naissances est estimée comme le rapport entre la descendance, E(i), calculée à partir des naissances enregistrées, et la parité moyenne déclarée P(i), tirée du dernier recensement (cf. tableau 1). Les résultats figurent au tableau 12.

Tableau 12 Estimations de la complétude de l’enregistrement des naissances, Chili 1991

		Groupe d’âge
		15-19	20-24	25-29	30-34
Parités moyennes au dernier recensement (fin d’année)	1991	0,14	0,69	1,37	2,02
Descendances (fin d’année)	1991	0,07	0,57	1,29	1,92
Complétude		0,5281	0,8207	0,9382	0,9515
Complétude moyenne				0,9449

La complétude estimée pour la cohorte âgée de 15-19 ans fin 1991 est égale à 0,07/0,14 = 0,5281, soit 52 %. Les estimations de la complétude de l’enregistrement des naissances pour les femmes âgées de 25-29 et 30-34 ans sont à la fois plus élevées et plus cohérentes entre elles, suggérant un niveau moyen de complétude d’environ 94 %. L’estimation pour les femmes de 15-19 ans est beaucoup plus basse et celle pour les femmes de 20-24 ans suggère un ordre de grandeur de 80 %. L’enregistrement des naissances est vraisemblablement moins complet parmi les jeunes mères et la complétude cumulée des mères âgées de 20-24 ans est elle aussi plus basse du fait que les naissances qu’elles ont eues comme adolescentes représentent une fraction importante de leur fécondité.

Les estimations de complétude fondées sur les déclarations de femmes de 25-29 et 30-34 ans sont relativement peu affectées par les fortes omissions aux jeunes âges, de sorte que la meilleure estimation de la complétude de l’enregistrement des naissances est sans doute dans ce cas la moyenne entre 0,9382 et 0,9515. L’estimation finale est donc 0,9449. On peut donc avoir une estimation améliorée de la fécondité en 1991 en multipliant les taux de fécondité par âge de cette année par un facteur de 1/0,9449, soit un surcroit d’environ 5,83 %. Notez cependant que la distribution ajustée de la fécondité n’est sans doute pas un bon indicateur du profil par âge de la fécondité du fait d’une omission apparente des naissances relativement plus forte par les jeunes femmes.

Les résultats du tableau 12 ne font pas apparaître d’amélioration de la complétude de l’enregistrement des naissances au fil du temps ; aussi le facteur d’ajustement de 1,0583 peut-il être également appliqué aux taux de fécondité par âge des années antérieures à 1991. Toutefois, comme l’analyse a été arrêtée à 30-34 ans, les contributions des taux de fécondité enregistrés avant 1982 à la fécondité cumulée par cohorte sont faibles. Le facteur d’ajustement estimé ne peut donc pas être appliqué valablement aux taux de fécondité enregistrés avant cette date. Quand il existe des signes d’amélioration de la qualité de l’enregistrement, par exemple des estimations de complétude qui diminuent avec l’âge – ce qui n’est pas le cas au Chili – il n’est pas judicieux d’ajuster les naissances enregistrées une année donnée par un facteur correctif tiré d’une moyenne calculée sur une longue période.

Aucune de ces considérations n’explique cependant de manière adéquate les faibles estimations de complétude pour les cohortes âgées de 15-19 ans et, dans une moindre mesure, celles âgées de 20-24 ans. Certes la procédure de répartition par année d’âge de la fécondité du moment n’est pas parfaite et elle risque d’être particulièrement imprécise à 15-19 ans, mais l’éventuelle imprécision de la méthode ne peut pas expliquer l’ampleur de la différence observée. En outre, les parités moyennes ayant été calculées sans aucune correction pour non réponse, elles risquent plutôt d’être trop basses que trop hautes. Il semble donc bien que l’enregistrement des naissances au Chili soit moins complet pour les jeunes mères que pour les femmes plus âgées.

Autres variantes

Le Manuel X (Division de la Population des NU 1984 : 56ss) présente une extension de la méthode, qui utilise les parités tirées de deux enquêtes espacées de cinq ou dix ans, combinées aux données d’état civil couvrant les naissances sur une période de 20 ans.

A la différence de ce qu’on vient de voir en ajustant la fécondité du moment sur la base de la fécondité cumulée par cohorte depuis le début de la période féconde, il n’est plus nécessaire de supposer que la complétude de l’enregistrement est constante à la fois par âge de la mère et par période. Toutefois, les accroissements de parité sont très sensibles aux variations dans la qualité de la déclaration du nombre d’enfants déjà nés, de sorte que les estimations de complétude de l’état civil obtenues par la méthode décrite aux pages 56 et suivantes du Manuel X sont également très sensibles à de telles variations, lesquelles sont généralement fortes parmi les femmes âgées.

Les différences principales entre la procédure décrite aux pages 56ss du Manuel X et celle présentée plus haut sont que tous les calculs dans la version variante sont limités à la période entre les deux enquêtes et qu’on y prend en compte toutes les cohortes en âge fécond à la seconde enquête. En procédant ainsi, la méthode repose sur les accroissements de fécondité selon les enregistrements à l’état civil pendant la période entre les deux enquêtes, plutôt que sur la fécondité cumulée par les cohortes de femmes depuis le début de leur vie féconde. Il en va de même pour les accroissements de parité dans les cohortes entre les deux enquêtes. La mesure de la complétude est donc fondée sur le rapport entre la fécondité cumulée et les accroissements de parité entre les deux enquêtes.

Autres lectures et références

La méthode a d’abord été présentée dans le Manuel X (Division de la Population des NU 1984 : 46-56). Elle a été peu appliquée car elle nécessite une longue série de données d’état civil. Mais elle pourrait gagner en importance à l’avenir, comme contrôle de qualité des systèmes d’enregistrement que des pays en développement essaient actuellement de mettre en place ou d’améliorer.

La seule modification importante dans la mise en œuvre de la méthode porte sur la procédure de répartition de la fécondité dans des groupes d’âge non conventionnels, qui passait originellement par des coefficients fondés sur la distribution de fécondité de Brass – une méthode longue, fastidieuse et source d’erreurs – et qui est remplacée ici par une procédure plus simple, utilisant le modèle relationnel de Gompertz. En effet, ici, nous ajustons un modèle relationnel de Gompertz séparé aux taux de fécondité par âge observés chaque année dans les données d’état civil. Les valeurs de paramètres alpha et béta ainsi déterminées permettent de produire des estimations de l’indice synthétique de fécondité à partir de la fécondité observée jusqu’à 25, 30 et 35 ans. La moyenne de ces trois estimations est prise comme estimation de l’indice synthétique de chaque année et permet le calcul des taux de fécondité par année d’âge pour chaque année civile. A partir de là, le calcul de la fécondité cumulée par cohorte est aisé, les taux de chaque année devant simplement être additionnés.

Division de la Population des Nations Unies. 1984. Manuel X. Techniques indirectes d’estimation démographique. New York : Nations Unies, Département des affaires économiques et sociales internationales, ST/ESA/SER.A/81. http://unstats.un.org/unsd/demographic/standmeth/handbooks/Manuel_X-fr.pdf

Downloads

Cohort Fertility with Vital Registration (20/12/2013)

FE_CohortVR.XLSX 65.31 Ko

Comparaison des parités par cohorte et des données d’état civil (15/03/2017)

FE_CohortVR_1-1_FR.xlsx 68.21 Ko

Version imprimable
?
Login or register to post comments
English

HAC

Comparaison des parités par cohorte et des données d’état civil

Description de la méthode

Données nécessaires

Hypothèses

Travail préparatoire et rechereches préliminaires

Précautions et mises en garde

Application de la méthode

Etape1 : Calculer les parités moyennes déclarées

Etape 2 : Estimer la population féminine par groupe d’âge au milieu de chaque année précédant le dernier recensement

Etape 3 : Calculer les taux de fécondité par âge à partir des naissances enregistrées au cours des années antérieures au recensement

Etape 4 : Cumuler la fécondité enregistrée dans les différentes cohortes féminines afin d’estimer des descendances (parités équivalentes)

Etape 5 : Estimer la complétude de l’enregistrement des naissances

Interprétation et diagnostics

Exemple

Etape1 : Calculer les parités moyennes déclarées à 15-19, …, 30-34 ans au dernier recensement

Etape 2 : Estimer la population féminine par groupe d’âge au milieu de chaque année précédant le dernier recensement

Etape 3 : Calculer les taux de fécondité par âge à partir des naissances enregistrées au cours des années antérieures au recensement

Etape 4 : Cumuler la fécondité enregistrée dans les différentes cohortes féminines afin d’estimer des descendances (parités équivalentes)

Etape 5 : Estimer la complétude de l’enregistrement des naissances

Autres variantes

Autres lectures et références

Downloads

Navigation