Skip to Content

Comparaison des parités par cohorte et des données d’état civil

Description de la méthode

Le modèle relationnel synthétique de Gompertz présente une méthode pour comparer les parités moyennes avec leurs équivalents calculés à partir des taux de fécondité par période sans avoir à supposer que la fécondité est constante. L’aspect le plus important des cette méthode est que les parités moyennes sont calculées pour une période plutôt que pour une série de cohortes. Elle nécessite cependant la disponibilité de données sur le nombre d’enfants déjà nés à deux dates, à cinq ou dix ans d’écart. S’il n’existe qu’une source de données sur le nombre d’enfants déjà nés, ou si la période entre deux enquêtes n’est pas (au moins approximativement) de cinq ou dix ans, on doit recourir à une procédure alternative qui ne requiert pas l’hypothèse de fécondité constante.

C’est le cas de la méthode présentée ici. Celle-ci a des avantages théoriques spécifiques, mais son application pratique nécessite une assez longue série de données annuelles sur les naissances classées par âge de la mère. Elle est principalement utilisée avec des données sur les naissances enregistrées à l’état civil, généralement la seule source d’information sur les naissances par année sur une période de 20 ans. Mais si des distributions de fécondité sont connues grâce à d’autres sources par intervalles quinquennaux (par exemple des histoires génésiques complètes recueillies à plusieurs reprises), elles peuvent aussi être utilisées. La description faite ici se réfère à des données d’un enregistrement à l’état civil. En général, si on utilise des parités jusqu’à l’âge x, il est nécessaire de disposer de données de fécondité pour au moins les x-15 années précédentes, afin de faire les comparaisons pertinentes.

La méthode s’appuie sur la nature longitudinale des parités moyennes déclarées et les compare avec leurs équivalents (descendances) tirés des taux de fécondité enregistrés appartenant aux cohortes adéquates. Si on considère des femmes âgées de 30-34 ans lors d’un recensement, elles étaient âgées de 20-24 ans dix ans auparavant et de 10-14 ans vingt ans avant le recensement. Si la fécondité débute à 15 ans, les enfants déjà nés déclarés par des femmes âgées jusqu’à 35 ans au moment du recensement reflètent l’expérience cumulée de ces femmes en matière de fécondité au cours des vingt années passées. Si on peut supposer que la mortalité et la migration sont indépendantes de la fécondité de ces femmes et si des taux de fécondité peuvent être calculés pour ces vingt années, des parités moyennes équivalentes (descendances) peuvent être calculées pour chaque cohorte et comparées à la parité moyenne des femmes au moment du recensement.

La difficulté lors de l’application de ce principe général est qu’une cohorte représentée par un groupe d’âge quinquennal conventionnel au moment du recensement n’a pas appartenu à un groupe d’âge quinquennal conventionnel au cours de chacune des années antérieures. Ainsi, la population âgée de 30-34 ans au moment du recensement était âgée de 29-33 ans l’année précédente, de 28-32 ans deux années plus tôt, et ainsi de suite. Si les naissances enregistrées à l’état civil sont classées par année d’âge de la mère, le problème n’est pas important, car on peut calculer des taux de fécondité par année d’âge pour chaque année et les regrouper ensuite relativement facilement par cohorte. L’élaboration des tableaux et les calculs risquent cependant d’être longs et l’attraction de certains âges peut avoir un effet non négligeable sur les taux de fécondité. Il est donc commode de disposer d’une méthode qui puisse être appliquée à des taux par groupe quinquennal conventionnel.

Il est important de noter que la méthode peut être utilisée pour évaluer la complétude de l’enregistrement des naissances à l’état civil.

Dans sa formulation initiale, la méthode posait de nombreux problèmes d’interpolation décrits par le Manuel X (Division de la Population des NU 1984 : 46-56). Sa reformulation ici comme variante du modèle relationnel de Gompertz permet de les contourner.

Données nécessaires

Les données nécessaires pour cette méthode sont :

  • Le nombre d’enfants déjà nés, ou les parités moyennes, par groupe d’âge quinquennal de la mère, dans un recensement récent.
  • Les naissances enregistrées à l’état civil par groupe d’âge quinquennal de la mère pour chacune des 15 ou 20 années précédant le recensement.
  • Le nombre de femmes dans chaque groupe d’âge au recensement, et dans un ou plusieurs recensements antérieurs, pour permettre l’estimation de la population féminine par groupe d’âge quinquennal pour chacune des 15 ou 20 années précédant le recensement récent.

Hypothèses

La plupart des hypothèses sont celles associées au modèle relationnel de Gompertz, à savoir :

  • Le schéma de fécondité standard choisi pour la procédure d’ajustement reflète de façon appropriée la forme de la distribution de la fécondité dans la population.
  • Les changements de la fécondité ont été réguliers et graduels et ont affecté tous les groupes d’âge dans une mesure comparable.
  • Les erreurs dans les taux de fécondité avant ajustement sont proportionnellement les mêmes parmi les femmes dans les groupes d’âge centraux (20-39 ans), de sorte que la forme de la fécondité par âge des naissances récentes déclarées est à peu près correcte.

La méthode repose aussi sur l’hypothèse que les populations au dénominateur des taux de fécondité ont été corrigées du sous-enregistrement et d’autres erreurs. C’est d’autant plus important que le numérateur et le dénominateur proviennent de sources différentes.

Travail préparatoire et rechereches préliminaires

Avant d’entreprendre l’analyse des niveaux de fécondité en recourant à cette méthode, l’analyste doit vérifier la qualité des données au moins sur les points suivants :

Précautions et mises en garde

La méthode vise à estimer les niveaux récents de la fécondité et à mesurer la complétude de l’enregistrement des naissances, en vue d’ajuster les naissances enregistrées récemment pour tenir compte des omissions. Les effets des autres erreurs, comme les variations de la couverture du recensement au fil du temps, doivent donc avoir été corrigés avant de cumuler les taux de fécondité par âge pour comparer le résultat aux parités moyennes. Quand il apparaît que la complétude du dénombrement a varié, les recensements doivent être ajustés autant que possible avant de calculer les dénominateurs des taux. Il ne s’agit pas de corriger chaque recensement du sous-dénombrement absolu ; il suffit de s’assurer que la complétude relative des recensements antérieurs est la même que celle du plus récent.

Application de la méthode

Etape1 : Calculer les parités moyennes déclarées

Calculer les parités moyennes,

5 P x

des femmes de chaque groupe d’âge (x, x+5), pour x =15, 20, 45, si ça n’a pas déjà été fait lors des recherches préliminaires.

Etape 2 : Estimer la population féminine par groupe d’âge au milieu de chaque année précédant le dernier recensement

La procédure exacte pour estimer la série des populations féminines par groupe d’âge en milieu d’année dépend des dates des recensements disponibles. Nous présentons donc la procédure seulement en termes généraux.

On suppose que les recensements couvrent, au moins à peu près, les années pour lesquelles on doit cumuler les taux de fécondité enregistrés, car il est préférable que la procédure ci-dessous recoure uniquement à des interpolations de population entre les dates de recensement, plutôt qu’à des extrapolations pour des dates antérieures ou postérieures à celles couvertes par les recensements.

Soit ta la date de référence de chaque recensement a, tenant compte de la fraction d’année jusques et y compris la date exacte, ou la date de référence centrale du recensement. Par exemple, le nombre représentant la date d’un recensement réalisé la nuit du 9 au 10 octobre 2001 est calculé en additionnant les jours de l’année précédant la nuit du recensement :

2001+ ( 31+28+31+30+31+30+31+31+30+9 ) 365 = 2001+ 282 365  = 2001,773

Le taux de croissance r(i,a) de chaque groupe d’âge i entre le recensement a et le recensement a+1 est alors obtenu en divisant la différence entre les logarithmes naturels de la population féminine du groupe d’âge i au second et au premier recensement, N(i,ta+1) et N(i,ta) respectivement, par la longueur de la période intercensitaire en années :

r(i,a)= ln( N(i, t a+1 ) )ln( N(i, t a ) ) t a+1 t a = ln( N(i, t a+1 ) N(i, t a ) ) t a+1 t a
Equation 1

S’il y a trois recensements couvrant la période étudiée, on doit calculer r(i,1) pour la période entre le premier et le deuxième recensement, et r(i,2) pour la période entre le deuxième et le troisième recensement.

La population au milieu de chaque année entre ta et ta+1 pour chaque groupe d’âge peut alors être estimée à partir de la population initiale :

N(i,t)=N(i, t a )exp( r(i,a)(t+0.5 t a ) )
Equation 2

pour ta< t < ta+1.

S’il est nécessaire d’extrapoler à des dates avant le premier recensement ou après le dernier, le taux de croissance de l’intervalle intercensitaire le plus proche doit être utilisé.

Les N(i,t) étant des population estimées en milieu d’année au groupe d’âge i au temps t, ils représentent les dénominateurs approchés pour le calcul des taux de fécondité par âge cette année.

Etape 3 : Calculer les taux de fécondité par âge à partir des naissances enregistrées au cours des années antérieures au recensement

On doit disposer de taux de fécondité par âge pour un nombre d’années égal à l’âge le plus élevé pour lequel on souhaite utiliser les parités moins 15 ans. Par exemple, si on utilise des parités jusqu’à 35 ans (c’est-à-dire le groupe 30-34 ans), il est nécessaire de disposer de taux de fécondité remontant à 20 ans en arrière. Le taux pour le groupe d’âge i et l’année civile t, f(i,t), est égal à

f(i,t)= B(i,t) N(i,t)

B(i,t) est le nombre de naissances enregistrées, étant survenues chez les femmes du groupe d’âge i l’année t.

Si on ne dispose pas des naissances par âge de la mère pour quelques-unes des vingt années nécessaires, l’application de la méthode n’en sera guère affectée si les taux des années manquantes peuvent être interpolés à partir de ceux des années voisines. Par exemple, si on ne dispose des taux de fécondité que pour les seize dernières années sur les vingt nécessaires pour une analyse de la complétude de l’enregistrement pour les femmes de moins de 35 ans, on peut utiliser les taux de l’année disponible la plus ancienne pour les quatre années précédentes sans grand risque d’introduire des erreurs importantes, car les valeurs imputées qui seront ensuite utilisées dans l’analyse concernent les femmes alors âgées de 15-19 ans, dont la fécondité est généralement relativement faible. En revanche, il faut éviter d’extrapoler les données à partir du passé afin d’imputer des valeurs pour les années les plus récentes car l’imputation concernerait davantage de groupes d’âge, y compris les âges de forte fécondité, où les variations au fil du temps risquent de se produire.

Etape 4 : Cumuler la fécondité enregistrée dans les différentes cohortes féminines afin d’estimer des descendances (parités équivalentes)

Les naissances étant classées par année civile, les taux de fécondité par âge sont obtenus selon le même classement. L’addition des taux jusqu’à la fin de chaque groupe d’âge donne donc des cumuls de fécondité qui correspondent à la fin des années civiles. Il est peu vraisemblable que le recensement dont sont tirées les parités moyennes ait sa date de référence au 31 décembre d’une année, mais comme les parités moyennes d’un groupe d’âge donné évoluent lentement même quand la fécondité change rapidement, on peut considérer que les parités au recensement se réfèrent la fin d’année la plus proche de la date de référence, et les taux enregistrés peuvent être cumulés jusqu’à cette même fin d’année. Ainsi, si le recensement a lieu avant le 1er juillet, on cumulera les taux enregistrés jusqu’à la fin de l’année précédant la date du recensement, alors que si le recensement a lieu au second semestre, les taux enregistrés seront cumulés jusqu’à la fin de l’année du recensement. Il n’est pas justifié de développer des procédures plus précises et plus raffinées (en recourant par exemple à des extrapolations exponentielles), compte tenu des incertitudes et des erreurs qui affectent la méthode.

Pour estimer les descendances à partir de la fécondité des périodes, on applique un modèle relationnel de Gompertz aux taux de fécondité par âge obtenus à l’étape précédente. Les taux de fécondité par âge sont d’abord cumulés chaque année jusqu’à 20, 25, 30 et 35 ans. On prend ensuite les gompits des rapports entre les estimations adjacentes de la fécondité cumulée, comme on le fait dans la version standard du modèle relationnel de Gompertz. Ces rapports correspondent aux z(x) de la formulation conventionnelle du modèle.

Dans un deuxième temps, les estimations des paramètres sont tirées des valeurs de z(x) calculées pour chaque année. On procède de la même manière que lors de l’ajustement d’un modèle relationnel de Gompertz sur les seuls F-points dans la formulation conventionnelle du modèle. Nous supposons à nouveau une série de 20 ans de données d’état civil à 15-34 ans. Une régression de z(x) - e(x) sur g(x), où e(x) et g(x) sont tirés du schéma de fécondité standard, à 20, 25 et 30 ans, permet ensuite d’estimer α(t) et β(t). β(t) est la pente de la régression linéaire fondée sur les trois valeurs de z(x) l’année t ; l’ordonnée à l’origine est égale à α(t)+(β­(t) - 1)2.c/2, où c’est une constante tirée du standard de fécondité utilisé.

Troisièmement, le modèle relationnel de Gompertz sert à estimer la fécondité par année d’âge pour chaque année civile. Les valeurs de α(t) et β(t) calculées lors de la précédente étape servent à déterminer la forme du schéma de fécondité, alors que le niveau est tiré des cumuls de fécondité à chaque âge, 25, 30 et 35 ans. L’estimation de l’indice synthétique de fécondité associé à la fécondité cumulée jusqu’à l’âge x l’année t est donnée par

TF(x,t)= F(x,t) exp( exp( α(t)β(t) Y s (x) ) )
Equation 3

F(x,t) est la fécondité cumulée à l’âge x l’année t et Ys(x) est le gompit à l’âge x du schéma standard de fécondité modifié par Zaba. Il en résulte trois estimations de l’indice synthétique de fécondité dont la moyenne détermine l’indice synthétique de fécondité chaque année. Il est ensuite simple d’estimer la fécondité entre les âges x et x+1 au temps t, f(x,t) :

f(x,t) =TF(x,t)( exp( exp( α(t)β(t)Ys(x+1) ) ) exp( exp( α(t)β(t)Ys(x) ) ) ).
Equation 4

Quatrièmement, les descendances sont obtenues en additionnant les taux de fécondité par année d’âge et année civile pour chaque cohorte quinquennale, et en divisant par cinq (largeur de l’intervalle d’âge). Si on note E(i,s) ces descendances, où i=1 correspond au groupe 15-19 ans, i=2 au groupe 20-24 ans, etc., s désigne la dernière année pour laquelle les estimations sont calculées, alors

E(i)= j=0 5i+3 m=5i+9 5i+13 f(mj,sj)
Equation 5

Etape 5 : Estimer la complétude de l’enregistrement des naissances

On a construit la fécondité cumulée par cohorte à partir des naissances enregistrées, E(i), calculée à l’étape précédente, de sorte qu’elle soit comparable à la parité déclarée par cohorte, P(i), au dernier recensement. Le rapport E(i)/P(i) donne donc une mesure de la complétude moyenne de l’enregistrement des naissances dans la cohorte i. Si la complétude de l’enregistrement est restée à peu près constante pendant une quinzaine d’années, les rapports E/P auront plus ou moins les mêmes valeurs pour toutes les cohortes, et une moyenne des rapports pour les groupes 20-24, 25-29 et 30-34 ans peut être utilisée comme estimation de la complétude de l’enregistrement à l’état civil au long de la période. Son inverse peut être utilisé comme facteur d’ajustement pour les taux de fécondité par âge calculés à l’étape 3.

L’interprétation de ces rapports E/P est prise entre deux forces contradictoires. D’un côté, en général, si la complétude de l’enregistrement des naissances s’est améliorée au fil du temps, les rapports E/P seront plus élevés pour les cohortes jeunes que pour les plus âgées. Dans un tel cas, on peut ajuster la distribution de fécondité la plus récente (fondée sur les naissances enregistrées) par P(2)/E(2), le rapport reflétant le niveau de complétude le plus récent. (On évitera en général d’utiliser P(1)/E(1) comme facteur d’ajustement, compte tenu de la difficulté intrinsèque à approximer E(1) correctement.) Cependant, lorsque les rapports E/P indiquent une amélioration de la complétude de l’enregistrement au fil du temps, il n’existe pas de base évidente pour ajuster les distributions de fécondité des périodes anciennes.

Seconde force en jeu : les rapports E/P peuvent être moins élevés pour les femmes jeunes que pour les plus âgées du fait d’un enregistrement moins fiable et moins ponctuel des naissances par les jeunes mères. Si c’est le cas, le rapport E/P aux jeunes âges donne une mauvaise représentation de la complétude des données d’état civil. Au contraire, les estimations de complétude fondées sur les déclarations des femmes de 25-29 et 30-34 ans sont relativement peu affectées par les fortes omissions aux jeunes âges et il peut être judicieux de déterminer la complétude en faisant la moyenne de ces deux rapports E/P.

Interprétation et diagnostics

Une hypothèse importante dans cette méthode est que les dénominateurs utilisés dans le calcul des taux de fécondité par âge sont précis. Comme le numérateur et le dénominateur des taux viennent de deux sources différentes, la distribution par âge des taux de fécondité du moment sera déformée si des erreurs dans la déclaration des âges jouent différemment lors de l’enregistrement des naissances et lors du dénombrement des populations. Des variations erratiques des taux de croissance par âge peuvent suggérer des problèmes de déclaration des âges, mais les effets de ces mauvaises déclarations sur les estimations finales de complétude sont très difficiles à prédire. Les dénominateurs peuvent aussi être déformés par des variations dans la complétude du dénombrement d’un recensement à l’autre et une complétude différentielle du dénombrement selon l’âge peut affecter les résultats. Les variations dans la complétude du dénombrement peuvent aussi jouer sur les parités moyennes. Si par exemple les mères sont mieux dénombrées que les femmes sans enfants, les parités moyennes s’en trouvent surévaluées.

Exemple

Nous utilisons les données tirées de trois recensements réalisés au Chili en avril 1970, avril 1982 et avril 1992 respectivement. Les tableaux originaux figurent dans les Annuaires démographiques de la Division statistique des NU ; ils portent sur le nombre de femmes par groupe d’âge aux différents recensements  ; les naissances déclarées par âge de la mère et année ; le nombre moyen d’enfants déjà nés au dernier recensement . La mise en œuvre de la méthode fait l’objet d’un dossier Excel.

Etape1 : Calculer les parités moyennes déclarées à 15-19, …, 30-34 ans au dernier recensement

Les parités moyennes par âge au recensement de 1992 (tableau 1) sont tirées de l’Annuaire démographique.

Tableau 1 Parités moyennes, Chili, recensement de 1992

Groupe d’âge

15-19

20-24

25-29

30-34

Parité moyenne

0,14

0,69

1,37

2,02

Aucun contrôle de ces données n’est possible, en l’absence des tableaux originaux.

Etape 2 : Estimer la population féminine par groupe d’âge au milieu de chaque année précédant le dernier recensement

Les nombres de femmes dénombrées par groupe d’âge à chacun des trois recensements (tableau 2) sont tirés de l’Annuaire démographique.

Tableau 2 Nombres de femmes par groupe d’âge dénombrées aux recensements de 1970, 1982 et 1992, Chili

a

Date du recensement (ta)

Groupe d’âge

15-19

20-24

25-29

30-34

1

22-avril-70

466 736

398 383

324 130

267 312

2

22-avril-82

652 552

595 598

479 199

399 344

3

22-avril-92

600 563

608 933

623 305

576 710

Les dates de référence des recensements sont : 1970,304 ; 1982,304 et 1992,306. La date de référence est légèrement différente en 1992 car l’année était bissextile. Elle est calculée de la façon suivante : 1992 + (31 + 29 + 31 + 21)/366=1992,306, la date du recensement se référant à la nuit du 21-22 avril.

Le taux de croissance de chaque période intercensitaire (tableau 3) est calculé à partir de l’équation 1.

Tableau 3 Taux de croissance intercensitaires par âge, Chili, recensements de 1970, 1982 et 1992

 

Période intercensitaire

Groupe d’âge

15-19

20-24

25-29

30-34

1970-1982

0,0279

0,0335

0,0326

0,0335

1982-1992

-0,0083 

0,0022

0,0263

0,0367

Par exemple le taux de croissance à 30-34 ans entre les recensements de 1982 et 1992 est égal à

r(3,2)= ln( 576710 399344 ) 1992,3061982,304 =0,0367.

Les taux de croissance augmentent avec l’âge et diminuent au fil du temps. Ceci suggère une baisse de la fécondité ayant débuté quelques décennies plus tôt, ce qui renforce la pertinence d’une méthode analytique qui ne postule pas une fécondité constante.

Sur la base de ces taux de croissance, on peut estimer la population des femmes par groupe d’âge au milieu de chaque année en utilisant l’équation 2. Les valeurs résultantes N(i,t) figurent au tableau 4.

Tableau 4 Populations par groupe d’âge estimées en milieu d’année, Chili

Année

Groupe d’âge

15-19

20-24

25-29

30-34

1972

496 255

428 806

348 169

287 686

1973

510 309

443 420

359 700

297 472

1974

524 761

458 532

371 612

307 591

1975

539 623

474 159

383 919

318 054

1976

554 906

490 318

396 633

328 873

1977

570 621

507 029

409 769

340 060

1978

586 781

524 308

423 340

351 628

1979

603 400

542 177

437 359

363 589

1980

620 488

560 655

451 844

375 957

1981

638 061

579 762

466 808

388 746

1982

651 492

599 521

482 267

401 969

1983

646 106

597 177

494 503

417 283

1984

640 765

598 500

507 674

432 902

1985

635 469

599 827

521 196

449 104

1986

630 215

601 156

535 078

465 913

1987

625 006

602 489

549 331

483 352

1988

619 839

603 824

563 962

501 443

1989

614 715

605 162

578 984

520 211

1990

609 634

606 503

594 405

539 681

1991

604 595

607 847

610 238

559 880

Par exemple, la population des femmes de 15-19 ans, mi-1990, est égale à

N(1,1990)=652552exp( 0,0083( 1990,51982,3 ) )=609634.

Etape 3 : Calculer les taux de fécondité par âge à partir des naissances enregistrées au cours des années antérieures au recensement

Le nombre de naissances déclarées par groupe d’âge et année (tableau 5) est tiré de l’Annuaire démographique.

Tableau 5 Naissances déclarées par groupe d’âge de la mère et année, Chili

Année

Groupe d’âge

15-19

20-24

25-29

30-34

1972

39 839

80 430

64 624

38 937

1973

40 241

82 108

63 949

38 499

1974

39 884

79 316

63 477

37 880

1975

39 086

75 519

59 365

35 863

1976

37 658

73 889

57 171

34 129

1977

36 104

71 445

53 467

32 190

1978

37 138

73 224

53 725

31 832

1979

36 833

75 905

55 361

32 537

1980

38 562

79 724

59 771

33 769

1981

40 252

86 037

64 849

36 494

1982

39 298

86 061

68 029

38 406

1983

36 077

81 213

65 236

37 506

1984

37 571

83 960

67 266

39 105

1985

34 946

80 735

69 180

39 828

1986

35 925

83 434

72 876

42 605

1987

35 633

84 674

75 416

45 037

1988

37 354

87 484

80 527

48 290

1989

39 095

86 990

82 919

50 875

1990

39 543

85 292

84 336

52 942

1991

38 324

79 406

81 907

53 425

Les taux de fécondité par âge sont obtenus en divisant les naissances (tableau 5) par la population estimée en milieu d’année pour chaque groupe d’âge et année (tableau 4). Les résultats figurent au tableau 6.

Tableau 6 Taux de fécondité par groupe d’âge et année, Chili

Année

Groupe d’âge

15-19

20-24

25-29

30-34

1972

0,0803

0,1876

0,1856

0,1353

1973

0,0789

0,1852

0,1778

0,1294

1974

0,0760

0,1730

0,1708

0,1232

1975

0,0724

0,1593

0,1546

0,1128

1976

0,0679

0,1507

0,1441

0,1038

1977

0,0633

0,1409

0,1305

0,0947

1978

0,0633

0,1397

0,1269

0,0905

1979

0,0610

0,1400

0,1266

0,0895

1980

0,0621

0,1422

0,1323

0,0898

1981

0,0631

0,1484

0,1389

0,0939

1982

0,0603

0,1435

0,1411

0,0955

1983

0,0558

0,1360

0,1319

0,0899

1984

0,0586

0,1403

0,1325

0,0903

1985

0,0550

0,1346

0,1327

0,0887

1986

0,0570

0,1388

0,1362

0,0914

1987

0,0570

0,1405

0,1373

0,0932

1988

0,0603

0,1449

0,1428

0,0963

1989

0,0636

0,1437

0,1432

0,0978

1990

0,0649

0,1406

0,1419

0,0981

1991

0,0634

0,1306

0,1342

0,0954

Etape 4 : Cumuler la fécondité enregistrée dans les différentes cohortes féminines afin d’estimer des descendances (parités équivalentes)

Le calcul des descendances est fait selon la procédure suivante. Les taux de fécondité par âge du tableau 6 sont cumulés jusqu’à la limite supérieure de chaque groupe d’âge. Par exemple, la fécondité cumulée jusqu’à 25 ans en 1972 est égale à 5(0,0803 + 0,1876) = 1,3392. La fécondité cumulée jusqu’à 30 ans en 1972 est égale à 5(0,0803 + 0,1876 + 0,1856) = 2,2673. Les taux cumulés figurent au tableau 7.

Tableau 7 Fécondité cumulée jusqu’à l’âge x, par année, Chili

Année

Âge

20

25

30

35

1972

0,4014

1,3392

2,2673

2,9440

1973

0,3943

1,3201

2,2091

2,8562

1974

0,3800

1,2449

2,0990

2,7147

1975

0,3622

1,1585

1,9317

2,4954

1976

0,3393

1,0928

1,8135

2,3324

1977

0,3164

1,0209

1,6733

2,1466

1978

0,3165

1,0147

1,6493

2,1019

1979

0,3052

1,0052

1,6381

2,0856

1980

0,3107

1,0217

1,6831

2,1322

1981

0,3154

1,0574

1,7520

2,2214

1982

0,3016

1,0193

1,7247

2,2024

1983

0,2792

0,9592

1,6188

2,0682

1984

0,2932

0,9946

1,6571

2,1087

1985

0,2750

0,9479

1,6116

2,0550

1986

0,2850

0,9790

1,6600

2,1172

1987

0,2851

0,9878

1,6742

2,1401

1988

0,3013

1,0257

1,7397

2,2212

1989

0,3180

1,0367

1,7528

2,2418

1990

0,3243

1,0275

1,7369

2,2274

1991

0,3169

0,9701

1,6412

2,1183

On calcule, pour chaque année, le rapport de la fécondité cumulée dans un groupe d’âge à celle dans le groupe d’âge immédiatement supérieur. Dans l’exemple du paragraphe précédent, le rapport de la fécondité cumulée à 25 ans à celle cumulée à 30 ans est égal à 1,3392/2,2673 = 0,5907. Les rapports figurent dans les trois premières colonnes du tableau 8.

On applique ensuite une transformation gompit (log-log négatif) aux rapports pour obtenir une valeur de z(x) pour chaque âge 25, 30 et 35 ans, chaque année. Sur le même exemple, la valeur de z(25) en 1972 est –ln(ln(0,5907)) = 0,6415. Les gompits sont dans les trois dernières colonnes du tableau 8.

Tableau 8 Rapports des fécondités cumulées à l’âge x et leurs gompits, par année, Chili

 

Année

Rapports

 

 

Gompits z(x)

20

25

30

20

25

30

1972

 0,2997

 0,5907

 0,7701

 

 -0,1864

 0,6415

 1,3425

1973

 0,2987

 0,5976

 0,7734

 

 -0,1893

 0,6639

 1,3590

1974

 0,3053

 0,5931

 0,7732

 

 -0,1711

 0,6493

 1,3577

1975

 0,3126

 0,5997

 0,7741

 

 -0,1508

 0,6709

 1,3622

1976

 0,3105

 0,6026

 0,7775

 

 -0,1566

 0,6802

 1,3798

1977

 0,3099

 0,6101

 0,7795

 

 -0,1583

 0,7050

 1,3900

1978

 0,3119

 0,6153

 0,7847

 

 -0,1529

 0,7222

 1,4167

1979

 0,3036

 0,6136

 0,7855

 

 -0,1756

 0,7167

 1,4209

1980

 0,3041

 0,6070

 0,7894

 

 -0,1742

 0,6948

 1,4417

1981

 0,2983

 0,6035

 0,7887

 

 -0,1904

 0,6833

 1,4381

1982

 0,2959

 0,5910

 0,7831

 

 -0,1971

 0,6427

 1,4085

1983

 0,2911

 0,5925

 0,7827

 

 -0,2104

 0,6475

 1,4065

1984

 0,2948

 0,6002

 0,7858

 

 -0,2001

 0,6724

 1,4228

1985

 0,2901

 0,5882

 0,7842

 

 -0,2132

 0,6336

 1,4145

1986

 0,2911

 0,5898

 0,7840

 

 -0,2102

 0,6386

 1,4135

1987

 0,2886

 0,5900

 0,7823

 

 -0,2173

 0,6393

 1,4044

1988

 0,2938

 0,5896

 0,7832

 

 -0,2029

 0,6381

 1,4092

1989

 0,3067

 0,5915

 0,7819

 

 -0,1670

 0,6441

 1,4022

1990

 0,3156

 0,5916

 0,7798

 

 -0,1425

 0,6444

 1,3914

1991

 0,3267

 0,5911

 0,7748

 

 -0,1122

 0,6429

 1,3658

Les valeurs de e(x) et g(x) sont déterminées sans décalage des âges puisque les données de fécondité proviennent d’un système d’enregistrement à l’état civil et se réfèrent donc à l’âge de la mère au moment de la naissance de l’enfant. Les valeurs sont tirées de la version du standard de fécondité de Booth modifiée par Zaba, le seul standard actuellement disponible pour les femmes qui ait été validé. (Le standard et la procédure de détermination de e(x) et g(x) sont décrits en détail dans la présentation de la méthode relationnelle de Gompertz). Les valeurs de e(x) et g(x) pour les âges nécessaires à l’ajustement d’un modèle relationnel de Gompertz aux données de fécondité observées figurent au tableau 9.

Tableau 9 Valeurs de e(x) et g(x) à partir du standard modifié par Zaba (pas de décalage des âges), certains âges

Âge x

e(x)

g(x)

20

1,3539

-1,3753

25

1,4127

-0,6748

30

1,2750

 0,0393

On peut donc déterminer les valeurs de z(x) – e(x) pour les trois âges, et les régresser sur les valeurs de g(x) aux mêmes âges. Dans le modèle relationnel de Gompertz, β est la pente de l’équation de régression, et α est estimé à partir de

α=intercept (β1) 2 . c 2

c est une constante (=0,95739) tirée du standard de fécondité modifié par Zaba. Il en résulte les valeurs de α et β qui figurent aux deux premières colonnes du tableau 10.

Tableau 10 Paramètres Alpha et Beta d’un modèle relationnel de Gompertz ajusté à 20, 25 et 30 ans, Chili

 

Année

 

Alpha

 

Beta

 

 

Indice synthétique fondé sur le cumulant à l’âge

 

Moyenne

25

30

35

1972

0,0049

1,1367

 

3,5205

3,5525

3,5434

3,5388

1973

0,0242

1,1504

 

3,4057

3,4173

3,4130

3,4120

1974

0,0177

1,1367

 

3,2326

3,2701

3,2598

3,2542

1975

0,0270

1,1255

 

2,9825

3,0074

3,0004

2,9968

1976

0,0430

1,1420

 

2,7704

2,7897

2,7840

2,7814

1977

0,0585

1,1503

 

2,5509

2,5508

2,5498

2,5505

1978

0,0828

1,1653

 

2,4796

2,4782

2,4773

2,4784

1979

0,0844

1,1843

 

2,4518

2,4466

2,4462

2,4482

1980

0,0912

1,1982

 

2,4761

2,4973

2,4902

2,4879

1981

0,0850

1,2071

 

2,5762

2,5995

2,5916

2,5891

1982

0,0516

1,1910

 

2,5607

2,6054

2,5928

2,5863

1983

0,0520

1,1990

 

2,4083

2,4396

2,4300

2,4260

1984

0,0712

1,2032

 

2,4537

2,4750

2,4677

2,4654

1985

0,0527

1,2067

 

2,3781

2,4227

2,4099

2,4035

1986

0,0537

1,2038

 

2,4538

2,4963

2,4840

2,4781

1987

0,0479

1,2024

 

2,4892

2,5248

2,5141

2,5094

1988

0,0506

1,1956

 

2,5788

2,6257

2,6124

2,6057

1989

0,0472

1,1654

 

2,6166

2,6728

2,6579

2,6491

1990

0,0388

1,1404

 

2,6152

2,6780

2,6617

2,6516

1991

0,0179

1,1009

 

2,5207

2,5856

2,5689

2,5584

L’équation 3 permet d’obtenir les estimations de l’indice synthétique de fécondité associées à la fécondité cumulée jusqu’à l’âge x. Ainsi, la fécondité cumulée à 25 ans en 1972 implique un indice synthétique de

1,3392 exp( exp( 0,00491,1367 Y s (x) ) ) =3,5205.

La moyenne des trois estimations donne l’estimation finale de l’indice synthétique de chaque année. En combinant cette dernière avec les estimations de α and β, on peut déterminer une série de taux de fécondité par année d’âge pour chaque année civile grâce une fois de plus au modèle relationnel de Gompertz.

Les taux de fécondité par année d’âge pour chaque année civile sont obtenus par l’équation 4. Il en résulte une large matrice (20 années par 25 âges), dont nous ne reproduisons qu’un extrait au tableau 11.

Tableau 11 Taux de fécondité par année d’âge et année civile, Chili

 

Année

Âge

10

11

12

13

14

15

16

17

18

1982

0,0000

0,0000

0,0000

0,0001

0,0012

0,0081

0,0290

0,0574

0,0883

1983

0,0000

0,0000

0,0000

0,0000

0,0010

0,0072

0,0263

0,0530

0,0822

1984

0,0000

0,0000

0,0000

0,0000

0,0011

0,0078

0,0282

0,0562

0,0864

1985

0,0000

0,0000

0,0000

0,0000

0,0009

0,0067

0,0253

0,0517

0,0809

1986

0,0000

0,0000

0,0000

0,0000

0,0010

0,0071

0,0265

0,0538

0,0839

1987

0,0000

0,0000

0,0000

0,0000

0,0010

0,0071

0,0264

0,0538

0,0841

1988

0,0000

0,0000

0,0000

0,0000

0,0011

0,0079

0,0285

0,0571

0,0884

1989

0,0000

0,0000

0,0000

0,0001

0,0016

0,0099

0,0325

0,0615

0,0919

1990

0,0000

0,0000

0,0000

0,0001

0,0021

0,0113

0,0348

0,0634

0,0927

1991

0,0000

0,0000

0,0000

0,0002

0,0027

0,0129

0,0363

0,0627

0,0890

Par exemple, le taux de fécondité entre 16 et 17 ans en 1990 est égal à

f(16,1990) =TF(16,1990).( exp( exp( α(1990)β(1990) Y s (17) ) ) exp( exp( α(1990)β(1990) Y s (16) ) ) ) =2,6516.( exp( exp( 0,03881,1404 Y s (17) ) ) exp( exp( 0,03881,1404 Y s (16) ) ) ) =0,0348

Enfin, les valeurs de E(i) sont obtenues en appliquant l’équation 5 aux taux de fécondité du tableau 11. E(1), descendance à 15-19 ans, est donc obtenue ainsi

E(1)= j=0 8 m=14 18 f(mj,sj) =f(14,1991)+f(15,1991)+...+f(18,1991)+ f(13,1990)+...f(17,1990)+...+f(6,1983)+...f(10,1983) =0,07394.

La fécondité aux âges avant 10 ans est certainement nulle, mais nous l’avons incluse dans la formule pour faciliter la présentation.

Etape 5 : Estimer la complétude de l’enregistrement des naissances

Pour chaque cohorte (définie par l’âge à la fin de l’année terminale), la complétude de l’enregistrement des naissances est estimée comme le rapport entre la descendance, E(i), calculée à partir des naissances enregistrées, et la parité moyenne déclarée P(i), tirée du dernier recensement (cf. tableau 1). Les résultats figurent au tableau 12.

Tableau 12 Estimations de la complétude de l’enregistrement des naissances, Chili 1991

Groupe d’âge

15-19

20-24

25-29

30-34

  Parités moyennes au dernier recensement (fin d’année)

1991

0,14

0,69

1,37

2,02

  Descendances (fin d’année)

1991

0,07

0,57

1,29

1,92

  Complétude

 

0,5281

0,8207

0,9382

0,9515

  Complétude moyenne

 

 

 

0,9449

La complétude estimée pour la cohorte âgée de 15-19 ans fin 1991 est égale à 0,07/0,14 = 0,5281, soit 52 %. Les estimations de la complétude de l’enregistrement des naissances pour les femmes âgées de 25-29 et 30-34 ans sont à la fois plus élevées et plus cohérentes entre elles, suggérant un niveau moyen de complétude d’environ 94 %. L’estimation pour les femmes de 15-19 ans est beaucoup plus basse et celle pour les femmes de 20-24 ans suggère un ordre de grandeur de 80 %. L’enregistrement des naissances est vraisemblablement moins complet parmi les jeunes mères et la complétude cumulée des mères âgées de 20-24 ans est elle aussi plus basse du fait que les naissances qu’elles ont eues comme adolescentes représentent une fraction importante de leur fécondité.

Les estimations de complétude fondées sur les déclarations de femmes de 25-29 et 30-34 ans sont relativement peu affectées par les fortes omissions aux jeunes âges, de sorte que la meilleure estimation de la complétude de l’enregistrement des naissances est sans doute dans ce cas la moyenne entre 0,9382 et 0,9515. L’estimation finale est donc 0,9449. On peut donc avoir une estimation améliorée de la fécondité en 1991 en multipliant les taux de fécondité par âge de cette année par un facteur de 1/0,9449, soit un surcroit d’environ 5,83 %. Notez cependant que la distribution ajustée de la fécondité n’est sans doute pas un bon indicateur du profil par âge de la fécondité du fait d’une omission apparente des naissances relativement plus forte par les jeunes femmes.

Les résultats du tableau 12 ne font pas apparaître d’amélioration de la complétude de l’enregistrement des naissances au fil du temps ; aussi le facteur d’ajustement de 1,0583 peut-il être également appliqué aux taux de fécondité par âge des années antérieures à 1991. Toutefois, comme l’analyse a été arrêtée à 30-34 ans, les contributions des taux de fécondité enregistrés avant 1982 à la fécondité cumulée par cohorte sont faibles. Le facteur d’ajustement estimé ne peut donc pas être appliqué valablement aux taux de fécondité enregistrés avant cette date. Quand il existe des signes d’amélioration de la qualité de l’enregistrement, par exemple des estimations de complétude qui diminuent avec l’âge – ce qui n’est pas le cas au Chili – il n’est pas judicieux d’ajuster les naissances enregistrées une année donnée par un facteur correctif tiré d’une moyenne calculée sur une longue période.

Aucune de ces considérations n’explique cependant de manière adéquate les faibles estimations de complétude pour les cohortes âgées de 15-19 ans et, dans une moindre mesure, celles âgées de 20-24 ans. Certes la procédure de répartition par année d’âge de la fécondité du moment n’est pas parfaite et elle risque d’être particulièrement imprécise à 15-19 ans, mais l’éventuelle imprécision de la méthode ne peut pas expliquer l’ampleur de la différence observée. En outre, les parités moyennes ayant été calculées sans aucune correction pour non réponse, elles risquent plutôt d’être trop basses que trop hautes. Il semble donc bien que l’enregistrement des naissances au Chili soit moins complet pour les jeunes mères que pour les femmes plus âgées.

Autres variantes

Le Manuel X (Division de la Population des NU 1984 : 56ss) présente une extension de la méthode, qui utilise les parités tirées de deux enquêtes espacées de cinq ou dix ans, combinées aux données d’état civil couvrant les naissances sur une période de 20 ans.

A la différence de ce qu’on vient de voir en ajustant la fécondité du moment sur la base de la fécondité cumulée par cohorte depuis le début de la période féconde, il n’est plus nécessaire de supposer que la complétude de l’enregistrement est constante à la fois par âge de la mère et par période. Toutefois, les accroissements de parité sont très sensibles aux variations dans la qualité de la déclaration du nombre d’enfants déjà nés, de sorte que les estimations de complétude de l’état civil obtenues par la méthode décrite aux pages 56 et suivantes du Manuel X sont également très sensibles à de telles variations, lesquelles sont généralement fortes parmi les femmes âgées.

Les différences principales entre la procédure décrite aux pages 56ss du Manuel X et celle présentée plus haut sont que tous les calculs dans la version variante sont limités à la période entre les deux enquêtes et qu’on y prend en compte toutes les cohortes en âge fécond à la seconde enquête. En procédant ainsi, la méthode repose sur les accroissements de fécondité selon les enregistrements à l’état civil pendant la période entre les deux enquêtes, plutôt que sur la fécondité cumulée par les cohortes de femmes depuis le début de leur vie féconde. Il en va de même pour les accroissements de parité dans les cohortes entre les deux enquêtes. La mesure de la complétude est donc fondée sur le rapport entre la fécondité cumulée et les accroissements de parité entre les deux enquêtes.

Autres lectures et références

La méthode a d’abord été présentée dans le Manuel X (Division de la Population des NU 1984 : 46-56). Elle a été peu appliquée car elle nécessite une longue série de données d’état civil. Mais elle pourrait gagner en importance à l’avenir, comme contrôle de qualité des systèmes d’enregistrement que des pays en développement essaient actuellement de mettre en place ou d’améliorer.

La seule modification importante dans la mise en œuvre de la méthode porte sur la procédure de répartition de la fécondité dans des groupes d’âge non conventionnels, qui passait originellement par des coefficients fondés sur la distribution de fécondité de Brass – une méthode longue, fastidieuse et source d’erreurs – et qui est remplacée ici par une procédure plus simple, utilisant le modèle relationnel de Gompertz. En effet, ici, nous ajustons un modèle relationnel de Gompertz séparé aux taux de fécondité par âge observés chaque année dans les données d’état civil. Les valeurs de paramètres alpha et béta ainsi déterminées permettent de produire des estimations de l’indice synthétique de fécondité à partir de la fécondité observée jusqu’à 25, 30 et 35 ans. La moyenne de ces trois estimations est prise comme estimation de l’indice synthétique de chaque année et permet le calcul des taux de fécondité par année d’âge pour chaque année civile. A partir de là, le calcul de la fécondité cumulée par cohorte est aisé, les taux de chaque année devant simplement être additionnés.

Division de la Population des Nations Unies. 1984. Manuel X. Techniques indirectes d’estimation démographique. New York : Nations Unies, Département des affaires économiques et sociales internationales, ST/ESA/SER.A/81. http://unstats.un.org/unsd/demographic/standmeth/handbooks/Manuel_X-fr.pdf

Downloads