• No se han encontrado resultados

université du québec à montréal

N/A
N/A
Protected

Academic year: 2023

Share "université du québec à montréal"

Copied!
81
0
0

Texto completo

Dans cet article, nous évaluons l’effet de neuf déterminants socio-économiques sur le parcours scolaire des jeunes Québécois. Cette thèse examine donc la relation entre les facteurs socioéconomiques familiaux et le parcours scolaire des jeunes du Québec.

  • Les diérents modèles empiriques utilisés dans l'étude des déterminants socio-
  • Le biais de sélection et l'hétérogénéité inobservée
  • Les déterminants socio-économiques
    • Description des déterminants socio-économiques
    • L'évolution des déterminants socio-économiques au Canada
    • Le rôle des compétences dans le parcours scolaire
  • Les sources de données

Ces transitions sont modélisées à l'aide de régressions logistiques qui renseignent sur l'effet des déterminants socio-économiques sur les différentes transitions tout au long du parcours de vie des jeunes. Peu d’études sur les déterminants socio-économiques de l’accès aux études ont exploité ces données jusqu’à présent.

Le modèle de transition

Une présentation formelle permet de mieux comprendre le modèle et permet de jeter les bases du modèle logit qui sera utilisé ultérieurement. Ce modèle présente cependant de sérieuses lacunes, soulignées par Mare (1980) lors de sa première utilisation, et vivement critiquées par Cameron et Heckman (1998).

L'hétérogénéité inobservée

14 Pour nier le problème, ils fixent quatre restrictions, à savoir la forme de l'hétérogénéité, l'indépendance entre Θs et X, la constance de l'hétérogénéité entre les transitions et la fonction G est connue. Dans la section suivante, nous montrerons que, malgré la forme restrictive de l'hétérogénéité, elle introduit un biais important dans l'estimation du modèle de transition.

Le biais lié à l'hétérogénéité inobservée

Un autre biais découle de la corrélation qui s’établit entre les observables et les inobservables à mesure que nous progressons à l’école. Cela provoque donc un biais car il existe une corrélation entre les variables X et le terme d'erreur.

La simulation

  • La génération des données
  • L'estimation et la simulation
  • Les résultats de la simulation

Cela est dû à la non-linéarité du modèle, qui rend ΘetX indissociables. Par la suite, on tire des valeurs inobservées (θ) d'une distribution normale de moyenne nulle et on fait varier l'amplitude, c'est-à-dire la variance de la distribution de θ, au cours de la simulation. La différence se situe au niveau de la sélection, les observations avec un y1 = 0 se voient automatiquement attribuer un y2 = 0 et un y3 = 0, et les observations avec un y2 = 0 se voient automatiquement attribuer un y3 = 0.

Nous répétons cette étape pour une variance nulle dans quatre fois la variable observée. Troisièmement, nous notons que lors des transitions, le biais augmente en raison de la sélection.

Tableau 2.1 Moyenne et corrélation des variables observées et inobservées
Tableau 2.1 Moyenne et corrélation des variables observées et inobservées

L'estimateur non-paramétrique de maximum de vraisemblance

Il s'agit d'un modèle de transition qui intègre un terme d'hétérogénéité, comme le proposent Cameron et Heckman (1998). Par conséquent, dans cette section, nous résumons la présentation de cet estimateur par Cameron et Taber (1998) et par Cameron et Heckman (1998). Nous l’avons fait en nous basant sur Cameron et Taber (1998) et en utilisant la notation du chapitre 2.

Le même modèle peut prendre en compte des xi variables dans le temps, comme le font Cameron et Taber (1998). Cameron et Taber (1998) expliquent clairement pourquoi on peut estimer des paramètres avec un nombre de points ni.

Un modèle économique justiant le NPMLE et les conditions d'identication

Les auteurs présentent la conséquence de non-identification suivante : Corollaire du Théorème 1. Dans les conditions du Théorème 1, si les conditions 5 et 6 ne sont pas remplies, car X1 =X2. Dans notre cas, le X ne varie pas entre les transitions et l'identification de notre modèle dépend de la condition de non-colinéarité du β. Selon les termes du théorème avec la condition 4 révisée pour lire 4' : Est-ce que ⊆ Supp(Xβs) et

En résumé, les théorèmes précédents nous montrent qu'un modèle de transition avec un facteur d'hétérogénéité non observé est identifié sous certaines hypothèses. Premièrement, dans les conditions du théorème 1, notamment concernant l’indépendance des βs, le modèle est identifié de manière non paramétrique.

L'estimation du NPMLE

Le théorème 2 nous montre que le modèle de transition est identifié, même en relâchant l'hypothèse de non-colinéarité de βs, si l'on impose une forme au terme d'erreur et que l'on impose certaines restrictions sur les coefficients αs et βs. Enfin, le théorème 3 nous montre qu’il n’est pas nécessaire d’imposer de restriction sur les coefficients αs et βs si X est suffisamment grand. En fait, dans son article, Karlson (2011) utilise la commande GLLAMM pour estimer un modèle NPLME.

Nous avons fini par créer une ligne par période et répéter chaque variable en triple (une par période). Nous avons attribué à chaque échantillon la valeur 0 pour les deux observations qui n'étaient pas associées à la même période que la variable (Kolenikov, s.d.).

Tableau 3.1 Arrangement des données
Tableau 3.1 Arrangement des données

Les eets marginaux et le calcul des écarts-types

Simulation

Pour plusieurs raisons que nous présentons ci-dessous, nous avons utilisé uniquement les données de la cohorte A. Cela nous permet de reconnaître l'effet du calcul des écarts types à l'aide de la méthode bootstrap. Dans le tableau 5.3, nous présentons les résultats de la deuxième spécification pour laquelle seuls les jeunes inscrits au cégep sont sélectionnés dans l'échantillon des inscriptions universitaires.

Le tableau 5.5 présente les résultats de la quatrième spécification, où l'on suppose qu'un jeune qui n'a pas encore obtenu un diplôme d'études secondaires à l'âge de 21 ans n'en obtiendra pas dans le futur. Nous avons donc finalement retenu les jeunes de la cohorte A ayant vécu au Québec lors du premier cycle.

Figure 3.1 Simulation avec la commande GLLAMM
Figure 3.1 Simulation avec la commande GLLAMM

L'Enquête auprès des jeunes en transition

La taille initiale de la cohorte de lecture était de 38 000 étudiants, tandis que la taille de la cohorte B était de 29 000 personnes. Au final, 29 700 jeunes de la cohorte A et 23 000 de la cohorte B ont effectivement répondu au premier cycle de l’enquête. De plus, Statistique Canada a calculé des pondérations pour obtenir un échantillon représentatif de la population canadienne.

En effet, lors du cycle 1, les parents des jeunes de la cohorte A ont été interrogés sur plusieurs aspects, dont leurs revenus et leur niveau de scolarité. Deuxièmement, seuls les jeunes de la cohorte A ont fait interviewer leurs parents, ce qui a contribué à notre choix de n'utiliser que cette cohorte.

La sélection de l'échantillon

Enfin, les jeunes doivent être observés suffisamment longtemps pour avoir une vision complète de leur parcours scolaire. Alors que le taux de diplômés du secondaire et d'inscriptions au cégep est stable, le taux d'inscriptions universitaires augmente fortement jusqu'au cycle 5. Les données sont assez stables entre les cycles 5 et 6, nous n'avons gardé que les jeunes ayant répondu aux 5 premiers cycles, c'est-à-dire c'est-à-dire jusqu'à l'âge de 23 ans.

Bien que nous ne retenions que les jeunes ayant répondu aux 5 premiers cycles, une exception est faite pour les jeunes n'ayant pas complété la 5e secondaire au cycle 3. Pour cela, nous nous contentons des trois premiers cycles car nous pensons que les jeunes qui n'auront pas obtenu leur diplôme d'études secondaires à 21 ans n'y parviendront pas dans des proportions significatives à l'avenir et que les jeunes dont le taux d'attrition est le plus élevé sont celui des décrocheurs.

La préparation des données, le choix des variables utilisées et les statistiques

  • La préparation des données
  • Le choix des variables
  • Les statistiques descriptives

Nous combinons ensuite ces informations avec celles du fichier d’enquête parents et celles relatives aux résultats du test de lecture PISA. Celui-ci est classé en quatre catégories : les parents sans diplôme d'études secondaires, les parents détenant un diplôme d'études secondaires, ceux détenant un diplôme supérieur et enfin ceux détenant un diplôme collégial. La décision de réussir uniquement le résultat du test de lecture est dictée par l'enquête.

En effet, seul le test de lecture a été administré par l’ensemble de la cohorte A, alors que les tests de mathématiques et de sciences n’ont été administrés qu’à un tiers de la cohorte et la perte des deux tiers de l’échantillon est bien trop importante. Diplôme d'études secondaires : diplôme d'études secondaires ou équivalent ; études incomplètes au collège, au cégep ou à l'université (sans certificat, diplôme ou grade); certificat ou diplôme d'une école commerciale privée ou d'un institut de formation privé ; Diplôme collégial : certificat ou diplôme d'un collège, d'un cégep, d'une formation professionnelle ou d'un métier, d'une formation d'apprenti, d'une école ordinaire ou d'une école de sciences infirmières.

Tableau 4.1 Proportion de diplômés des études secondaires et pourcentage par cycle de jeunes ayant été inscrits au moins 1 mois - pondérés
Tableau 4.1 Proportion de diplômés des études secondaires et pourcentage par cycle de jeunes ayant été inscrits au moins 1 mois - pondérés

Les spécications

Autrement dit, les jeunes qui n’ont pas de diplôme d’études secondaires sont exclus de l’échantillon pour l’inscription au niveau secondaire, mais les jeunes qui ne sont pas inscrits au niveau secondaire ne sont pas exclus de l’échantillon. Dans la cinquième spécification, nous utilisons l'obtention d'un diplôme universitaire et l'obtention d'un certificat universitaire comme variables dépendantes au lieu de l'inscription à ces deux niveaux. Nous remplaçons donc les transitions liées à l'inscription au cégep et à l'université par des transitions pour l'obtention d'un diplôme à ces deux niveaux.

Il convient de noter que cette spécification reprend la restriction sur les jeunes sans diplôme d'études secondaires utilisée dans la quatrième spécification. Dans la sixième spécification, nous effectuons une spécification complète en incluant cinq variables dépendantes, soit l'obtention d'un diplôme d'études secondaires et l'inscription et l'obtention d'un diplôme au cégep et à l'université.

Les résultats des estimations

Pour la deuxième transition, seul l’effet de la formation universitaire d’un parent augmente et devient significatif. Les résultats de la troisième spécification présentés dans le tableau 5.4 nous montrent l’influence de la variable score PISA sur l’estimation puisque la variable score PISA a été supprimée de l’estimation. Cette réduction reflète probablement la distance dans le temps de la mesure (score PISA), la distance réduisant son effet prédictif sur l’obtention d’un diplôme.

Au premier passage, nous constatons une diminution notable de la grande majorité des effets marginaux. Enfin, au tableau 5.7, nous retrouvons les résultats de la sixième spécification, la plus complète, combinant inscription et diplôme collégial et universitaire pour un total de cinq transitions.

Tableau 5.1 Résultats de la régression par NPMLE - Spécication 1
Tableau 5.1 Résultats de la régression par NPMLE - Spécication 1

Analyse des résultats, constats et critiques

Comme nous l'avons vu dans les simulations de la section 2.4.2, le biais est faible lorsque l'amplitude de l'hétérogénéité non observée est faible, ce qui expliquerait la faible différence entre nos différents résultats. Ceci est confirmé par la simulation du chapitre 3, dans laquelle les résultats d'estimation utilisant la commande GLLAMM présentent une variance très élevée. De plus, l'estimation à l'aide de la commande GLLAMM NPMLE nécessite des ressources de calcul considérables et implique des délais d'estimation importants.

Dans un premier temps, nous avons dressé un portrait de la littérature où nous avons vu que l'utilisation du modèle de transition initialement proposé par Mare (1980) implique un biais d'hétérogénéité, déjà reconnu à l'époque et mis en évidence par Cameron et Heckman (1998). Nous avons réalisé une autre simulation qui nous a montré que l'utilisation du NPMLE permettait, en pratique, de corriger le biais d'hétérogénéité non observé dans les bonnes conditions de simulation.

Moyenne et corrélation des variables observées et inobservées

Arrangement des données

Simulation de la correction du biais d'hétérogénéité inobservée par NPMLE 33

Statistiques descriptives des variables discrètes - pondérées

Statistiques descriptives des variables continues - pondérées

Résultats de la régression par NPMLE - Spécication 1

Résultats de la régression par NPMLE - Calcul des écarts-types bootstrap

Résultats de la régression par NPMLE - Spécication 2

Résultats de la régression par NPMLE - Spécication 3

Résultats de la régression par NPMLE - Spécication 4

Résultats de la régression par NPMLE - Spécication 5

Résultats de la régression par NPMLE - Spécication 6

Figure

Tableau 2.1 Moyenne et corrélation des variables observées et inobservées
Tableau 3.1 Arrangement des données
Figure 3.1 Simulation avec la commande GLLAMM
Tableau 3.2 Simulation de la correction du biais d'hétérogénéité inobservée par NPMLE
+7

Referencias

Documento similar

Nous allons aussi nous pencher sur le rôle du mémoire de maîtrise dans les programmes contem- porains de formation des traducteurs et d’interprètes pour donner à la fin, à titre