Ce cours se focalise sur les challenges pratiques que le travail empirique rencontre dans le quotidien. Tels challenges nous forcent à choisir une stratégie empirique valide (« Research Design »), nous discutons les points faibles et forts des approches les plus populaires, et ce qui nous permet d’identifier un bon design de la recherche (étant au cœur de ce qu’on a nommé la révolution de crédibilité dans l’économie empirique).
Plan du cours détaillé :
Méthodes empiriques pour l’économétrie du travail
Toutes les méthodes seront illustrées en utilisant des données réelles et le logiciel R. Nous discuterons plusieurs articles tirés de la littérature empirique récente.
(I) Les biais de sélection: les problèmes et les remèdes
L’application des outils standards est fondée sur l’hypothèse que nous disposons d’un échantillon aléatoire représentatif de notre univers d’intérêt. Malheureusement, cette hypothèse est souvent fausse : par un calcul d’optimalité, l’individu fait un choix optimal qui n'est donc pas aléatoire. Par exemple, un individu décide de quitter ou accepter un emploi, et l’étude de la répartition de salaires ne peut que se fonder sur ce groupe auto-sélectionné, introduisant un biais de sélection. Nous étudierons l’idée de Heckman, qui est d’essayer de supprimer ce biais par une modélisation explicite (modèle de Roy).
Applications: Heckman and Honore (1990, ECTA). “The Empirical Content of the Roy Model.” Roy models of migration: Borjas (1999, Handbook of LabEcon), “The Economic Analysis of Immigration”, Chiquiar and Hanson (2005, JPE), “International Migration, Self‐Selection, and the Distribution of Wages: Evidence from Mexico and the United States”; Gurgand, M. and D.N. Margolis (2008, JPubE), “Does work pay in France? Monetary incentives, hours constraints, and the guaranteed minimum income.”
(II) Hétérogénéité non-observée : les effets fixes, estimation en utilisant un panel, et double différence (« difference-in-differences (DiD)»)
Nous ne pouvons pas observer tout qui est pertinent pour la détermination d’un résultat ou d'un choix. Une telle hétérogénéité non-observée pose donc un problème pour une étude empirique si elle est corrélée avec une variable de contrôle (le problème de variables omises). Souvent, la recherche pour une variable instrumentale est sans succès. Par contre, il peut être faisable d’observer le même individu à plusieurs reprises, et un tel panel peut nous offrir une solution. Nous développerons et mettrons en pratique plusieurs méthodes empiriques qui cherchent exploiter la structure d’un panel. Aussi nous discuterons plusieurs papiers tirés de la littérature théorique ainsi qu'empirique. Un cas important pour qui l’estimation par les méthodes de panel est devenu assez populaire est l’inférence causale en utilisant des expériences naturelles (« natural experiments » et « difference-in-differences (DiD)»). Nous discuterons les challenges et les limitations de cette stratégie empirique.
Applications: Ruhm, C.J. (1996, JoHE), “Alcohol policies and highway vehicle fatalities”; Card, D., J. Heining, and P. Kline. (2013, QJE) “Workplace Heterogeneity and the Rise of West German Wage Inequality”; Duflo, E. (2001, AER), ”Schooling and Labor Market Consequences of School Construction in Indonesia: Evidence from an Unusual Policy Experiment.”
Tandis que la stratégie DiD est devenue très populaire, la pratique d’inférence et de tester est problématique. Nous considérons des situations ou les erreurs de notre équation d’estimation sont corrélées parmi un groupe ou temporellement.
Lecture supplémentaire: Moulton (1990, RESTAT), "An Illustration of a Pitfall in Estimating the Effects of Aggregate Variables on Micro Units"; Donald and Lang (2007, RESTAT) "Inference with Difference-in-Differences and Other Panel Data"; Bertrand, Duflo, Mullainathan (2004, QJE), "How Much Should We Trust Differences-in-Differences Estimates?"
(III) Identification
Quelles sont les variations dans les données que nous cherchons à exploiter afin d’estimer les objets d’intérêt (souvent quelques coefficients) ? Un modèle économétrique est dit identifié si on peut déterminer telles coefficients de façon unique. Afin d’atteindre cet objectif, il faut imposer une structure, par exemple l’hypothèse que les erreurs dans le modèle linéaire sont non-corrélées avec les régresseurs. La validité de la stratégie empirique dépend donc de la validité empirique de cette hypothèse d’identification. Nous explorerons les exigences de « good Research Design ».
Application et réplication: D. Card (1993), “Using geographic variation in college proximity to estimate the return to schooling.” Angrist and Krueger (2001, JEconPersp) “Instrumental Variables and the Search for Identification: From Supply and Demand to Natural Experiments”, Angrist and Pischke (2010, JEconPersp) “The Credibility Revolution in Empirical Economics: How Better Research Design is Taking the Con out of Econometrics.”