S'il s'agit de l'enseignement principal d'un enseignant, le nom de celui-ci est indiqué en gras.
Mardi horaire fixé ultérieurement (salle à préciser, Campus Paris-Jourdan, ENS, 48 bd Jourdan 75014 Paris), de début novembre à fin mai
Séminaire de réflexion et de débats autour des méthodes quantitatives en sociologie. Présentation de recherches en cours ou achevées utilisant ces méthodes.
Modélisation et méthodes statistiques en sciences sociales
responsable(s) : Marion Selz
courriel
Créés à l’initiative de membres du Centre Maurice Halbwachs (ex LASMAS), les ateliers M2S3 s’adressent aux personnes travaillant sur des données quantitatives en sciences sociales. Ils ont pour objectif de leur permettre d’exposer leurs difficultés, de rencontrer des interlocuteurs, d’échanger sur des méthodes et de confronter différents points de vue afin de développer — indépendamment de l’utilisation d’un logiciel particulier — les recherches sur des modèles pour traiter des données en sciences sociales, les comparaisons de méthodes statistiques et l’aide à l’interprétation des résultats.
Les réunions sont ouvertes à toutes les personnes qui le souhaitent (sans inscription préalable et sans frais), utilisateurs de données, chercheurs, ingénieurs ou étudiants à partir du DEA. Le cadre de ces réunions est plutôt informel et les participants doivent se sentir libres d’y exprimer leurs difficultés et/ou d’y avancer des solutions même incertaines.
Programme 2006-2007
24 octobre 2006
Campus Jourdan, bâtiment P, rez-de-chaussée, salle Grande salle (de 10 h 00 à 12 h 00)
Thierry FOUCART (Université de Poitiers) : Modèle linéaire. Analyse numérique d’une matrice de corrélation. Transitivité et colinéarité
Le modèle linéaire est l’une des méthodes statistiques les plus utilisées dans les sciences de l’homme et de la société. A partir d’un exemple consistant à étudier les liaisons entre le revenu, l’âge, la CSP, le diplôme et l’orientation politique des électeurs, on précise la démarche d’interprétation des résultats et les propriétés numériques du modèle qui interviennent. Ces propriétés règlent complètement la question de la transitivité de la corrélation et donnent une nouvelle interprétation de la corrélation partielle. Des simulations mettent en évidence l’instabilité des estimations lorsque les variables explicatives sont statistiquement colinéaires, et montrent l’intérêt de la régression bornée. Un algorithme apporte quelques éclaircissements sur le choix des composantes principales en régression orthogonale. L’objectif final de cette communication est de mettre en garde les utilisateurs du modèle linéaire contre une confiance exagérée dans les résultats qu’il produit.
28 novembre 2006
Campus Jourdan, bâtiment P, rez-de-chaussée, salle Grande salle (de 10 h 00 à 12 h 00)
Florence WEBER (CEE, Paris) : Une enquête par questionnaire au défi de l’interconnaissance des enquêtés
Co-auteurs : Agnès Gramain (CEE et LEGOS), Emmanuel Soutrenon (CEE, CSE et CMH)
Les enquêtes nécessitent parfois l’interrogation: de plusieurs personnes autour d’un cas, de personnes qui parlent à la place d’une autre, de passer par les uns pour avoir accès à d’autres. Les étapes, enjeux et difficultés d’une telle enquête seront exposés à partir de l’exemple d’une enquête expérimentale menée par une équipe d’économistes et de sociologues travaillant sur la prise en charge des personnes dépendantes. La problématique que l’équipe souhaitait traiter supposait de décrire l’ensemble des personnes potentiellement mobilisables autour d’une personne atteinte de troubles de type Alzheimer ainsi que l’ensemble des personnes effectivement mobilisées autour d’elle. Le protocole de l’enquête, qui supposait d’interroger des personnes appartenant à plusieurs ménages apparentés ou des individus aidants, l’ensemble de ces personnes constituant un 'cas', s’est révélé efficace à condition de tenir compte de ses différentes possibilités de blocage, comme le refus d’aider l’enquêteur à circuler dans l’entourage familial ou le refus de répondre au questionnaire.
30 janvier 2007
Campus Jourdan, bâtiment P, rez-de-chaussée, salle Grande salle (de 10 h 00 à 12 h 00)
E. LELIEVRE (INED, Paris) : De l’analyse de cohorte au suivi de trajectoires complexes : quels concepts, quelles données, quelles analyses ?
L’analyse longitudinale classique en démographie consiste à étudier la survenue au cours du temps d’un événement (mariage, migration, etc.) au sein d’une cohorte homogène. Elle conduisait à décrire des phénomènes à l’état pur en essayant d’éliminer les effets des autres processus à l’½uvre considérés comme perturbateurs. L’analyse statistique de trajectoires individuelles complexes où les processus interagissent, a renouvelé l’approche en la plaçant dans une perspective probabiliste et non déterministe des comportements , en offrant la possibilité de prendre en compte l’hétérogénéité entre les individus et ainsi de lever l’hypothèse rarement vérifiée de suivi d’un groupe homogène, ceci par la prise en compte des caractéristiques individuelles, fixes (comme le lieu de naissance) ou dépendantes du temps (tel le niveau de formation) ; de lever l’hypothèse d’indépendance entre phénomènes perturbateurs et phénomène étudié ; de traiter un corpus complexe de récits interrompus, puisque le plus souvent obtenus de façon rétrospective. On est passé d’une analyse à un niveau macroscopique, celui de populations dont les membres sont supposés se comporter de façon homogène à une vision microscopique, celles de trajectoires individuelles caractérisées par des successions chronologiques d’événements de nature diverse. Le nouveau défi consiste à trouver un niveau intermédiaire plus satisfaisant du point de vue de la compréhension des comportements, ce qui présente des challenges du point de vue de l’observation comme de la modélisation. L’exposé, largement illustré d’exemples, retracera conjointement l’évolution des concepts, des sources de données et méthodes d’analyse.
27 février 2007
Campus Jourdan, bâtiment P, rez-de-chaussée, salle Grande salle (de 10 h 00 à 12 h 00)
Françoise Cribier (CNRS-CMH) : *Les mesures de la santé auto-estimée, leur sens et leur usage en science sociale.
Ce travail (1975-2005) repose sur des mesures répétées de la SAE sur des échantillons représentatifs étoffés, bien renseignés socialement, de 2 cohortes retraitées en 1972 et 1984. On observe l’influence du genre et de la catégorie sociale du sujet sur la SAE, et, plus originale, celle des origines socio-géographiques, de l’instruction, des parcours professionnels, de la catégorie sociale du ménage, du statut familial. On a créé des mesures de 'santé-motilité estimées', de 'santé du ménage', observé leurs relations avec les modes de vie, le moral, le plaisir à vivre, mettant l’accent sur les différences culturelles qui influent à la fois sur la SAE, le recours aux soins, et la santé 'objective'. Les différences de SAE entre groupes sont dues à des états de santé différents, et à des modes d’estimation différents. Les réponses longtemps analysées comme 'optimistes' sont le plus souvent des réponses peu réalistes car mal informées, de sorte que les différences de SAE entre groupes sociaux sont plus grandes que celles de la santé objective, surtout chez les hommes. Enfin l’évolution d’une cohorte à l’autre montre une différence paradoxale d’estimation la cohorte la plus jeune se porte mieux et dit se porter plutôt moins bien.
27 mars 2007
Campus Jourdan, bâtiment P, rez-de-chaussée, salle Grande salle (de 10 h 00 à 12 h 00)
Daniel VERGER (INSEE) : La comparabilité internationale des statistiques sociales est-elle une utopie ?
Le système statistique français se développe de plus en plus dans un cadre formatté par des recommandations européennes afin de permettre l’émergence d’études comparatives fiables. L’objectif est particulièrement ambitieux dans le domaine social, en particulier pour tout ce qui a trait aux questions de revenus et d’inégalités de niveaux de vie. Les régimes fiscaux et sociaux sont encore loin d’être unifiés, les modes de vie gardent les traces d’un passé récent où les régimes politiques étaient fort différents, et les spécificités culturelles ne se sont pas toutes effacées. A partir notamment de l’exemple des études conduites sur la pauvreté, on se propose de réfléchir sur les conditions nécessaires à l’établissement de statistiques robustes et comparables.
24 avril 2007
Campus Jourdan, bâtiment P, rez-de-chaussée, salle Grande salle (de 10 h 00 à 12 h 00)
E. DUFLO (MIT, Cambridge MA) : La causalité en sciences sociales
Dans cette séance, on abordera le problème de la causalité en sciences sociales, On introduira la notion de 'résultats potentiels' et on montrera l’importance des biais potentiels de sélection. On discutera ensuite des et les différentes solutions qui lui ont été proposées par les statisticiens et les économistes. (Correction de Heckman, variables instrumentales, expériences naturelles ou contrôlées) avec leurs avantages et leurs limites. L’exposé reposera sur des exemples concrets.
29 mai 2007
Campus Jourdan, bâtiment P, rez-de-chaussée, salle Grande salle (de 10 h 00 à 12 h 00)
N. RAZAFINDRATSIMA (INED, Paris) & A. BRINGE (INED, Paris) : L’utilisation des 'pondérations' dans l’analyse des données d’enquêtes par sondages. Principes et exemples.
De nombreuses données utilisées en sciences sociales proviennent d’enquêtes par « sondage ». Il s’agit d’une méthode d’enquête quantitative qui consiste à collecter l’information non sur la totalité de la population ciblée mais uniquement auprès d’une partie de celle-ci, appelée « échantillon », et réduisant ainsi considérablement les coûts. Cet avantage amène toutefois à une contrainte lors du traitement des données. En effet, les enquêtes par sondage donnent lieu à des « pondérations », ou coefficients d’extrapolation, valables par unité ayant répondu, et qui font en sorte que l’échantillon obtenu in fine soit « représentatif » de la totalité de la population ciblée. Le calcul de ces pondérations peut être très complexe : il tient généralement compte du plan de sondage, mais aussi, éventuellement des non-réponses, et met en ½uvre des procédures de « calage sur marges », etc. Notre exposé tentera d’éclairer une question que les usagers des données d’enquêtes par sondage se posent souvent : l’utilisation de la variable «pondération» dans les analyses, et la mise en ½uvre. On évoquera quelques éléments théoriques qu’on illustrera par des exemples issus d’enquêtes par sondage récentes.
26 juin 2007
salle 8, 105 bd Raspail (de 10 h 00 à 12 h 00)
Monique WACH (CMH-DYRESO, Caen) : Utilisation du logiciel Alceste pour l’analyse du discours :instrument de validation et/ou aide à la construction d’hypothèses
Les règles de la méthode sociologique indiquent qu’il convient de traiter les faits sociaux comme des choses. Quand les matériaux à analyser sont des productions langagières écrites ou orales sur lesquelles une analyse de contenu va être effectuée, comment se prémunir des croyances du chercheur ? L’utilisation d’un logiciel comme ALCESTE est adaptée à cet objectif, il met en oeuvre des mécanismes d’analyse indépendants du sens et permet d’étudier la structure formelle de la cooccurrence des mots dans un corpus donné. Il dégage des mondes lexicaux qui peuvent être pris comme autant de 'faits bruts' sur lesquels appuyer sa démarche interprétative. Deux exemples : — «Votre vie à 25 ans, comment vous voyez-vous ?» réponse donnée par des lycéens de terminales de lycée à cette question. Le corpus des réponses a d’abord fait l’objet d’une analyse de contenu traditionnelle et a été soumis ensuite (deux ans plus tard) à Alceste, les résultats des deux analyses seront présentés en parallèle. — Mémoire de recherche et travail social, l’exemple des quatrièmes de couverture des mémoires de recherche du Diplôme Supérieur de Travail Social.
Adresse(s) électronique(s) de contact : forse(at)iresco.fr (changera en 2007)
Dernière modification de cette fiche : 24 novembre 2008.
EHESS (Siège), 190-198 avenue de France 75244 Paris cedex 13 - Tél : 01 49 54 25 25