|
Affiner ou élargir la recherche 8 entrées référencées Lire l'article
| Titre |
Recherche de classes empiétantes dans un graphe : application aux réseaux d'interactions entre protéines |
| Auteur |
DENOEUD-BELGACEM Lucile |
| Mots-clefs |
Classification empiétante, Classification par densité, Graphe, Nuées dynamiques, Partitionnement, Réseau d'interactions entre protéines |
| Thèmes |
Biologie, Classification - Partition, Graphes, Modèles mathématiques |
| Résumé |
Cet article présente une méthode de classification empiétante permettant de mettre en évidence des zones denses en arêtes dans un graphe. On cherche plus précisément à extraire du graphe des sous-graphes dont la densité en arêtes soit élevée par rapport à la densité du graphe entier, ces sous-graphes pouvant avoir des sommets en commun. Cette méthode est appliquée à un problème issu de la biologique : l'annotation des protéines. Les graphes considérés traduisent alors des interactions observées entre les protéines. Partant du principe biologique que des protéines impliquées dans une même fonction cellulaire interagissent, les sous-graphes obtenus par l'application de la méthode de classification empiétante aux réseaux d'interactions donnent des indications sur les fonctions des protéines constituant ces sous-graphes, ce qui permet de fournir une aide informatique à la prédiction de fonctions inconnues de certaines protéines. Le caractère empitétant autorisé par la méthode présentée ici permet en particulier de prendre en compte le fait que les protéines peuvent être impliquées chacune dans plusieurs fonctions cellulaires. |
| Numéro |
187, Automne 2009, n° spécial Journée 2007 de la Société francophone de classification |
| Langue |
Français | Lire l'article
| Titre |
Quelques remarques sur la méthode d'ajustement de Mayer : lien avec les méthodes de classifications |
| Auteur |
FALGUEROLLES Antoine |
| Mots-clefs |
Algorithme des transferts de Régnier, Classification, Histoire de la statistique, Méthode des moyennes de Mayer, Régression linéaire |
| Thèmes |
Classification - Partition, Histoire de la statistique, Statistique |
| Résumé |
Le cas simple de l'ajustement d'une droite de régression par la méthode de Mayer, au programme de l'enseignement secondaire français il y a quelques années, avait été introduit comme un succédané de la méthode des moindres carrés. Il apparaît que la démarche qui était ainsi proposée aux élèves fournit un exemple élémentaire d'arbre de régression. Il apparaît aussi que, dans le cas général, c'est un problème de classification pour lequel l'algorithme des transferts de Régnier [1965] est particulièrement bien adapté quoique possiblement suboptimal. L'exemple célèbre d'ajustement, que Mayer traite en 1750 par une méthode novatrice et très générale, est revu à la lumière de méthodes statistiques contemporaines usuelles. Les résultats numériques obtenus montrent l'extraordinaire maîtrise de Mayer. |
| Numéro |
187, Automne 2009, n° spécial Journée 2007 de la Société francophone de classification |
| Langue |
Français | Lire l'article
| Titre |
Comparaison de différentes approches de l'évaluation supervisée |
| Auteur |
FERRANDIZ Sylvain |
| Mots-clefs |
Bayesianisme, Classification supervisée, Longueur de description, Plus proche voisin, Risque structurel |
| Thèmes |
Classification - Partition, Statistique, Test |
| Résumé |
La sélection d'instances pour la classification suivant le plus proche voisin est un problème classique d'apprentissage statistique. Placé dans le cadre de la sélection d'hypothèses, ce problème possède deux caractéristiques : premièrement l'ensemble des hypothèses est structuré et, deuxièmement, il dépend des données. Nous proposons des critères d'évaluation non paramétriques tenant compte de ces caractéristiques, notre objectif étant de comparer des sous-ensembles d'instances de cardinaux différents sans recourir à l'ajustement d'un paramètre extérieur. Pour cela, nous nous intéressons aux approches régularisantes de l'évaluation.
Nous explorons successivement trois approches de l'évaluation statistique régularisée : l'approche SRM (pour Structural Risk Minimisation), l'approche BIC (pour Bayesian Information Criterion) et l'approche MDL (pour Minimum Description Length). Nous proposons ainsi trois nouveaux critères d'évaluation régularisée de l'intérêt d'un sous-ensemble d'instances. Tous trois autorisent la comparaison d'ensembles d'instances de tailles différentes. Tous trois sont non paramétriques.
Nous procédons à une comparaison qualitative des critères, basée sur des données réelles et synthétiques, et démontrons le fait suivant : le critère MDL est plus fin que le critère BIC, lui-même plus fin que le critère SRM. |
| Numéro |
187, Automne 2009, n° spécial Journée 2007 de la Société francophone de classification |
| Langue |
Français | Lire l'article
| Titre |
Une nouvelle méthode de classification pour des données intervalles |
| Auteur |
HARDY André, KASORO Nathanael |
| Mots-clefs |
Arbre de décision, Classification automatique, Critère des Hypervolumes, Maximum de vraisemblance, Processus de Poisson |
| Thèmes |
Arbres, Classification - Partition, Statistique |
| Résumé |
Cet article propose une nouvelle méthode de classification automatique pour des données intervalles. C'est une extension d'une méthode de classification classique à des données intervalles. La procédure classique est basée sur la théorie des processus ponctuels, et plus particulièrement sur le processus de Poisson homogène. La première partie de la nouvelle méthode est une procédure de classification monothétique divisive. La règle de coupure utilise une extension à des données intervalles du critère de classification des Hypervolumes. L'étape d'élagage utilise deux tests statistiques du quotient de vraisemblance basés sur le processus de Poisson homogène : le test des Hypervolumes et le Gap test. Nous obtenons alors un arbre de décision. La seconde partie de la méthode est une procédure de recollement qui permet, dans certains cas, d'améliorer la classification obtenue à la fin de la première partie de l'algorithme. La méthode est évaluée sur des données générées et sur des données réelles. Elle est comparée à d'autres méthodes de classification disponibles pour des données intervalles. |
| Numéro |
187, Automne 2009, n° spécial Journée 2007 de la Société francophone de classification |
| Langue |
Français | Lire l'article
| Titre |
Construction d'arbres à partir de relations d'intermédiarité, application au stemma codicum |
| Auteur |
LE POULIQUEN Marc, BARTHELEMY Jean-Pierre |
| Mots-clefs |
Arbre, Filiation de manuscrits, Relation d'intermédiarité, Stemma codicum |
| Thèmes |
Arbres, Classification - Partition, Littérature |
| Résumé |
Dans cet article, nous allons modéliser la relation ternaire d'intermédiarité dans le cadre de l'édition critique de texte. L'éditeur doit essayer de reconstituer au mieux, à partir des manuscrits préservés, le manuscrit original tel que l'auteur l'a écrit. Le corpus est constitué de manuscrits copiés les uns sur les autres. Une des méthodes utilisées consiste à élaborer un arbre de filiation des manuscrits restants, appelé le stemma codicum Nous proposons de construire cet arbre à partir des relations d'intermédiarité entre les manuscrits : Un manuscrit B est entre les manuscrits A et C si le manuscrit C a été copié à partir du manuscrit B et que lui-même a été copié sur le manuscrit A. |
| Numéro |
187, Automne 2009, n° spécial Journée 2007 de la Société francophone de classification |
| Langue |
Français | Lire l'article
| Titre |
Représentations du texte pour la classification arborée et l'analyse automatique de corpus. Application à un corpus d'historiens latins |
| Auteur |
MELLET Sylvie, LUONG Nguyen Xuan, LONGREE Dominique, BARTHELEMY Jean-Pierre |
| Mots-clefs |
Analyse arborée, Classification générique, Motif, Structures linéaires, Topologie textuelle, Treillis, Voisinage |
| Thèmes |
Arbres, Classification - Partition, Littérature, Treillis |
| Résumé |
Nous exposons ici différentes méthodes de classification automatique des textes littéraires et nous en comparons les performances, notamment en ce qui concerne leur aptitude à traduire les structurations génériques du corpus. Nous montrons qu'une approche topologique des textes, qui prend en compte leur linéarité fondamentale, c'est-à-dire l'ordre macro- et micro-structurel de leurs différentes unités constitutives, permet d'obtenir de meilleurs résultats classificatoires que les méthodes traditionnelles qui tendent à négliger cette structure linéaire. |
| Numéro |
187, Automne 2009, n° spécial Journée 2007 de la Société francophone de classification |
| Langue |
Français | Lire l'article
Lire l'article
Droits des utilisateurs :

Cette création est mise à disposition sous un contrat Creative Commons
|