UNIL
le savoir vivant
Vous êtes ici: UNIL > L'enseignement > Fiche de cours
Français | English   Imprimer   

Fiche de cours

Statistique textuelle et théorie de l'Information

Textual statistics and theory of information

Faculté de gestion: Faculté des lettres

Responsable(s): François Bavaud
Intervenant(s): -

Période de validité: 2013 -> 2015

Pas d'horaire défini.

Cours-TP (travaux pratiques)

Semestre de printemps
3 heures par semaine
42 heures par semestre

Langue(s) d'enseignement: français
Public: Non
Crédits: 0
Polycopiés: Oui

Objectif

Connaissance et pratique des concepts, modèles et outils de base intervenant en statistique textuelle (richesse lexicale, chaînes de Markov, codage, simulation, partitionnement, analyses factorielles, visualisation).

Fondements de la Théorie de l'Information, et application en modélisation générale et textuelle (maximum de vraisemblance, maximum d'entropie, compression et taux d'entropie).

Savoir-faire numérique avec le logiciel R et autres logiciels spécialisés.

Remarque: cours labellisé P2I, intégrant en partie le cours on-line « théorie de l'information » (projet Campus Virtuel Suisse).

Contenu

Modèles textuels non séquentiels: type/token, mesure de richesse lexicale, loi de Zipf, problème des espèces inconnues.

Matrice termes-contexte, réseaux textuels pondérés, auto-corrélation textuelle, analyse des Correspondances.

Dissimilarités textuelles, partitionnement et phylogénie.

Modèles séquentiels: chaînes de Markov ordinaires et cachées, grammaires probabilistes.

Théorie de l'Information: modélisation, maximum de vraisemblance et maximum d'entropie. Mélanges textuels additifs et multiplicatifs. Génération de textes chauffés et refroidis.

Codage et compression textuelle. Capacité d'un canal de communication, taux d'entropie, cryptographie classique.

Les TP seront basés sur le logiciel R, ainsi que divers logiciels textuels libres.

Evaluation

Pour 5 ects : courte présentation (séminaire) et test écrit à la fin du semestre.

Exigences du cursus d'études

Avoir suivi les cours Méthodes Quantitatives I et II ou équivalent (statistique descriptive et inférentielle, uni- et bivariée).
Avoir bénéficié d'une introduction aux méthodes factorielles, au concept d'entropie et aux chaînes de Markov est souhaitable - mais pourra être rattrapé, le cas échéant.

Informations supplémentaires

www.unil.ch/sli

Canton de Vaud
Swiss University
Unicentre  -  CH-1015 Lausanne  -  Suisse  -  Tél. +41 21 692 11 11  -  Fax  +41 21 692 26 15