MorDev : Alexandre Roulois

Mardi 27 Novembre 2018, 11:00 to 12:00
Organisation: 
Alexandre Roulois (LLF)
Lieu: 

LLF – Bât. ODG – 5e étage – Salle du conseil (533)

Alexandre Roulois (LLF)
Constituer un corpus à partir du Web avec python (1/2)

Après un exemple trivial permettant d’aborder les concepts-clés de l’exécution d’un script en langage python, nous verrons comment analyser une page Web afin d’en extraire du contenu et de l’enregistrer dans un fichier structuré au format CSV. Pour réaliser les exercices, il est impératif de disposer d’un ordinateur avec python (dans sa version 3 de préférence) et d’un logiciel d’édition avancé.

Comme aucun support lié à l’installation de votre environnement de travail ne sera assuré pendant la séance, veillez à bien respecter les pré-requis :

  • un éditeur de texte avancé (exemples : Notepad++ pour Windows, BBEdit pour MacOS…) ;
  • un environnement Python 3, peut-être déjà installé :
    • Windows : vérifier la présence de python dans le menu des applications et le lancer pour en connaître la version ;
    • Linux et MacOS : dans un terminal, exécuter la commande python -V
  • pour Windows uniquement, installer l’environnement Cygwin (émulation d’un système Linux).