Rechercher dans ce blog

mercredi 29 octobre 2014

Exercice tableau d'URLs à 1 colonne

Bonjour ! 

Rappelons les étapes du projet :

  • choisir la thématique qui est un mot traduit dans différentes langues ;
  • trouver des URLs pour chaque langue.
La phase 1 consiste en la construction d'un corpus multilingue (elle représente 80% du projet) et l'implémentation d'un programme en bash. 
La phase 2 consiste en l'"analyse du corpus" c'est-à-dire un peu de textométrie, des nuages de mots,  étude des co-occurences. 

En plus de la construction du corpus, cette année il faudra utiliser en parallèle Gromoteur, un logiciel qui va constituer un corpus automatiquement. Les 2 méthodes ont leurs avantages et leurs faiblesses, il s'agira donc de les contraster. 

Le but de l'exercice que nous devons effectuer cette fois est l'écriture d'un programme qui va créer un fichier HTML contenant un tableau à 1 colonne lisant toutes les URLs. Nous ajouterons des colonnes au fur et à mesure des séances de travail. 

Nous vous présentons deux versions : la première dans laquelle le script demande à l'utilisateur de saisir les chemins des fichiers au clavier :

Script version 1 (cliquez sur les images pour les agrandir)

Shell version 1

Tableau URLS version 1

Et la seconde version dans laquelle l'utilisateur n'a plus à taper les chemins des fichiers au clavier car ils sont récupérés dans un fichier spécifique : 


Script version 2

Shell version 2

Fichier_chemins

Tableau URLS version 2

A très bientôt !

1 commentaire:

  1. La version 2 est intéressante mais ne correspond pas à une redirection de flux entrant (via <).
    Il faut effectivement générer un fichier contenant les infos nécessaires au script (chemins du fichier d'URlL et du tableau de sortie) et une fois ce fichier généré (dans un éditeur par exemple), lancement du script en lui "envoyant" ces infos via la redirection de flux entrant.
    Ce mécanisme permettra par exemple d'avoir plusieurs fichiers de paramètres (un par langue) et de lancer le script en changeant simplement le fichier de paramètre en entrée...
    Si tt ceci n'est pas clair, on en reparle mercredi prochain

    SF

    RépondreSupprimer