|
La collecte des informations
Origine
- Documents déjà existants : retrouver la version
originale source (électronique)!
- Documents non structurés : directement en HTML
- Documents structurés : BDD ou SGML ou XML
Rassembler
- L'ensemble des éléments SOUS FORME ELECTRONIQUE
- Une version papier des pages carrefours avec les liens mis en
valeur
Nommer
- Caractères alphanumériques (plus . - et _) sans
espace
- Différences majuscules/minuscules
- Suffixes signifiants
- Exemple
- listeDesFichiers.fr.html
- listeDesFichiers.en.html

|