Accueil | Photothèque | Annonces | Art | Histoire | Liens | Vue | Maladies | Chirurgie | Homepage | Nous écrire

Quelques outils du webmaster

Rev 27-02-2004
jmm

1) .htaccess et .htpasswd pour les ophtalmos

2) Les logs pour les ophtalmos

3) TCP/IP pour les ophtalmos

 

1) Créer un répertoire nécessitant un login et un mot de passe
ou .htaccess et .htpasswd pour les Nuls

Il faut faire toutes ces manipulations en ligne, donc avec une connexion. Cela ne peut pas être fait en local.

Vous avez un domaine qui s'appelle mondom.com

Vous voulez qu'un répertoire dans ce domaine soit à accès réduit, et qu'il faille un mot de passe pour voir les fichiers qu'il contient. Facile.

On va y mettre 2 fichiers textes, .htaccess et .htpasswd qui vont permettre le fonctionnement du système.

.htaccess et .htpasswd

Etape 1

Dans le répertoire www il faut créer un dossier que vous appelez secret. On le crée facilement avec le programme permettant le transfert de fichiers (le client ftp, quoi). Il suffit de se positionner dans www et de choisir Créer un nouveau répertoire.

Etape 2

Vous créez un fichier quelconque, par exemple target.txt

Vous créez un fichier texte qu'on nomme cherchetarget.php et qui contient un seule ligne qui est
<? echo realpath("target.txt"); ?>

Vous mettez ces deux fichiers dans le répertoire secret.

Vous lancez votre navigateur en lui donnant l'adresse:
http://www.mondom.com/secret/cherchetarget.php

Il vous affiche le chemin du fichier target.txt (le path) comme ça par exemple:
/home/riquiqui/www/secret/target.txt

On remarque au passage que le mot riquiqui correspond au login de l'accès ftp. On n'en a rien à faire.

Vous venez donc de trouver le path qui mène au répertoire secret

Etape 3

Créez un fichier texte .htaccess qui contient les lignes que voilà:

# .htaccess
AuthUserFile /home/riquiqui/www/secret/.htpasswd
AuthGroupFile /dev/null
AuthName "Acces Restreint"
AuthType Basic
<Files "secret.html">
require valid-user
</Files>

Quelques explications

La ligne 1 précédée de # est un commentaire

la ligne 2 doit contenir le trajet qu'on a trouvé plus haut. Il ne faut pas oublier de remplacer le mot target.txt par .htpasswd. Cela donne donc le trajet /home/riquiqui/www/secret/.htpasswd

la ligne 3 vous ne touchez pas

la ligne 4 contient ce qui sera affiché dans la boite de dialogue de demande de login et de mot de passe. Vous pouvez changer "Acces Restreint" par "Entree interdite" si ça vous fait plaisir. Il faut un texte court et sans accent.

Les lignes 5,6,7 et 8 ne sont pas modifiées

Vous enregistrez ce fichier texte sous le nom .htaccess

N'oubliez pas le point devant le nom !!

Pour les utilisateurs de Windows:

Il faut enregistrer le fichier sous le nom htaccess.txt, le placer sur le serveur, et le renommer ensuite sur le serveur avec le logiciel ftp, en .htaccess

En effet ce système d'exploitation n'aime pas qu'on utilise des fichiers qui commencent par un point.

Pour les utilisateurs de Mac:

Pas de problème car on peut tout à fait nommer des fichiers de son disque dur .htaccess

Etape 4

Vous créez un fichier texte .htpasswd qui va contenir les mots de passe. Il faut que ces mots de passe soient cryptées. On va mettre le login, suivi par deux points et puis le mot de passe crypté.

Si gaston a choisi comme mot de passe lechatduvoisin, vous ne pouvez pas faire

gaston:lechatduvoisin

Pour crypter le mot de passe vous trouvez un site web qui le fait comme par exemple:

http://www.toutwebmaster.be/home/dossiers/crypt_pass.php

Si ce site n'existe plus, cherchez dans un moteur de recherche comme Google.fr avec les mots crypter .htpasswd .htaccess

Donc vous avez mis dans la case de cryptage du site web lechatduvoisin et le résultat est MlrFGPRiwBAtk

Votre fichier des mots de passe va contenir une seule ligne:

gaston:MlrFGPRiwBAtk

Si vous avez d'autres utilisateurs, avec chacun leur mot de passe, vous pouvez les mettre les uns sous les autres comme ça:

gaston:MlrFGPRiwBAtk
clo:CP1UnZziIpr/.
mireille:.i3qAQLlXjIGE

Vous enregistrez le fichier texte sous le nom .htpasswd

N'oubliez pas le point avant le nom !!

Pour les utilisateurs de Windows:

Il faut enregistrer le fichier sous le nom htpasswd.txt, le placer sur le serveur, et le renommer ensuite sur le serveur avec le logiciel ftp, en .htpasswd

En effet ce système d'exploitation n'aime toujours pas qu'on utilise des fichiers qui commencent par un point.

Pour les utilisateurs de Mac:

Pas de problème car on peut tout à fait nommer des fichiers de son disque dur .htpasswd

Etape 5

Donc vous avez obtenu les deux fichiers texte .htaccess et .htpasswd dans le répertoire secret.

Pour éviter qu'on voit l'arborerscence du répertoire secret, vous y placez un fichier index.html ou index.htm qui sera vu par ceux qui auront mis le login et le mot de passe dans la boite de dialogue.

et c'est tout.

ça doit marcher

Etapes 6

Vous lancez votre navigateur avec l'adresse http://www.mondom.com/secret/ et vous devez voir la boite de dialogue apparaître. Vous rentrez le login (gaston) et le mot de passe qui convient (lechatduvoisin dans notre exemple) et vous verrez devant vos yeux ébahis le fichier index.html ou index.htm qui se trouve dans ce répertoire secret.

Tips

Ca doit marcher car j'y suis arrivé sans être informaticien. Les problèmes surviennent si vos fichiers texte ne sont pas seulement du texte, si le transfert n'est pas fait en texte seul, et si vous vous trompez dans le path.

Il y aura des problèmes si le serveur n'est pas sous Unix ou si le php ne fonctionne pas dessus...

Pour en savoir beaucoup plus, je vous conseille la page http://www.infres.enst.fr/~danzart/frames/htaccess.html

Have fun

jmm

2) Les logs pour les ophtalmos

Vous aimeriez savoir quels sont les visiteurs de votre site web et quels sont leurs comportements ?

Il faut alors analyser les logs qui sont disponibles pour chaque webmaster, grâce à des programmes commerciaux, des sharewares ou des freewares. Les logs sont des fichiers textes de plusieurs mégas, contenant des centaines ou des milliers de lignes pour chaque journée. Ils enregistrent tous les événements du site, les pages demandées, l'heure de la visite, l'origine du visiteur, les pages non trouvées... Impossible de décrypter ces informations sans l'aide d'un logiciel d'analyse de logs.

Première étape, trouver un programme.

On peut s'orienter vers des logiciels comme Analog (gratuit) et ses versions pour macintosh, ou bien Summary que l'on va évoquer ici (payant $59) et qui fonctionne sur toutes les plateformes. De nombreux autres existent, comme le célèbre Webtrends ou bien Fastats ($100). La différence gratuit/payant se fait sur la puissance des programmes et le support technique. Quand j'ai essayé Summary, mes logs n'étaient pas reconnus (loi de Murphy) car ils ont un format particulier, mais l'aide des concepteurs m'a permis de contourner le problème.

Grâce à une période d'essai gratuite on peut essayer facilement ces logiciels.

Il faut télécharger par ftp les fichiers de logs qui font plus de 9 mégas chacun pour snof.org et qui sont dans le répertoire logs, situé au même niveau que le répertoire contenant les pages html. On met, sur son ordinateur, les fichiers dans le répertoire logs du logiciel et on lance le programme.

Après avoir mouliné un peu, il demande d'utiliser un navigateur avec une adresse du style "http://atoulouse-106-1-11-103.abo.wanadoo.fr:9000/" (fonction de son adresse IP), qu'il donne dans la fenêtre unique du programme.

Et aussitôt on a accès à ce type d'informations:

overview
Fenêtre Overview

Il suffit de cliquer sur chaque item pour avoir les précisions sur les visiteurs et leur comportement (behavior).

visitor behavior

On voit apparaître les mauvais liens (dead links) et les erreurs qu'a rencontrées le serveur au cours des navigations.

requests failing

Les principales requêtes n'ayant pas abouti concernent le fichier robots.txt et le fichier favicon.ico

Limites de l'analyse des logs

L'analyse des logs est biaisée par le phénomène de caching.

Ainsi sur le réseau internet il existe des ordinateurs (les proxy) qui sont chargés de garder les pages les plus demandées des sites pour les servir plus vite à leurs visiteurs.

Le problème est que ces lectures ne sont pas comptabilisées par le serveur qui contient les pages du site web qu'on essaye d'analyser. On sous-estime donc les pages vues et le nombre de visiteurs. Quand Wanadoo ou Club-Internet gardent dans leurs proxy les pages les plus lues, on a l'impression que le traffic est faible sur le serveur, alors qu'en fait une population inconnue lit ces pages.