Indicateurs d'utilisation d'esup-portail

Ce document décrit les mécanismes proposés par esup-portail afin d'obtenir des informations statistiques sur le fonctionnement du portail.


Vincent  MATHIEU 
Université Nancy 2

Dates de modification
Revision 1.0 10 janvier 2005
Revision 1.1 7 février 2008 Informations liées à l'enrichissement d'une base de données
1. Généralités
2. Indicateurs liés aux informations d'ouverture / fermeture de sessions
3. Indicateurs de services
4. Activation des statistiques
4.1. fichier de propriétés esup-portail
4.2. Cas des services externes
5. Enregistrement des informations statistiques
6. Traitement du fichier de statistiques

1. Généralités

Ce document indique globalement comment mettre en oeuvre les mécanismes d'informations statistiques d'esup-portail ; la consultation des documents annexes est plus que conseillée pour les apréhender :

On distingue 2 grandes familles d'informations statistiques :

Ces deux familles d'indicateurs sont réalisées dans esup-portail par type de population : étudiants, enseignants, personnels administratifs, ...

Ils sont fournis sous forme de documents xml, afin de rendre une utilisation tierce aisée.

Des utilitaires sont livrés afin d'en offrir une première visualisation html et même graphique.

2. Indicateurs liés aux informations d'ouverture / fermeture de sessions

Ils permettent d'obtenir des statistiques générales sur l'utilisation du portail, par jour et par mois, ceci pour les différentes populations.

exemples d'indicateurs :

3. Indicateurs de services

Ce sont des statistiques sur l'utilisation de certains services proposés par esup-portail ; par exemple, webmail, annuaire, espace de stockage, ...

Dans esup-portail, les services peuvent être de 2 types :

Dans les deux cas, il est possible d'obtenir l'information d'accès au service.

Dans le cas d'un service externe, l'accès au service est pris en compte lors du 'rebond' du navigateur W3 vers l'application externe (sous réserve que l'URL paramétrée dans le canal appelant soit correctement construite).

Dans le cas d'un service interne, l'accès au service est pris en compte lors d'une premiere action dans un canal, ou lors d'une action dans ce canal alors que l'action précédente n'était pas dans celui-ci.

Dans le cas d'un service interne, il est également possible d'obtenir l'information du nombre de 'clics' faits dans ce canal, toujours pour chaque population.

4. Activation des statistiques

4.1. fichier de propriétés esup-portail

Il faut positionner correctement certaines propriétés dans le fichier esup.properties.

Ce sont les propriétés esup.stats.*, voir le document relatif à l'installation d'esup-portail. En particulier :

esup.stats.attributeType

c'est l'attribut uportal qui va permettre de différencier les différentes catégories de personnes.

Par défaut, il est valué à eduPersonPrimaryAffiliation

esup.stats.recordSessions

permet de valider l'enregistrement dans le fichier de stats d'uportal des informations d'ouverture et de fermeture de session.

Doit être à 'true' (valeur par défaut)

esup.stats.recordTargeted

permet de valider l'enregistrement dans le fichier de stats d'uportal des informations de 'services internes'

Doit être à 'true' (valeur par défaut)

esup.stats.fnames

permet de limiter la production de statistiques de services à certains canaux. Il faut dans ce cas indiquer les 'fname' des canaux à surveiller (liste séparée par le caractère virgule).

La valeur "all" active l'enregistrement des statistiques pour tous les canaux du portail ; c'est la valeur par défaut.

4.2. Cas des services externes

Il faut alors que la requête http d'accès au service externe (ex : http://webmail.univ.fr) ne se fasse pas directement.

Les urls d'accès à des services que l'on désire suivre doivent être du genre : /ExternalURLStats?fname=webmail&service=http://webmail.univ.fr

ExternalURLStats est une servlet s'exécutant dans le contexte uportal, qui enregistre pour l'utilisateur courant l'appel externe vers le service logique 'webmail', pour l'URL http://webmail.univ.fr

5. Enregistrement des informations statistiques

Les informations statististiques sont gérées comme toutes les informations de 'logging' du portail.

Par défaut, dans le package esup-portail, ces informations statistiques sont redirigées vers un fichier décrit dans la propriété 'esup.stats.file'.

Dans le cas d'un fonctionnement multi-serveurs (load-balancing), il est conseillé de rediriger ces informations vers un serveur syslog.

Dans la distribution esup-portail, il est possible de modifier le comportement par défaut du package en créant ses propres fichiers (propriétés, sources, feuilles xsl, ...) dans la branche 'Perso' de l'environnement de déploiement. Voir la documentation d'installation du 'socle'.

Il est donc possible de modifier le comportement de log par défaut d'esup-portail, afin de rediriger une partie des 'logs' (dans notre cas, les informations statistiques) vers un serveur syslog.

Voici un extrait d'un Logger.properties qui redirige ces informations vers un serveur syslog :

log4j.category.org.esupportail.portal.services.stats=INFO,stats
log4j.additivity.org.esupportail.portal.services.stats=false
log4j.appender.stats=org.apache.log4j.net.SyslogAppender
log4j.appender.stats.SyslogHost=syslog.univ.fr
log4j.appender.stats.Facility=LOCAL6log4j.appender.stats.layout=org.apache.log4j.PatternLayout
log4j.appender.stats.layout.ConversionPattern=%d{ISO8601}\t[LOGICAL_NAME]\t%m%n

6. Traitement du fichier de statistiques

Différents outils sont fournis dans le package esup-portail afin de retraiter le fichier brut issu d'uportal pour en faire des informations exploitables.

Ces outils sont disponibles dans le répertoire /scripts/stats de la distribution.

Le moteur principal est le script traiteStatsEsup.sh, qui est le chef d'orchestre du traitement des indicateurs esup-portail.

Il est conçu pour réaliser des statistiques mensuelles sur le fonctionnement du portail ; rien n'empêche de l'exécuter journalièrement afin de suivre au plus prêt le fonctionnement.

Il peut être exécuté de deux manières :

Ce script comporte en tête un ensemble de variables permettant de le paramétrer.

Il se décompose en 4 étapes principales :

D'autres outils connexes sont distribués afin d'offrir un accès html et graphiques aux informations statistiques.