Accueil du site> Faq
Version à imprimer Enregistrer au format PDF

Le forum

mercredi 24 janvier 2007, par David Malle Visites  674

Le forum du site http://www.xdocs400.com, consacré à l’environnement AS400, iSeries est ouvert depuis le 22/01/2007.


Voir en ligne : Le forum AS400, iSeries du site xdocs400.com

Le forum se veut complémentaire au site. Il s’agit d’un autre vecteur d’information, qui à partir d’un fil de discussion (très souvent un problème à résoudre, soumis par un utilisateur du forum), entraîne réflexions, conseils des autres participants. Il peut être source de beaucoup d’informations intéressantes.

Le forum est administré de manière à ce qu’il rende service à ceux qui en ont besoin. Il n’est pas question de passer trois heures à chercher une information qui ne s’y trouve pas. Les utilisateurs acceptent donc que l’administrateur et/ou le modérateur change une réponse ou une question de place, voir la supprime, si son contenu est jugé non approprié.

Le but : avoir dans le forum l’essentiel, et laisser de côté les états d’âmes.

La visite du contenu du forum est libre à tous.

Pour participer au forum, il faut s’y inscrire.

Version à imprimer Enregistrer au format PDF

Contribuer à la vie du site

vendredi 11 mai 2007, par David Malle Visites  595

Xdocs à une bonne audience. Nombre d’internautes y trouvent leur bonheur dans le domaine de l’iSeries. Nous faisons appel aux volontaires qui souhaitent faire partager leur connaissances techniques, afin d’étoffer l’information du site et en faire profiter la communauté.


Principes de publication

- La rédaction des contributions se font sur le principe du bénévolat.
- L’auteur se voit créé un profil par l’administrateur. C’est sous ce profil qu’il pourra rédiger ses articles.
- L’auteur peut être joint par email via le site, s’il le souhaite. S’il n’indique pas son email dans sa fiche auteur, le formulaire email ne sera pas proposé aux internautes.
- La rédaction des articles se fait dans le standard de l’outil d’administration, très facile à maitriser.
- Les articles sont soumis par l’auteur, aux administrateurs du site, qui les publient, après vérifications, corrections éventuelles (mise en forme, standard de présentation).

Si vous êtes interressé

Ecrivez moi un email

Version à imprimer Enregistrer au format PDF

La newsletter.

vendredi 17 septembre 2004, par David Malle Visites  42433

Pour un site dynamique, la newsletter est un élément important. Elle constitue le lien entre les rédacteurs et les internautes, lecteurs des articles.

Ce lien est essentiel à une bonne fréquentation du site, et donc une motivation supplémentaire pour les rédacteurs à créer de nouveaux articles et mettre à jour les informations déjà existantes.


Comment s’inscrire à la newsletter ?

- Renseignez votre e-mail dans le champ prévu "Votre e-mail".

- Cliquez sur le bouton "Ok".

- Une page "yahoo" est affichée qui vous signale que pour pouvoir rejoindre le groupe conduitedeprojet, vous devez confirmer cette adresse e-mail. Un message est envoyé à l’adresse e-mail que vous avez indiqué, avec les instructions à suivre.

- Consultez cet e-mail et suivez les instructions qui vous sont données :

  • Répondre au message pour confirmer votre inscription (aucun texte de réponse n’est nécessaire, il suffit juste de répondre au message).

- Vous devez recevoir un mail de confirmation définitive de votre inscription. Mettez le de côté pour en conserver les informations.

Quand la newsletter est elle envoyée ?

- La newsletter est envoyée en moyenne 1 fois par mois.

- La newsletter peut parfois être envoyée à l’initiative de l’administrateur. Par exemple s’il juge important d’avertir par newsletter d’une modification sur le site.

La newsletter est elle gratuite ?

- Elle est bien évidemment gratuite.

Comment ne plus recevoir la newsletter ?

- Si vous ne souhaitez plus appartenir au groupe conduitedeprojet, vous pouvez vous désinscrire en envoyant un e-mail à conduitedeprojet-unsubscribe@yahoogroupes.fr.

Service Yahoo groupes ?

- Le site utilise les services de Yahoo groupes. Vous pouvez visiter le site Web Yahoo ! Groupes que nous utilisons pour gérer la newsletter : yahoo groupes

Version à imprimer Enregistrer au format PDF

Recherche par thème.

vendredi 17 septembre 2004, par David Malle Visites  24937

A chacun des articles sont associés un ou plusieurs thèmes regroupés en groupe de thèmes (programmation, méthode, ...).

Par exemple, le groupe "Programmation" regroupe les thèmes "Langage CL", "Langage SQL", ...

Il est possible de naviguer sur le site, sur un thème donné.


Choix d’un thème ?

- Cliquer sur un des groupes proposés (Méthode, Programmation, ...).

  • Les thèmes associés apparaissent.

- Cliquer sur l’un des thèmes pour afficher la liste des articles associés au thème.

  • Par exemple, dans le groupe "Programmation, cliquer sur le thème "Langage SQL" pour afficher les articles, sites référencés associés à "Langage SQL".

- Cliquer sur "Tous" pour afficher la liste des articles associés à l’ensemble des thèmes de ce groupe.

  • Par exemple, dans le groupe "Programmation, cliquer sur "Tous" pour afficher les articles, sites référencés associés à tous les thèmes du groupe.

Version à imprimer Enregistrer au format PDF

Popularité d’un article

dimanche 8 août 2004, par David Malle Visites  24869

Comment décompter des visites

Des centaines de méthodes statistiques existent pour décompter des visites sur un site donné. La plupart donnent des courbes horaires, ou par jour, qui permettent de savoir si son site « monte » ou « descend », et de vérifier qu’il y a plus de gens sur le net en fin d’après-midi et dans la semaine, que le week-end ou la nuit...

Notre objectif est un peu différent : il s’agit d’attribuer à chaque article une valeur de « popularité » reflétant assez rapidement une tendance, et permettant de comparer l’activité de différents articles, soit de manière globale sur tout le site (hit-parade), soit à l’intérieur d’une rubrique, soit parmi les articles d’un même auteur, etc.

La méthode retenue est la suivante

chaque visite sur un article ajoute un certain nombre de points à cet article ; 1 point si c’est un article que l’on consulte depuis le site lui-même en suivant un lien, et 2 points si c’est une « entrée directe » depuis un site extérieur (moteur de recherche, lien hypertexte, syndication...) toutes les 10 minutes, le score obtenu est multiplié par un petit facteur d’escompte, qui fait qu’un point attribué par une visite à 10h12 le mercredi ne vaut plus, le lendemain à la même heure, qu’un demi-point, et, le vendredi à 10h12, un quart de point... ; le tout est calculé de manière à ce que, dans l’hypothèse où l’article reçoit toujours le même nombre x de visites par unité de temps, son score se stabilise sur cette valeur x. Autrement dit, si la fréquentation de l’article est stationnaire, sa popularité finira par refléter exactement son nombre de visites par jour (modulo le score 2 donné pour les entrées directes) ; cette popularité s’exprime de deux manières : l’une, la popularité_absolue, exprime le score en question (évaluation de la fréquentation quotidienne de l’article) ; l’autre, la popularité_relative, un pourcentage relatif à l’article du site ayant la plus forte popularité (popularité_max) ; enfin, la somme de toutes ces valeurs (absolues) sur le site donne la popularité_site, qui permet de comparer la fréquentation de deux sites sous spip...

Boucles et balises Des balises permettent de récupérer et d’afficher ces valeurs dans vos squelettes.

La balise la plus utile est #POPULARITE puisqu’elle donne un pourcentage représentant la popularité de l’article relativement à l’article le plus populaire du site. Cela permet ainsi de réaliser facilement des classements compréhensibles par tous (avec des valeurs allant de 0 à 100). Les autres balises donnent des valeurs absolues, plus difficiles à interpréter par les visiteurs du site.

Note : bien que les données soient représentées, dans la base de spip, sous forme de nombres réels, le rendu de toutes ces balises est toujours donné sous la forme d’un nombre entier, ce qui donnera, sur des sites très peu fréquentés (sites de tests, notamment), des choses amusantes du genre :

« Cet article a une popularité absolue égale à 1, soit 17 % de 2. Au total, ce site fait environ 5 visites par jour. »

Enfin, un critère de tri peut se révéler utile : par popularite, que l’on utilisera par exemple de la manière suivante pour afficher la liste des 10 articles les plus populaires de la rubrique courante :

Limite de la méthode

Lorsqu’un article particulier à un score très grand, il éclipse les autres qui ont une popularité proche de 0. Alors qu’ils sont aussi très consultés.

Sur ce site, nous n’affichons donc que les popularités, à partir de 20 %. Décision arbitraire du webmaster.

 [1]

Version à imprimer Enregistrer au format PDF

Le moteur de recherche.

dimanche 8 août 2004, par David Malle Visites  25135

Principe

Il y a deux grandes façons de faire un moteur de recherche. La première est de chercher tout bêtement dans le type de stockage existant (fichiers HTML, base de données... selon le type de site). Cette méthode est très lente car le type de stockage n’est pas prévu à cet effet.

La seconde méthode, qui a été choisie pour SPIP (et qui est aussi celle de tous les moteurs professionnels), est d’établir un mode de stockage spécifique aux besoins de la recherche. Par exemple, le score de chaque mots d’un article peut être stocké directement afin d’être facilement retrouvé, et d’avoir le score total d’une recherche par une simple addition. L’avantage est que la recherche est très rapide : presque aussi rapide que n’importe quel calcul de page. L’inconvénient est qu’il faut une phase de construction du dit stockage des informations : cela s’appelle l’indexation. L’indexation a un coût en termes de ressources (temps de calcul et espace disque), et elle introduit également un léger décalage temporel entre l’ajout ou la modification d’un contenu, et la répercussion de cet ajout ou de cette modification sur les résultats de recherche.

D’autre part, dans le cas de SPIP, nous sommes obligés d’utiliser PHP et MySQL comme pour le reste du logiciel, ce qui ne permet pas de réaliser un moteur très performant, en termes de rapidité, mais aussi de pertinence ou d’enrichissements divers (indexation de documents extérieurs au site, création de champs sémantiques permettant de proposer des recherches plus fines, etc.).

L’avantage du moteur interne, cependant, c’est qu’il permet de gérer l’affichage des résultats à travers les mêmes méthodes (squelettes) que le reste des pages de SPIP, et à l’intérieur du même environnement visuel.

L’indexation

L’indexation est réalisée lors des visites du site public. Afin d’éviter que le cumul d’une indexation et d’un calcul de page ne mène à un timeout sur les serveurs particulièrement lents, SPIP attend qu’une page soit affichée en utilisant le cache [1].

L’indexation traite une à une les différentes données textuelles d’un contenu donné : par exemple, pour un article, le chapo, le descriptif, le titre, le texte... Pour chaque donnée textuelle, le score de chaque mot est calculé en comptant simplement le nombre d’occurrences. A cet effet, les mots de trois caractères ou moins sont ignorés (ils sont, pour la plupart, non significatifs, et alourdiraient la base de données) ; d’autre part, les caractères accentués sont translittérés (convertis en leurs équivalents non-accentués), pour éviter les problèmes de jeux de caractères et aussi pour permettre d’effectuer des recherches en version non accentuée.

Ensuite, les scores de chaque mot sont cumulés, de façon pondérée, entre les différentes données textuelles du contenu indexé. La pondération permet, par exemple, de donner plus de poids aux mots présents dans le titre d’un article que dans le corps du texte ou le post-scriptum...

Les fonctions d’indexation peuvent être étudiées au sein du fichier ecrire/inc_index.php3. Pour mieux visualiser la dynamique d’indexation du site, vous pouvez ouvrir le fichier ecrire/data/spip.log, ou encore regarder la page ecrire/admin_index.php3 (nota : cette page, encore expérimentale, n’est pas livrée avec toutes les versions de SPIP, et n’existe qu’en français).

Dans la version [SPIP 1.6], d’importantes modifications ont été apportées au comportement du moteur : meilleur comportement dans un environnement multilingue ; le tiret bas (underscore) n’est plus considéré comme un séparateur de mot, mais comme un caractère alphabétique (utile pour de la documentation informatique) ; les mots de deux lettres (et plus) ne contenant que des majuscules et des chiffres sont considérés comme des sigles, et sont indexés, ce qui supprime l’un des principaux inconvénients de la limitation de l’indexation aux mots de plus de 3 lettres (G8, CNT, ONU sont désormais indexés).

La recherche

La recherche s’effectue simplement en séparant le texte de recherche en ses différents mots ; le même filtre est appliqué que lors de l’indexation : suppression des mots de trois lettres ou moins (sauf sigles), et translittération.

Pour chaque contenu recherché, le score des différents mots est ensuite récupéré puis additionné afin d’obtenir le score total. Enfin, les résultats sont en général affichés par ordre décroissant de score (par pointsinverse), c’est-à-dire de pertinence (mais cela est laissé à la volonté de la personne qui écrit les squelettes de mise en page).

Performances

Rapidité

Sur un serveur récent et pas trop chargé, l’indexation d’un texte long (plusieurs dizaines de milliers de caractères) prendra entre une et deux secondes : l’attente est presque imperceptible, comparée aux délais de chargement via le réseau. Les contenus courts sont indexés de façon quasi-instantanée. Bien sûr, ces affirmations doivent être modulées selon la taille du site. Un site vraiment très gros risque de voir les temps d’indexation s’allonger légèrement ; pour relativiser, signalons qu’un site comme Le Courrier des Balkans comporte, à la date d’écriture de ce texte, environ 3 800 articles publiés, et plus de 7500 messages de forum, et que le moteur de recherche de SPIP ne donne aucun signe de faiblesse.

Par ailleurs, statistiquement, on peut considérer de façon approximative que chaque contenu ne sera indexé qu’une seule fois : compte tenu qu’il y a en général beaucoup plus de visites sur un site que de mises à jour de contenus, le surcroît de charge du serveur apparaît négligeable.

Qualité

La qualité de l’indexation est plus faible que sous des moteurs de recherche professionnels. PHP étant un langage plutôt lent, la phase d’extraction des mots a dû être simplifiée au maximum pour que les temps d’indexation restent minimes. Par conséquent, les données d’indexation comportent quelques « déchets », c’est-à-dire des morceaux de texte qui ne correspondent pas à de « vrais » mots, mais ont été indexés comme tels (il s’agit souvent de contenus techniques comme des noms de fichiers, ou de passages à la ponctuation malmenée). L’exemple d’uZine, où l’on constate environ 2 % de tels « déchets », nous laisse cependant penser que ces données sont quantité négligeable, d’autant qu’il y a peu de chance qu’elles déclenchent un résultat positif lors d’une recherche.

La recherche n’offre pas d’opérateurs booléens, l’opérateur implicite étant grosso modo un « OU » logique. Cependant, depuis SPIP 1.7.1, les articles trouvés s’affichent dans un ordre qui privilégie les résultats contenant le plus de mots orthographiés précisément selon la requête. Ainsi, une requête sur « la main rouge » mettra en évidence les articles contenant « main » et « rouge », loin devant les articles ne contenant que « maintenance » ou « rouget » - ceux-ci apparaîtront, mais plus loin dans le classement.

Espace disque

MySQL n’étant pas spécialement conçu pour le stockage de données d’indexation, l’utilisation du moteur de recherche a tendance à faire beaucoup grossir l’espace disque utilisé par la base de données. Pour donner quelque précision, disons qu’un contenu génère des données d’indexation de taille comprise entre la taille du contenu et le double de celle-ci. Donc, si l’on fait abstraction des données ne donnant pas lieu à indexation (les forums par exemple), l’indexation fait entre doubler et tripler la place prise par la base de données. Cela peut être gênant si la place vous est très comptée.

Si jamais vous désactivez le moteur de recherche afin d’économiser de l’espace disque, n’oubliez pas ensuite d’effacer les données d’indexation (dans la page de sauvegarde/restauration de la base de données) afin de réellement libérer l’espace disque occupé par ces données.  [1]

Version à imprimer Enregistrer au format PDF

Statistiques globales du site.

jeudi 23 septembre 2004, par David Malle Visites  24803

Sur chacune des pages du site figure un résumé des statistiques globales sur la vie du site.


Les indicateurs affichés.

- Le nombre de visites sur le site, depuis la mise en ligne du site dans sa première version. Il cumul les visites du jour au moment de l’affichage de la page.
- Le nombre d’articles en ligne dans la base de données de Xdocs.
- Le nombre de sites référencés par Xdocs.

 [1]