Le Buzz de Y! Mobactus ; comment ça marche ? (les points ou scores des tags et actualités)
Le système de Buzz des actualités (nuage de tags) a été désactivé ces derniers jours sur le site pour mobile (et le plugin Firefox) de Y! MobActus par la nécessité de complètement le refaire pour réduire la charge de travail et améliorer le temps de réponse. C’est l’occasion de faire le point sur son fonctionnement…
En effet, en 3 ans (déjà ), l’algorithme a énormément évolué pour atteindre le niveau de pertinence le plus fidèle possible, et sans équivalent sur le Web de l’info francophone (en toute modestie).
Vous pouvez continuer de voir l’algorithme à l’action depuis le Labo :
(merci de ne pas trop le solliciter)
- Labo de Y! MobActus, Buzz de l’actualité (nuage de tags)
- Labo de Y! MobActus, les titres d’actualité du jour (sélection des dépêches pertinentes)
La refonte de l’été dernier a rationalisé la manière d’attribuer un score à un tag d’actualité ; les points d’un tag correspondent à la fréquence de répétition des mots (ou groupes de mots) parmi toutes actualités récupérées par Y! MobActus depuis une vingtaine de sources différentes populaires et fiables (agences de presse et quotidiens nationaux).
A noter qu’il est nécessaire (mais pas suffisant), que un tag obtient au moins 3 points pour devenir un tag-pertinent, puis le tag-prioritaire, d’une actualité. Et que le nuage de tags contient uniquement des tags qui ont été le tag-prioritaire de au moins une actualité.
Vous remarquerez que certains tags ont un deuxième score de points (indiqué en exposant du premier). Cela est consécutif à la capacité de Y! MobActus de créer des tags de plusieurs mots. Du coup, les mots qui sont à la fois choisi comme tag et qui sont aussi présents dans un tag de plusieurs mots ont deux scores (de points). Le deuxième score (en exposant), que j’appelle score-partagé, correspond au score que aurait eu ce mot si on compte ses répétitions dans les tag de plusieurs mots, tandis que le score (principal), appelé score-absolu, ignore les citations de ce mot dans d’autres tags.
Enfin, les tags ont un score-relatif (en pourcentage). Celui-ci est calculé en comparant le score de points du tag avec celui du tag qui a le meilleur score. Le score-relatif permet d’adapter la couleur et la taille du tag dans le nuage.
Les actualités ont elles aussi des scores. Le premier, qui n’est jamais affiché dans le Labo, est un score de points calculé en faisant la somme des scores de points des tags-pertinents de l’actualité. Ensuite, le score-relatif (en pourcentage) de l’actualité est calculée en comparant son score par rapport à celui de l’actualité qui a le meilleur score.
Pour finir, c’est les scores-relatifs des tags-prioritaires et ceux des actualités qui déterminent la manière de sélectionner les meilleures dépêches des “titres d’actualité du jour” du Labo.
Je vous expliquerais à une autre occasion comment les tags sont extraits, filtrés, puis sélectionnés. D’ailleurs, la plupart des méthodes indiquées dans mes anciens articles sont encore utilisées ;o)
2 commentaires à “Le Buzz de Y! Mobactus ; comment ça marche ? (les points ou scores des tags et actualités)”
Laisser un commentaire
Vous devez être connecté pour laisser un commentaire.
Le Samedi 27 juin 2009 à 15:45
Hors propos mais penses-tu pouvoir faire un jour une version pour iphone voir un application dédiée ? Mob Actus est plutot réactif dans son ensemble bon travail :)
Le Samedi 27 juin 2009 à 17:52
J’ai pas d’iphone à disposition pour faire ça bien ^^
Mais j’pense que le principal et gros problème sur iphone doit être la difficulté de tapotter avec son doigt sur les petits liens du site actuel, non ?
Sinon, la refonte consiste à externaliser les calculs indépendamment du format de sortie ; actuellement, le site refait ses calculs pour chaques sorties (site mobile, plugin Firefox, et labo) ce qui rend compliqué les updates de l’algo :o(