Rétrograder les informations obsolètes dans les moteurs de recherche -

Comment rétrograder les informations obsolètes dans les moteurs de recherche ?

Par Vonintsoa R. Publié le 3 août 2021 | 2 minutes de lecture

Dans les moteurs de recherche, toutes les informations peuvent devenir obsolètes. Cependant, certaines d’entre elles continuent d’apparaître dans les premiers classements des résultats de recherche, car elles abordent des sujets autrefois « officiels ».

Généralement les algorithmes de recherche identifient des solutions à long terme pour classer un contenu en fonction de son importance. Le fait de prioriser ces informations les maintient dans le classement au fil du temps. Mais privilégier certaines vérités à travers le temps empêche parfois les nouvelles informations plus à jour d’avoir la visibilité nécessaire.

Un nouveau classement des preuves en fonction du temps

Dans un article, des chercheurs italiens, belges et danois expliquent comment ils ont utilisé diverses techniques de machine learning pour classer les preuves en fonction du temps.

Les chercheurs proposent de combiner cette technologie avec les systèmes existants ou pour les futurs algorithmes de recherche. Au-delà des approches qui utilisent la similarité sémantique, elle modélise la dynamique temporelle des preuves pour la vérification des faits basée sur le contenu.

Selon eux, le système devrait contribuer à la vérification automatique des faits. De cette manière, les moteurs de recherche pourront rétrograder les informations obsolètes priorisées par défaut.

Définir les informations sont obsolètes sur les moteurs de recherche

Au cours de l’étude, les chercheurs ont appliqué quatre méthodes de classement temporel à trois méthodes de vérification des faits. Ce sont les modèles Bidirectionnel Long Short Term Memory (Bi LSTM) ainsi qu’un autre modèle similaire avec des CNN à la place des LSTM et un transformateur DistilBERT. Chaque méthode de vérification classe les preuves d’une manière différente, en se basant sur l’horodatage des preuves.

Cependant, l’horodatage le plus pertinent n’est pas forcément celui qui figure dans les métadonnées. Autrement dit, le système doit extraire les données directement à partir du texte étant donné qu’un article peut faire référence à un événement antérieur. C’est donc grâce à ce processus que les moteurs de recherches pourront déclasser efficacement les informations obsolètes.

L’étude a démontré que le classement en fonction du temps permet d’obtenir des résultats plus perspicaces et plus importants. Par ailleurs, la véracité des faits et des affirmations sensibles au temps est plus plausible.