Typologies des métamoteurs
Différents types de métamoteurs
*** Qu'est-ce qu'un métamoteur ?
- Outils parfois appelés méta-outils, méta-pages, métachercheurs, moteurs de métarecherche...
- Un métamoteur est un outil de recherche qui interroge en parallèle plusieurs moteurs et annuaires de recherche, rapatrie leurs réponses et les organise, selon des méthodes de classement spécifiques, pour fournir aux utilisateurs une présentation structurée des résultats.
Nés en même temps que les moteurs de recherche, en 1995, ils étaient fondés sur le postulat de l'insuffisance des outils utilisés individuellement : aucun outil, moteur ou annuaire, ne pouvant couvrir les ressources du web, les métamoteurs permettaient alors de mieux couvrir les ressources du web.
Le principe des métamoteurs a été parfois contesté, car ils utilisent les résultats d’autres outils : ils n’ont pas de base de données en propre, mais utilisent celles des moteurs et des autres outils.
*** Fonctionnement :
Ce sont des outils intermédiaires, qui traduisent les questions des utilisateurs dans la syntaxe propre à chaque outil.
La majorité des métamoteurs permet aujourd'hui de poser une seule requête, qui est envoyée (éventuellement adaptée) aux différents outils et sources utilisés. Le métamoteur présente ensuite une liste de résultats, souvent synthétisée (c.a.d. après élimination des doublons) et classée selon différents critères, propres à chaque métamoteur.
*** Composants d'un métamoteur :
On peut distinguer les éléments suivants dans un métamoteur :
Utilisation, avantages, limites
*** Utilisation pratique :
*** Avantages des métamoteurs :
=> les métamoteurs sont intéressants pour le défrichage d'un sujet, pour obtenir un panorama des principales ressources, notamment des sites de référence sur un thème.
L'exploitation sophistiquée des résultats :
- nombreuses fonctionnalités avancées pour le traitement et l'exploitation des résultats : par exemple les "réseaux sémantiques" sur Kartoo, la"clustérisation" (i.e. catégorisation automatique des résultats) sur Vivisimo, quelques fonctions d'analyse de contenu sur SurfWax, ou bien les nombreuses possibilités des métamoteurs "hors ligne".
*** Inconvénients, limites :
Il existe une certaine diversité des métamoteurs et de grandes différences dans leurs performances, notamment dans la pertinence et dans la présentation des résultats.
Les typologies des métamoteurs ont évolué et se sont enrichies, selon les différentes innovations techniques. De nouveaux critères sont apparus (comme la présentation cartographique).
Cette première typologie est aujourd'hui en partie dépassée (il n'existe presque plus d'aides à la saisie).
On peut recenser actuellement les critères suivants, pour répartir les métamoteurs (certains critères étant évidemment combinables) :
TABLEAU RECAPITULATIF DES TYPOLOGIES
ET EXEMPLES DE METAMOTEURS
| Types de métamoteurs | Types de métamoteurs | Types de métamoteurs |
Aides à la saisie > ancienne catégorie de métamoteurs aujourd'hui pratiquement disparue | Listes de résultats > ancienne catégorie de métamoteurs aujourd'hui pratiquement disparue | Listes synthétisées
| |
en ligne | hors ligne |
| |
|
| ||
Métamoteurs avec catégories, analyses de contenu | |||
|
| ||
|
Aides à la saisie, listes de résultats, listes synthétisées
Les métamoteurs cartographiques
La clustérisation, l'analyse de contenu
Première typologie "historique" : selon les fonctionnalités et le classement des résultats.
Trois types de métamoteurs : selon un degré croissant de richesse de fonctions
2/ Les listes de résultats :
Appelés aussi Interfaces de recherche unifiée, ou SUSI (Simultaneous Unified Search Interface). Ils interrogent simultanément plusieurs outils mais donnent les résultats outil par outil, sans faire la fusion. Cette catégorie de métamoteurs est également en voie de disparition ; voir l'exemple de MetaSearch.
3/ Les listes synthétisées :
Ils représentent aujourd'hui l'écrasante majorité des métamoteurs.
Les aides à la saisie Les listes de résultats Les listes synthétisées Principes communs
- interface de saisie unique, donnant accès à plusieurs types d’outils (moteurs, annuaires…)
- classification des outils par catégorie
- choix de l'outil de recherche par l’utilisateur
Fonction-
nement
- plusieurs requêtes successives sur les différents outils choisis
- plusieurs syntaxes de recherche
- envoi d'une seule requête à plusieurs moteurs et annuaires
- une seule syntaxe pour formuler la requête
- sélection des résultats les plus pertinents de chaque outil
- envoi d'une seule requête à plusieurs moteurs et annuaires
- une seule syntaxe pour formuler la requête
- sélection des résultats les plus pertinents de chaque outil
- analyse des résultats
- classement des résultats
Avantages
- réduction du temps de recherche
- augmentation des possibilités de recherche
(par rapport à l'utilisation d'un seul outil)
- simultanéité des recherches
- gain de temps important
- élimination des doublons
- présentation d’une liste unifiée de résultats
- classement des résultats par ordre de pertinence ou par thème
- vérification de la validité des liens fournis
- possibilités de paramétrage
Contraintes
- utiliser la syntaxe d’origine de l’outil choisi
- recherches successives
- syntaxe de recherche réduite
- présentation des résultats classés par moteurs
- pas d'élimination des doublons
- syntaxe de recherche
réduite
Exemples
Critères importants de différenciation des métamoteurs :
- nombre et type d'outils de recherche utilisés
- domaines d'exploration (web, forums...)
- choix des moteurs
- utilisation des opérateurs booléens et des critères de recherche
- critères de classement des résultats : par moteurs, par catégories, par pertinence...
- limitation du nombre de réponses par moteur
- indication du moteur ayant fourni la réponse
- élimination des doublons
- paramétrage de l'affichage des résultats
Les métamoteurs hors ligne
Typologie la plus importante actuellement : selon l'implantation du métamoteur
=> voir la partie : Métamoteurs hors ligne
Ces types de métamoteurs sont apparus en 2000-2001, présentant les résultats sous forme graphique ou cartographique : réseaux, plans... Ces outils s'inspirent des outils de cartographie de l'information : Leximappe, Sampler, Umap..., qui existent depuis déjà longtemps, hors du contexte d'internet.
Représentation de l'information sous forme de réseaux, de cartes sémantiques, dans lesquels les sites web sont représentés par des noeuds, des places (MapStan) ou des sphères (Kartoo), et les relations entre les sites par des liens (ou des rues, sur MapStan), censés exprimer la proximité, la similarité des sites ou des thèmes.
Il existe encore assez peu de métamoteurs cartographiques :
- en France : deux outils innovants : Kartoo et MapStan
- aux Etats-Unis : Miner3D, WebBrain, Map.Net
Fonctionnalités complémentaires
Lancé en avril 2001, Kartoo est développé par une jeune société française, basée à Clermont-Ferrand.
Depuis novembre 2003, Kartoo en est à sa version 4.
Il permet d'interroger 15 moteurs et annuaires.A sa naissance, Kartoo a renouvelé le monde des métamoteurs par plusieurs innovations :
- possibilité d’utilisation de champs de recherche : premier métamoteur à proposer cet enrichissement
- présentation cartographique des résultats
- utilisation des liens sémantiques, permettant d’affiner les recherches
Interface graphique très originale ; nombreuses possibilités de recherche :
Nombreux critères pour préciser sa requête : titre de la page, adresse du site, pages d’un seul site, domaine...
L'originalité de Kartoo réside dans la présentation et l'exploitation des résultats :Autres caractéristiques :
- présentation dynamique, grâce à la technologie Flash
- résultats présentés sous forme de carte thématique :
- sites représentés par des sphères
- sites considérés comme les plus pertinents sont mis en évidence
- sites reliés entre eux par des liens sémantiques (thèmes)
- affichage d’une liste de mot-clés liés à la requête
- pour chaque site, affichage instantané, avec la souris : de l’URL, des moteurs utilisés et d’un résumé
- plusieurs possibilités d'affinement de la requête :
- par suggestions de mots-clés et d'expressions, trouvés dans les descriptions des sites
- par utilisation des requêtes les plus fréquentes
- par suggestions provenant du métamoteur lui-même
En octobre 2001, sortie de MapStan Search, nouveau métamoteur de recherche cartographique et de capitalisation des connaissances.
- utilisation implicite du ET (comme Google)
- possibilité d’interrogation en langage naturel , mais résultats décevants
- fonctionnalités de mémorisation et de personnalisation des requêtes : le Kapitalyser, qui permet de sauvegarder les dernières requêtes, les mots-clés, les sites visités
- service de veille (sur abonnement) : la fonction Watch, qui offre un service d'alerte sur les nouveaux sites
B/ MapStan Search Technologie originale utilisée, nommée "Web Positioning System" (WPS), qui est l'aboutissement d'un programme de R&D labellisé ANVAR. Dépôt de brevet en décembre 2000.
Technologie du WPS construite autour de trois principes :
- La visualisation de l'information :
le WPS calcule et dessine des plans. Les informations et leurs relations sont présentées de façon synthétique et intuitive.
résultats présentés sous forme de plan de quartier, avec des places (sites sélectionnés) et des rues (liens de similarité entre les sites).lorsque plusieurs sites sont associés dans les mêmes recherches, ils sont regroupés sur une même place
possibilité d'affiner les recherches : la pertinence des sites est indiquée par la couleur de la bordure des places, allant du jaune au rouge, selon leur classement par les outils de recherche.
- les pages les plus pertinentes des recherches similaires sont proposées (en bleu)
- un catalogue dynamique des sites : la fonction "Explorer" permet de dresser le plan des sites qui constituent une place et de les ordonner selon leur similarité
- La personnalisation "orientée utilisateur" : utilisation d’algorithmes d'analyse des usages et des comportements pour déterminer des profils d'utilisateurs :
- barre d'outils personnalisable : MapStan.net
- possibilité d'élaborer des plans personnalisés de navigation, à partir de ses centres d'intérêt
- L'intelligence collective : synthèse des informations et de leurs relations selon une analyse, sans classification préalable, des usages et des comportements des utilisateurs.
- possibilité d'être informé sur les profils des autres utilisateurs de Map Stan
- possibilité de partager l'information, de bénéficier de l'expérience des autres utilisateurs
"Le WPS est à la fois un outil d'accès personnalisé à l'information et un moteur de découverte fondé sur l'analyse des usages et des comportements, qui peut être facilement mis en oeuvre, pour optimiser le système d'information de l'entreprise (Intranet, Portails d'entreprises, bases de connaissances...) et les solutions existantes (moteurs de recherche, Knowledge Management, solutions d'indexation...)."
Point faible : temps d'accès assez long.
Sources :
- Andrieu, O., Actu Moteurs 2001/52, du 24 au 28 décembre 2001,
- L'internaute : http://www.linternaute.com/0redac_actu/0112_decembre/011218mapstan.shtml
- Netsources, n° 35, novembre-décembre 2001
=> A noter : MapStan semble désormais limiter ses requêtes au seul index de Google ; ce qui pose problème pour le considérer toujours comme un véritable métamoteur, utilisant plusieurs outils. Il reste encore outil de "deuxième niveau"
Hormis la cartographie des résultats, deux autres grandes tendances d'innovation des métamoteurs peuvent être distinguées dans la manière de traiter et d'exploiter les résultats :
- la clustérisation, ou catégorisation automatique dans des catégories établies a posteriori, selon les caractéristiques propres des résultats trouvés : voir par exemple Vivisimo, qui a introduit le premier cette technique très intéressante de classement des résultats ; mais aussi 2loq.com, alias Easy to find,ou KillerInfo. La clustérisation permet d'affiner les requêtes, de regrouper des pages web proches, d'éliminer des pistes de recherch non pertinentes, etc. En bref, la catégorisation automatique, très développée également sur le moteur de recherche Exalead, représente l'une des voies les plus prometteuses de la recherche d'information, car elle apporte de la "signification", de la sémantique, dans les masses informes de ressources du web.
- l'analyse de contenu : un métamoteur américain très innovant, SurfWax, propose depuis 2003 de nombreuses et nouvelles fonctions assez originales, de personnalisation, de paramétrage, mais surtout d'exploitation des résultats : il s'agit d'une sorte d'analyse de contenu des résultats, permettant de situer les mots-clés dans leur contexte, de repérer les mots les plus importants d'une phrase, etc. Sans être une technique de classement des résultats (comme la clustérisation), l'analyse de contenu des résultats est une nouvelle forme de traitement, appelée probablement à se développer sur d'autres outils. Elle permet d'enrichir et de préciser les requêtes et constitue une incontestable valeur ajoutée dans le traitement des résultats.
A notre connaissance, SurfWax serait actuellement le seul métamoteur à proposer ce genre de fonctionnalités.
=> sur la clustérisation et l'analyse de contenu, voir la partie Traitement des résultats
Page revue et mise à jour le 18 avril 2005.
Ce support de formation peut être librement exploité, sous réserve de citer son origine.
© URFIST Bretagne-Pays de Loire, Février 2002