Vincent Lagrandmaison

Vincent Lagrandmaison

Sarlat

,

France

www.lagrandmaison.fr
“Life is not yesterday, not tomorrow, Life is now. Only...”
Contacter

Les moteurs de recherche

Je vous parlais dans un article du site Gahooyoogle (update: projet abandonné) qui fonctionne avec les deux moteurs de recherche Google et Yahoo mais j’ai remarqué que beaucoup de sites proposant des recherches sur plusieurs moteurs de recherches (métamoteurs) existent et que souvent ils ne sont pas très connus.

Je vous propose une liste non exhaustive de sites de recherches:

Moteurs de recherche internationaux

(trouvés sur le très bon site lesmoteursderecherche.com)

Yahoo!
Le roi des moteurs de recherche.

AltaVista
Un des plus importants.

Ask Jeeves
Vous le questionnez, il répond

FAST - AllTheWeb
Technologie et rapidité nordiques.

Espotting
Le nouveau Pay-Per-Click Européen.

Excite
Un grand network de sites.

GO Network
Les recherches selon Walt Disney.

Google
Résultats générés avec les mathématiques.

HotBot
Coloré mais très versatile.

Inktomi
La technologie de recherche la plus utilisée.

LookSmart
Un annuaire de qualité.

Lycos
Un pionnier des recherches sur Internet.

MSN Search
Le moteur de Microsoft.

Northern Light
Spécialisé dans les informations.

Open Directory
Les volontaires du Web.

Overture anciennement GoTo
Il faut payer pour être bien placé sur leurs référencements.

D’autres moteurs de recherche, intéressants et efficaces:

(trouvés sur l’excellent site http://c.asselin.free.fr)
[FR=en Français, EN=en Anglais...]

- Vivissimo[EN]: l’un des meilleurs services de recherche. Voici une petite présentation de cet outil que l’on peut considérer comme un analyseur de réponses: en se connectant sur le site Vivissimo.com vous réalisez des requêtes en choisissant l’un des moteurs connus : Yahoo!, AltaVista, MSN, Lycos, Google et autres. Vivissimo va alors vous donner en réponses une organisation des résultats trouvés sous forme de dossier présentés dans une frame sur la droite.
L’intérêt porte sur plusieurs aspects :
Qualitatifs : Vivissimo ré-organise les réponses dans des dossiers visuels, d’une façon thématique. Cette méthodologie de présentation est déjà présente depuis longtemps sur Northernlight.
Quantitatifs : vous pouvez voir apparaitre des sites classés normalement en 20, 100 ème position. Il n’est plus question ici de classement par simple pertinence mais par organisation des réponses en fonction des réponses.

- Ujiko[FR,EN,US,DE]
Lancé au printemps 2004 par l’équipe de KartOO. Le moteur utilise l’index de Yahoo! Search (plus de 4 milliards de pages indexées). Ujiko permet de personnaliser et de mémoriser ses recherches sur le Web. Lorsque vous cliquez sur un des résultats d’une recherche, la page est conservée en mémoire et sera placée instantanément en tête des résultats la prochaine fois que vous lancerez la recherche. Vous pouvez choisir quel site doit apparaitre en 1er à l’aide de la note de cœur, ou au contraire filtrer un site qui ne vous plait pas. Tous les sites que vous trouvez peuvent être annotées, supprimés, classées dans des dossiers. Toutes les données mémorisées sont enregistrées sur votre ordinateur (dossier Windows). Interface en Flash assez originale.

- Exalead[FR,EN]
Une initiative française en matière de moteur de recherche.
Exalead a été fondée par des anciens chercheur X-Mines. En 1997-1998, le PDG, François Bourdoncle avait développé pour Altavista, une application de visualisation des mots clés associés aux termes d’une requête.
La nouvelle version de e-moteur (octobre 2004) propose de nombreuses fonctionnalités originales :
- Pour chaque page de résultats, l’affichage des termes ou expressions associés aux mots clés de la requête.
- L’affichage de catégories en relations avec la requête (issues de l’annuaire de l’Open Directory)
- L’indication de la localisation du site. On peut ensuite affiner ses résultats selon le pays d’origine.
- L’affinage par type de documents (word ,excel, pdf,…)
- La visualisation des pages Web via des vignettes.
- Ajouter un raccourci : on peut mémoriser les pages de son choix
- Recherche avancée : permet de préciser sa recherche par langue, pays, type de fichier, sites Web ou domaine, date de modification et de trier les résultats par pertinence ou par date.
L’option Type de recherche offre la possibilité de recherche les mots exacts, la racine des mots, par phonétique ou orthographe approchée.
L’index, en constante progression, affichait plus de 1 milliard de pages en janvier 2005 puis 3 milliards en janvier 2006.
La technologie repose notamment sur l’analyse statistique : analyse des documents trouvés à l’issue d’une requête pour y déceler les mots les plus fréquents ou “groupes nominaux significatifs”. Ces groupes s’affichent sur la colonne de gauche sous la rubrique “mots clés”. Un clic sur une catégorie permet d’affiner la recherche. Ainsi une requête sur “fret aérien” proposera “agent de fret”, “zone de fret”, “compagnie aérienne”, air cargo” mais aussi “fret maritime”.
Ce moteur est la vitrine technologique de la société qui offre des technologies de recherche aux entreprises. Ainsi, la technologie Exalead équipe, depuis avril 2002, le moteur de recherche d’Aol France et Netscape France.

- Voila[FR]
Le moteur d’origine française le plus utilisé. Indexe plus de 120 millions de pages en français. Propose également un annuaire thématique (le Guide Voila) comme la plupart de ses concurrents. Avec le temps, les résultats sont de plus en plus pertinents. Un bon complément à la base “française” de Google, Voila.fr est idéal pour les recherches “grand public”. La version “expurgée” de toutes rubriques thématiques, bref une page style Google, version test de futures fonctionnalités du portail Voila est Voilà pour les Geeks (informaticiens fous). Voila est développé par la société Echo, filiale de Wanadoo.

- Dir.com[FR]
En janvier 2003, Iliad a lancé officiellement ce nouveau moteur en langue française. Dir.com, créé par Fabien Menemenlis et Philippe Develter, indexe près de 100 millions de pages francophones (à titre de comparaison, la base française d’Altavista comprend 30 millions de pages, celle de Voila, 120 millions).
Dir.com indexe les pages statiques (formats html, PDF, PS, Word, Powerpoint, Flash, Excel) ou dynamiques. Le robot du moteur qui visite les pages est Pompos.
La société Iliad est un acteur majeur du multimédia et de l’internet francophone : fondé en 1987, le groupe Iliad a développé de nombreux service Minitel et web comme les sites annu.com, societe.com et les fournisseurs et hébergeurs free.fr, online.net…

- DeepIndex[FR]
Moteur francophone lancé en juin 2002. DeepIndex se veut être le spécialiste de l’indexation de l’internet européen. Il propose ainsi, outre la version française, des interfaces canadiennes, allemande, suisse, espagnole, britannique, belge, italienne et néerlandaise. Par ailleurs, DeepIndex offre des recherches sur les communes françaises classées par régions et départements. Exemple : Aquitaine > Gironde > St-Emilion : vous obtenez des liens spécifiques à cette commune (commerce, hôtels…)

Les métamoteurs:
(> Déf. : Un métamoteur est un outil interrogeant plusieurs moteurs simultanément. . Il retourne les résultats de chacun d’eux. Les meilleurs métamoteurs trient ces résultats et les catégorisent. Ils ne possèdent pas leur propre index. Ang: Meta-search engine”)

- ez2Find[MULTILINGUE]
Ce métamoteur recherche simultanément sur AlltheWeb, Teoma, Google, Yahoo!, AltaVista, ODP, Nomade, Voila et MSN (pour l’interface française). Tous les moteurs et annuaires majeurs donc. La page de résultats propose un regroupement des sites par catégorisation (clustered). En outre, ez2 permet de limiter les recherches à un domaine (MP3, forums, actualité, images, téléchargement, santé, droit, sport, voyages, encyclopédies…). Il est également possible de choisir la langue de recherche via un simple menu déroulant. ez2 est désormais un portail d’information disponible pour la plupart des grand pays d’Europe, d’Asie et des Amériques (avec pour chacun des moteurs locaux). ez2Find fait partie des rares métamoteurs à proposer une interface claire, lisible et agréable.

- Ixquick[MULTILINGUE]
Un métamoteur rapide, pertinent, à la présentation claire. Interroge des moteurs différents selon la version choisie (moteur anglais et américains, français, espagnols, portugais, espagnols, suédois, italiens, néerlandais, turcs, etc…!). Recherche également des images et MP3. Dans sa version “française”, il interroge notamment l’Open Directory , All the Web, LookSmart, La Toile du Québec, Lycos.fr et aussi Ask Jeeves, Espotting et FindWhat. Et un avantage en plus pour ma part: selon leur site “Ixquick protège votre Vie Privée ! Le seul moteur de recherches qui efface vos informations personnelles.” A tester.

- Surfwax[EN]
Surfwax est un métamoteur très innovant proposant de nombreuses possibilités de personnalisation et de paramétrage.
L’originalité de Surfwax réside dans un instantané de l’information qu’il présente avec la fonction “SiteSnaps”.
Lors d’une requête, la liste de vos résultats apparaît dans la fenêtre de gauche. Cliquer sur un lien vous amène sur le site désiré. Un clic sur la loupe affiche un “instantané de la page”, le “SiteSnaps” dans la fenêtre de droite : Une fonction d’analyse de contenu permet de voir un résumé de la page (réalisé par l’auteur dans les meta tags), le contexte comprenant votre requête, les points clés (les phrases les plus pertinentes par rapport à la requête), les focus word (mots les plus importants de la page) et les frame links (les principaux liens présents sur la page). Cliquer sur ces focus word enrichira et précisera votre requête. Bref apparait en clair tout ce qui est normalement caché dans la boite noire d’un moteur.
Également intéressante, la fonction Focus, en haut de la fenêtre gauche, qui propose des thèmes voisins, englobant ou synonymes des termes de votre requête.
Après un login (enregistrement), vous pourrez accéder à encore davantage d’options et paramétrage (temps de recherche, sélection de “Searchsources” pour explorer le Web invisible (base de données)… Au-delà des métamoteurs plus classiques, Surfwax est un véritable outil de recherche en profondeur qui permet d’un peu appréhender des fonctions disponibles sur des applications locales payantes.
Surfax effectue une interrogation sur CNN, Yahoo!, l’ODP, AlltheWeb, NBCi, About, YahooNews, Wisenut, MSN, Encarta, SearchEdu, Lycos, SearchHippo, Excite, Hotbot…

- Clusty (de Vivisimo)[EN]
Considéré actuellement comme l’un des meilleurs métamoteurs en terme de pertinence et de présentation des résultats. Il peut interroger simultanément 9 moteurs (dont Gigablast, MSN, Looksmart, AskJeeves…) mais également des sites de news (YahooNews, NY Times, Wired, CNN…). La forme des résultats est entièrement paramétrable. L’orginalité de Clusty est de proposer un clustering c’est-à -dire une autocatégorisation des résultats : Ceux-ci sont automatiquement classés par catégories permettant de visualiser les différents domaines contextuels abordés par la requête. La page de résultats se divise donc en 2 parties : les urls dans la fenêtre principale et, à gauche, des dossiers présentant les différents sujets abordés par la requête. La navigation se voit donc très simplifiée et pratique. Ce regroupement des résultats par thèmes (”clusterisation”) est utilisée par quelques moteurs : initiée par NorthernLight puis repris par les nouveaux moteurs comme Teoma ou Wisenut. Par contre, pour un métamoteur, c’est plus rare et la catégorisation proposée par la société Vivisimo est particulièrement claire.

- Polymeta[EN]
Polymeta est un métamoteur qui recherche simultanément sur les moteurs majeurs à savoir : Google, Yahoo! Search, MSN Search, AskJeeves,Gigablast plus Teoma (propriété d’AskJeeves). Outre le Web, il propose une recherche sur les actualités (via Google News, Yahoo!News, MSN News, NYTimes, USNews et Topix ) et les images (Google, Yahoo!, MSN). En outre, Polymeta permet de rechercher parmi des bases de données en ligne et moteurs “poids lourds” dédiés à la médecine, à la santé, aux essais cliniques ou plus largement aux sciences : PubMed, MEDLINEPlus, National Institutes of Health (NIH), ClinicalTrials.gov, Scirus, Yahoo! Health, HealthMaps, HealthFinder,…
Les fonctionnalités de Polymeta :
- affichage du nombre de résultats par moteurs pendant le processus de recherche (puis en haut de la page de résultats en cliquant sur “Show hits”)
- tri des résultats : alphabétique, par pertinence, par sources
- catégorisation (clustering ) des résultats (tri possible par pertinence ou ordre alphabétique) pour le Web, les news et les moteurs “santé”.
- affichage des résultats “Images” à droite de l’écran (possibilité de les dissimuler)
- intégration d’un fond bleu clair pour les résultats “uniques” c’est-à -dire rapatriés par un seul moteur
- possibilité de lancer une nouvelle requête au sein des premiers résultats
- affinage via les catégories du clustering.

Moteurs permettant de cartographier l’information:

- KartOO[FR,EN]
Métamoteur de recherche cartographique. Lancé en avril 2001 par une société française de Clermont-Ferrand, KartOO est un métamoteur qui recherche sur le Web mondial ou français. Il présente les résultats sous forme d’une carte reliant entre eux les concepts voisins de votre thématique de recherche. L’affichage s’effectue au choix en Flash ou html (selon la puissance de votre machine et la qualité de votre connexion). Le graphisme de la carte est paramétrable (formes, couleurs, liens). Les résultats sont pertinents, le choix de représentation graphique assez clair. Kartoo recherche simultanément sur les moteurs “majeurs”: Google, Voila, AlltheWeb, AltaVista, Exalead, MSN, Nomade, Open Directory, Lycos, Yahoo!, Hotbot, Looksmart, Teoma et Wisenut et sur les moteurs locaux propres à chaque pays…En décembre 2001, une version américaine de Kartoo est disponible. En 2002, l’internationalisation se poursuit avec des versions brésilienne, portugaise, espagnole, anglaise puis allemande en 2003. Fin 2003, KartOO s’est orienté vers la personnalisation et la veille avec des fonctions de personnalisation des résultats, de mémorisation et d’alerte. Un bel outil. KartOO est également l’éditeur des moteurs Ujiko (2004) et TooLeNet (juin 2006).

- Mapstan[FR]
Métamoteur de recherche et représentation cartographique lancé en décembre 2001 par la société du même nom, devenue Social Computing. Mapstan est un nouvel outil de recherche cartographique qui propose une représentation du Web sous forme de plan de ville (quartiers, bâtiments, routes…) et une fonctionnalité de capitalisation des connaissances.
La représentation visuelle, choisie par les concepteurs, qui cartographie les résultats de Google, propose une ville avec des places (cercles de couleur) plus ou moins grandes selon le trafic des sites. Les places regroupent un ou plusieurs sites proches. Après l’entrée d’un mot clé apparaitra une carte d’une région du web comprenant différentes couleurs selon la proximité ou non des sites avec votre requête.
De plus, sur MapStan Search, toutes les recherches et leurs résultats sont archivés afin d’être réutilisés. Chaque résultat de votre recherche est ainsi enrichit avec les pages les plus pertinentes des recherches similaires. Des infobulles informent du contenu des places et des sites.
La technologie utilisée par Mapstan a été appelée le WPS (”Web Positioning System”) et fait appel à des algorithmes de filtrage collaboratif, d’analyse de corrélation et de cartographie d’informations.
Si Mapstan Search peut représenter les résultats d’une requête sur le web, l’internaute peut également réaliser une carte graphique de l’historique de votre navigateur (disponible après téléchargement d’une barre d’outil ou Toolbar qui s’intègre à votre navigateur sur http://www.mapstan.net), vous donnant une lecture visuelle plus ludique et plus précise que la liste traditionnelle des sites visités présentés en vrac sous Netscape ou Internet Explorer.


Le “tout en un”:

- manhack.net:[FR]
“Cette interface réunit plus de 500 fonctionnalités de quelques 300 moteurs et bases de données que vous pouvez interroger à partir d’un seul et même formulaire, en quelques clics.”

Le plus “fun” pour la fin:

- Boolgum:[FR]
Un moteur de recherche pratique, ludique et qui propose automatiquement des informations additionnelles à la recherche initiale : comparateur de prix, liste de synonymes, recherches connexes, affichage de la définition d’un mot par double click, dérivés sémantiques (mot de la même racine), les codes postaux, villes de France et plan de ville

(Sources: www.outilsfroids.net, c.asselin.free.fr, www.lesmoteursderecherche.com, www.abondance.com, www.secrets2moteurs.com)