moteur_recherchePour ceux qui n'y connaissent rien en outils de recherche, voici le billet fait pour vous. Il n'existe pas que Google!!! Les jurys de STD s'en sont encore plaint cette année au Campanile de Poitiers, lors du petit-déjeuner (j'ai des espions partout!). Google est très efficace, c'est le moteur de recherche qui a l'index le plus gros, mais la masse ne garantit pas la pertinence. Et puis, un monopole n'est jamais bon pour la liberté d'expression (97 % des requêtes mondiales à peu près). Le site Abondance en présente quelques uns d'intéressants à connaître, il vous apprend à faire la différence entre un moteur, un métamoteur et un annuaire, même s'il existe des nouveaux outils plus sympas qui ne sont pas présentés.  Je vais donc vous présenter quelques outils de recherche utiles à connaitre en plus (et à utiliser!).

Tout d'abord, voici Zefab, une interface très complète de tout ce qui existe en matière de recherche. Cela aurait pu paraitre compliqué, mais son graphisme en fait un outil agréable à utiliser.
Il offre une foule de possibilités de recherche : moteurs, métamoteurs, annuaires, moteurs graphiques, recherche en langage naturel, recherche assistée par opérateur, recherche multimédia, recherche dans les news, forums, blogs, recherche sur le web invisible, moteurs pour enfants... Sur un demi-écran avec menus déroulants, Zefab devrait vite s'imposer pour des recherches pointues. Et, notamment, dans les centres de documentation, car il permet d'initier les élèves à tout le vocabulaire documentaire d'une façon ludique. En prime : technique, outils, méthodes (en bas à gauche : comment bien chercher?) et astuces pour trouver. 
Les tutoriels de Zefab sont à compléter avec ceux de Sapristi, Cerise et l'Urfist de Paris plus globalement pour des outils plus complexes (RSS, podcasts...).

Moteurs de recherche

Je vous présente d'abord mon chouchou : Mozbot ou l'art d'utiliser Google sans le dire. C'est un moteur de recherche créé en 2003 par trois français qui utilise l'index de Google (c'est à dire qu'il donne les mêmes résultats). Ses principales caractéristiques sont qu'il permet une recherche sur le web francophone par défaut, qu'il permet de vérifier l'origine et la source de la page web dans la page des résultats ("Infos" en grisé sous le descriptif de la page) ; il est personnalisable (changement de couleur de l'interface, mise en favoris ou exclusion) et a de nombreuses options (envoi par mail, pages similaires, mots connexes). En plus il est ludique, puisqu'il propose régulièrement des énigmes à résoudre et le Top 100 des requêtes les plus originales.

Le moteur préféré des documentalistes : Exalead. Qualifié de moteur 2.0, doté d'un index de 8 milliards de pages, c'est un moteur complet qui apporte vraiment une plus-value par rapport à Google. C'est un moteur francophone (donc plus adapté aux recherches en français, contrairement à Google). La page de résultats se divise en deux parties : une liste de résultats avec le titre, le résumé et  l'image de la page web en miniature ; des outils connexes pour affiner la recherche (ils appellent ça zappette de navigation) avec des propositions tels que les termes associés (comme dans un thesaurus), des annuaires correspondant à la recherche, des types de fichiers (multimedias, pdf, ppt, word), la provenance en pourcentage des sites recensés... L'interface est personnalisable après la création d'un compte, avec possibilité d'ajouter des raccourcis sur la page d'accueil.

Les métamoteurs

Le métamoteur Eo dont les couleurs apaisantes font de ce moteur un outil agréable à utiliser. Un métamoteur cherche sur plusieurs moteurs de recherche, ce qui lui confère plus d'efficacité. Eo a l'avantage d'être en français et propose donc une recherche francophone par défaut. Il intègre les index de Google, Alltheweb, Lycos, Teoma, ce qui offre une base de recherche très conséquente. A noter la recherche avancée (pas très visible) qui vous permet de faire une recherche par extension de fichiers.

Le métamoteur Kartoo qui présente ses résultats sous forme de carte heuristique. Les sites trouvés sont représentés par des pages plus ou moins grosses en fonction de leur pertinence. Entre ces sites figurent des thèmes qu'il suffit de cliquer pour préciser votre recherche. Des mots-clefs sont proposés pour affiner la recherche, si la première a échoué. Personnellement, je n'aime pas cet outil, je trouve la présentation déroutante et pas très concluante ; de plus, leur moteur est spamdexé par des sites pornographiques très régulièrement, donc je ne l'utilise pas. Cependant, les cartes heuristiques sont très à la mode et il est donc essentiel de le connaître, d'autant plus que c'est une initiative intéressante. 

Un dernier pour la route : Ixquick, "le métachercheur le plus puissant du monde" comme ils disent. Il existe un système de notation de la pertinence : si un site obtient 5 étoiles, cela veut dire qu'il est proposé par au moins 5 moteurs de recherche différents. On peut exclure des sites de certaines recherches, afin de n'afficher que les nouvelles pages lors d'une recherche ultérieure. Possibilité de rechercher sur des annuaires téléphoniques, des images ou même le plus bas prix. Il intègre les index de Google, Mirago, Excite, Alltheweb, Altavista, Yahoo, MSN... Un outil complet !

Un annuaire

Juste comme ça, en passant, je vous signale l'annuaire Yahoo. L'avantage de l'annuaire par rapport à un moteur, c'est qu'il offre une démarche de recherche soit par thématique, soit par moteur dans une sélection de sites faite par des documentalistes (ce qui implique que la source est fiable en général et que l'information est validée a priori par des professionnels). L'inconvénient de tout travail de sélection par des humains est le manque de réactivité de l'actualisation et la faible quantité de sites recensés, par rapport à un moteur (même si l'offre est conséquente).

Je ne vous en dis pas plus sur les moteurs généralistes, d'autres le font mieux que moi.

Outils de recherche spécifiques :

Le moteur de recherche des acteurs territoriaux :Territoo. C'est un moteur de recherche francophone spécialisé destiné aux fonctionnaires territoriaux et aux élus locaux. Cela veut dire que les sites recensés sont proposés par Google, mais triés et sélectionnés en amont par des humains (et oui, il y en a encore!). L'avantage est qu'il ne propose que des ressources gratuites et fiables, garantissant ainsi la fiabilité de l'information (un peu comme dans les annuaires type yahoo).

Le moteur de recherche des sciences humaines et sociales : In-extenso. Ce moteur de recherche a été créé par l'équipe de revues.org après 4 ans d'indexation, dans un souci de s'approcher du web sémantique et de renforcer la visibilité des travaux en ce domaine. "L’étage « OAI » (pour Open archives initiative) donne accès à une vingtaine de dépôts de documents scientifiques (au rang desquels on compte Gallica, Hal-SHS, Cyberthèses, Persée, Revues.org...), soit 135 000 documents environ. L’étage « web » indexe le contenu de 2 000 sites web dédiés aux sciences humaines et sociales (Universités, laboratoires, sites thématiques, expositions, publications diverses...), ce qui constitue un corpus d’une taille inédite : plus de quatre millions de pages web. [...] L’étage « web » indexe le contenu des 2 000 sites sélectionnés par L’Album des sciences sociales, le répertoire critique de ressources électroniques en sciences humaines et sociales, réalisé dans le cadre de Revues.org par une équipe de chercheurs et de documentalistes" [source @brest].

Cat-search propose de rechercher dans trois domaines différents : soit dans les arbstracts d'articles francophones et anglophones, dans les articles scientifiques présents sur le web et dans le cadre d'une sélection de 5000 sites académiques français. Les recherches sont extensibles à tout le réseau, dans l'index Google. Très bien pour trouver des articles sur la pédagogie, l'éducation (autorité par exemple). Utile pour préparer des dossiers thématiques.

A ne pas confondre avec World-cat qui est un moteur de recherche dans le cadre d'un réseau de bibliothèques à travers le monde, qui mettent leurs catalogues de ressources en ligne. Il y a beaucoup de ressources en anglais, mais on peut limiter la recherche à la France seule, dans la page des résultats.

L'Hyperthèque est en quelque sorte un annuaire spécialisé, issu du réseau documentaire de l'Institut des sciences de l'homme. Il consiste en un catalogue de sites classés par thèmes, favorisant ainsi l'interdisciplinarité et le partage des ressources. Essentiel à connaître pour trouver des articles ou des infos sur le système éducatif, l'informatique documentaire, internet, les outils de recherche, l'information-documentation, les bases de données...

Il existe 3 projets européens de moteurs de recherche, qui pour l'instant n'ont pas vu le jour : Quaero, Theseus, Pharos. Seront-ils un jour terminés? Seul l'avenir nous le dira.