L’exercice d’aujourd’hui est de comparer le moteur de recherche de Google avec une moteur de recherche alternatif, d’en comprendre les mécanismes et d’en voir l’incidence sur les résultats générés.
D’un côté nous avons l’omniscient moteur de recherche de Google qui utilise ses propres crawlers pour indexer ses pages internet : il établit par lui-même la pertinence des réponses possibles par rapport à une requête donnée grâce à l’utilisation de nombreux algorithmes en fonction d’une multitude de paramètres comme la popularité du liens, les liens entrants et sortants, etc. Le plus connu est PAGERANK mais il en existe des centaines (voir infographie). Les résultats sont donc hiérarchisés mais il est capable d’en « optimiser » la visibilité, c’est ce qu’on appelle le référencement ou search engine optimization.
Notre comparaison porte sur le moteur de recherche de Wolfram Alpha. Le service, lancé en 2009, se porte comme un outil de calcul en langage naturelle, concrètement c’est un moteur de recherche/computation qui va nous permettre d’apporter une réponse factuelle et synthétique (en anglais) à partir d’une base de connaissances croisée à différentes sources académiques. Le moteur permet, entre autres, d’accéder à plus de 50 000 types d’algorithmes, de couvrir et d’ « analyser les données issues de disciplines très variés, dont les mathématiques, statistiques, analysée de donnée, physique, chimie, science des matériaux, ingénieries [..] linguistique, culture, médias, etc».
Utilisation et pertinence.
Bien qu’il soit possible avec Wolfram Alpha de comparer deux propositions, nous avons choisis de prendre la suggestion aléatoire suivante : mpemba effect. Contrairement à Google, Wolfram Alpha renvoie ne renvoie pas de liens (les sources sont accessibles en bas de page) mais une réponse unifiée à partir d’un croisement de données et de connaissances. Il existe pour la recherche de papiers académiques une variante, Google Scholar. Plus long, le moteur de recherche propose même des hypothèses sur un phénomène physique.
Query “mpenba effect” sur Wolfram Alpha
Query “mbempa effect” sur Google France
Google renvoie comme on peut l’attendre à une myriade de liens correspondant à l’observation de ce phénomène, Wikipédia arrive comme souvent en tête de gondole. Du côté de Wolfram, la réponse s’organise en plusieurs rubriques. On y trouve notre requête, une description assez succinte en premier lieu : “sous certaines conditions, un volume d’eau chaude aura tendance à geler plus vite qu’un volume d’eau froide [..]”.
Un encart « histoire » nous permet de remonter à la première occurrence historique de l’effet à 1963 (51 years ago) par son homonyme Erasto Mpemba. On retrouve aussi une filiation historique avec d’autres hommes: Aristote, Bacon, Descartes.. Le moteur va plus loin encore en proposant des indications. Il nous suggère par exemple dans la rubrique «current evidence» que l’effet peut être influencé par un “nombreux infini de paramètres expérimentales”, il ajoute également que les causes du /mpemba effect/ n’a pas encore été résolu. Plus qu’un moteur de recherches comme Google qui renvoie une liste de pages indexées en fonction des mots-clés, Wolfram Alpha va jusqu’à émettre des hypothèses et un jugement par rapport à une proposition donnée. En comparant de façon assez sommaire avec les informations disponibles sur la page de Wikipédia, la réponse semble avoir un certain degré de vérité. Évidement, ni l’un ni l’autre ne sont la preuve d’une vérité absolue, mais les deux nous offrent néanmoins un aperçu du problème.
Derrière les réponses.
Les sources nous renvoient à une série de sites académiques mais nous révèle aussi l’existence d’une source d’informations principales : la Wolfram|Alpha Knowledgebase, 2014. Après quelques requêtes supplémentaires sur cette base de données, le moteur nous renvoie :
La réponse peut donc sembler à la fois surprenante et un poil arrogante, à savoir comment est constitué cette « base de données de savoirs et connaissances » auto-proclamé car on se retrouve donc avec Wolfram Alpha plus qu’un simple moteur de recherche mais bien une volonté de bases de connaissance quasiment encyclopédique, mais dont les réponses seraient rédigé par des algorithmes.
Le site nous permettra en effet de faire de l’algèbre, des statistiques ou de générer la visualisation d’une requête. Les domaines de connaissances sont en cours d’élaboration depuis le lancement du site et ne cessent de s’enrichir. Wolfram Alpha est utilisé pour améliorer les résultats des moteurs de recherche de Bing ainsi que DuckDuckGo.
Andréa Mancini et Léo Seyers.