La puissance de la langue et de notre invention linguistique
Je viens, pour en finir avec la préparation de l'édition américaine de mon livre sur Google, de vérifier toutes les citations, travail un peu fastidieux qui m'a cependant permis de faire quelques découvertes. Pour retrouver rapidement les citations, j'en prenais les premiers mots qui étaient souvent un peu banal. Pour ne citer qu'un exemple, une citation de Bill Gates commençait par "well, I have a meeting with our people doing search". Genre de phrase que n'importe qui aurait pu prononcer. Or, non seulement Google retrouva tout de suite la citation (mais cela nous le savons), mais j'ai été surpris de deux choses :
- l'absence de bruit : toutes les références données par Google étaient pertinentes et renvoyaient au texte de Gates. On aurait pu imaginer que d'autres auraient prononcé cette même phrase. Et bien, ce n'est pas le cas ;
- la très faible redoncance : cette phrase n'a apparemment été reprise que 8 fois sur le net, ce qui est peu.
Ce n'est pas une exception, je l'ai vérifié sur plusieurs phrases aussi insignifiantes. Ce qui montre la puissance de notre langue et nos capacités à l'utiliser, car des phrases comparables ayant le même sens, on doit en trouver des milliers sur le net. Peut-être est-ce qui explique la faiblesse des outils de traduction.
Cela devrait, par ailleurs, permettre de rapidement retrouver et identifier les plagiaires les plus maladroits. Je crois me souvenir que Page et Brin avaient, à leurs débuts, imaginé un outil qui permettait de comparer des textes et de rechercher ceux qui avaient copié des textes sans citer leur auteur. Il est évidemment plus difficile de retrouver les plagiaires un peu plus atucieux qui réécrivent le passage qu'ils empruntent.
La trés faible redondance est également à noter. Elle va un peu à l'encontre de ce que l'on dit en général et est plutôt une bonne nouvelle pour tous les moteurs de recherche.














J'avais lu un article sur un outil permettant aux professeurs de vérifier automatiquement d'où venait les travaux parfois vite copié sur le Web de leurs étudiants :). Mais je ne me rappelle plus de son nom.
Google plagiat outil te donnera une série de références...
Attributor cela doit être redoutable :)
Poster un nouveau commentaire