lundi 10 mars 2008

Tendances et données sur Internet


Imaginez disposer de statistiques sur les milliards de recherches et clics réalisés par des milliers d'internautes.
Imaginez-vous posséder les statistiques et données en temps réel de milliers de sites web.
Vous ne les aurez peut être jamais, mais les employés des moteurs de recherche peuvent tous les jours accéder à ces millions de données, les filtrer et les comparer. Malgré tout, plusieurs outils sont mis gratuitement à notre disposition et voici un scénario que vous pourrez reproduire.

Afin de ne pas lister brutalement les services présentés, je prends deux exemples concrets en comparant les mots "Sarkozy et Bruni", puis deux marques d'automobiles françaises "Peugeot et Renault".

Combat de mots sur Internet :
Le premier essai porte sur un combat entre mots. Lequel des deux est le plus présent sur Internet ?
Pour réaliser cet exercice j'aurais pu faire une cherche sur chaque mot et regarder la valeur "sur un total", en haut à droite de la page de résultats. Mais le jeu s'avère plus ludique en utilisant la page web Google Fight et voici les résultats pour nos deux groupes de mots Google Fight
Nombre de recherches sur Google :
Maintenant, je désire comparer combien de fois des mots ont été cherchés sur le moteur de recherche Google ces dernières années. J'utilise pour cela Google Trend. En séparant deux mots ou expressions par une virgule, je peux visionner le nombre de recherches réalisées dans le monde entier. Regardez les résultats affichés pour les matchs :

Vous aurez remarqué dans la page Google Trend, la disponibilité d'options pour afficher les résultats sur une plage de temps à votre goût comme le pays ou la région depuis lesquels les demandes furent envoyées.
Sur la page d'accueil les mots les plus recherchés hier sont mis à jour régulièrement.

Les résultats affichés sur les mots choisis sont intéressants, mais il manque l'affichage d'un fait flagrant. J'ai essayé de réaliser pour cela, les recherches suivantes :
  • "vacances et cadeau" pour afficher l'effet cyclique des recherches. En effet ces mots sont souvent utilisés respectivement avant l'été et noël,
  • "Jérôme Kerviel" : le pic est bien visible.

Étendre la recherche :
Oublions un peu le tintamarre politico-médiatique et concentrons-nous sur nos fabricants de vroumvroum.
J'aimerais connaître les termes les plus souvent rencontrés sur le web en relation avec ces deux mots. Pour ceci je vais utiliser Google Sets qui va me retourner les mots les plus proches de nos constructeurs. Le résultat ici est assez ahurissant.


Représentation des données :
Les moteurs de recherche disposent d'un volume considérable de données et l'achat en 2007 par Google de la solution logiciel Trendalyzer éditée par la fondation Gapminder devrait donner le jour à des analyses intéressantes. Prenez le temps de regarder la démonstration ici en cliquant sur le bouton PLAY, puis changez les données représentées en cliquant sur le flèches présentes sur les axes et rejouez la démonstration.
Si vous avez un peu de temps alors regardez la brillante présentation de cet outil à TED (20 mn), donnée par Hans Rosling, un des fondateurs de gapminder.

Sources :
Google Fight : combat de mots,
Google Trend : Courbes des recherches sur le moteur de Google,
Google Sets : Mots en relation,
Fondation Gapminder : Organisation à but non lucratif visant à promouvoir l'usage et la compréhension des statistiques dans les domaines sociaux, économiques et environnementaux,
TED : Debunking third-world myths with the best stats you've ever seen.

Aucun commentaire :