Animint

  Anime & manga

 
 
“Animint traite des dessins animés japonais et du manga. Outre ce blog, le site comporte plusieurs milliers de pages de texte illustré.”

Un retour d'expérience sur l'implémentation de Google Custom Search

Par le :: Webmastering

Il est difficile d'envisager de mettre en place un site web, sans moteur de recherche local, surtout lorsqu'il comprend un nombre important de pages. Si vous installez une plateforme standard de blog, du genre Wordpress ou Dotclear, le module de recherche est fourni avec et votre priorité n'est certainement pas de le modifier.

Si vous êtes limités et avez pris un site web avec des pages HTML statiques – si l'option existe encore -, vous pouvez vous diriger vers des outils tiers, du genre Google Custom Search, qui se propose d'émuler un moteur de recherche local.

Si vous avez le bagage technique suffisant, vous pouvez aussi être partagés entre utiliser le Google version locale ou votre propre moteur de recherche maison.

Dans le cas d'Animint, j'avais toujours privilégié l'option programme installé sur le serveur, jusqu'à présent.

Quels sont les avantages d'un tel programme?

Tout d'abord une personnalisation poussée, non seulement dans la présentation mais dans le traitement des données et les fonctionnalités. Le moteur de recherche maison travaille directement avec la base de données derrière et il est très facile de rendre certaines informations plus importantes que d'autres, indépendamment de leur apparence sur le web.

Par exemple, j'ai la possibilité d'isoler un par un, les sites inscrits dans l'annuaire de liens, alors qu'ils sont regroupés ensemble dans la même catégorie sur le web. De même, toutes les pages indexées sont couplées avec des mots clefs, ce qui permet une navigation par facettes.

Dans ce cas, pourquoi abandonner le système local, ou du moins, privilégier une solution externe?

Tout d'abord, la machinerie à mettre derrière l'ensemble local est lourde à maintenir. Certes, les progrès apportés à l'indexation full text des données dans la base permettent d'accroitre les performances et de diminuer le travail ingrat de codage et d'organisation des données. Mieux, des modules existent même au niveau de la base pour prendre en compte les fautes de frappes et proposer des synonymes. C'est du moins le cas pour des produits tel que PostgreSQL.

En revanche, cela se complique au fur et à mesure que les fonctions progressent et il faut pouvoir jongler entre les dictionnaires et les lexèmes, avec bien sûr un traitement du français, plus compliqué que celui, plus simple, de l'anglais. Bref, à chaque fois qu'il faut replonger tous les 36 du mois dans la logique, le code et les modèles de données, le temps d'acclimatation est toujours long. Sans oublier les évolutions majeures qui rendent vos tables ou vos fonctions incompatibles d'une version à l'autre.

Ensuite, il faut gérer l'indexation des pages, pour préparer le terrain et éviter les problèmes de performance au moment de recevoir les requêtes de recherche. Là aussi, il faut sortir sa panoplie de code pour gérer les différents cas, suivant que vous voulez taper directement dans la base ou bien que vous indexez directement les pages web.

L'option de passer à Google Custom Search permet de s'affranchir d'une partie des contraintes techniques et de la veille technologique à propos des recherches, ou de la maintenance d'un logiciel à installer sur le serveur. La liaison avec l'outil Google est aisée, même en voulant conserver le look et la navigation de son site.

Il existe des API avancées pour chambouler toute la mise à page et là, le traitement demande un peu plus d'étapes et de compétences, mais si la présentation générale vous convient, vous pouvez vous contenter de savoir bidouiller votre code HTML et les appels Javascript.

Je retiendrai cependant 2 contraintes, si vous passez par Google Custom Search:

- A moins d'opter pour la version payante qui vous confère plus de liberté, ou de soutenir mordicus que vous êtes une association à but non lucratif et autres,  Google vous impose d'afficher des encarts publicitaires dans les résultats de recherche.

- Ensuite, pour que cela fonctionne, il faut que Google ait pu indexer vos pages. L'instrument est juste la recherche Google restreinte à votre site, avec un peu d'habillage autour pour laisser penser au visiteur qu'il est toujours chez vous.

Pour Animint, je n'ai pas eu de problème, à part quelques surprises concernant l'ordre où apparaissent certaines pages dans les résultats de recherche.

Visiblement, le moteur passe partout, où je l'autorise et où je lui ai suggéré d'aller via les sitemaps. Google offre une panoplie d'applications en ligne, dont le suivi de la bonne indexation de votre site dans les Outils pour webmasters. N'hésitez pas à y recourir pour détecter les éventuels problèmes. Evidemment, si votre site n'est pas du tout compatible pour être indexé par un robot, vous pouvez faire une croix sur la méthode. Je pensais plutôt aux tous jeunes sites qui n'ont pas encore été analysés par les robots du moteur de recherche.

Comment faire en pratique?

En gros, vous avez 2 étapes, la première consistant à ouvrir votre moteur de recherche chez Google et la  seconde, à adapter votre site pour utiliser le moteur.

Je passe les détails de la première étape mais voici les grandes lignes

- ouvrez un compte Google, si ce n'est pas déjà fait en ayant déjà une boite Gmail par exemple

- activez votre compte Google Custom Search

- créer un premier moteur en le paramétrant pour ne retenir que les urls de votre site

- choisissez votre format dans Element graphiques: L'hébergement direct chez Google vous offre moins de liberté et le choix Search Element qui fait plus web 2.0 à l'affichage, présente encore quelques problèmes d'implémentation. J'ai opté pour l'iframe, pas standard pour du XHTML mais plus simple à mettre en pratique.

Je reviendrai sur plusieurs options et quelques fonctionnalités à exploiter mais abordons déjà la personnalisation des pages du site.

Le but est d'avoir une boite de recherche disponible sur toutes les pages du site et d'avoir une page des résultats.

Dans l'interface Google, un lien vous donne les codes à insérer, l'un justement pour la boite de recherche et l'autre pour l'affichage des résultats.

Commençons à l'envers, en composant d'abord la page des résultats. La page peut être complètement statique – une page HTML -  avec un minimum d'enrobage à votre sauce pour faire l'en-tête et le pied de page. Au milieu vous copiez coller le code pour générer le résultat. Il s'agit d'un calque pour indiquez où vous mettez les affaires, et d'un lien javascript qui appellera ce qu'il faut chez Google pour composer l'iframe et tout le toutim.

Pour Animint, il s'agit de cette page moteur de recherche, placée sur le site en .fr.

Le seul besoin d'avoir une page dynamique est pour récupérer la requête de la recherche, sinon le visiteur serait obligé de la retaper. Le comportement de base m'étonne vraiment et j'y ai pallié sans regarder de trop près, mais j'ai du rater quelque chose. 

Le code de la boite de recherche est à recopier sur toutes les pages où vous voulez la faire apparaitre. Techniquement, l'appel javascript est facultatif. Ce qu'il faut surtout est d'avoir le bon nom de champs pour la recherche et recopier la valeur des champs cachés. La valeur action du formulaire doit pointer vers votre page des résultats.

En clair, si vous avez déjà un formulaire de recherche et que vous en avez bavé pour faire votre design, vous pouvez le récupérer en modifiant un minimum d'éléments.

A partir de là, vous avez quelque de chose de fonctionnelle, en supposant que votre site est correctement indexé par Google.

Autre point: Faute de pouvoir éliminer la publicité, vous pouvez au moins choisir où elle apparait. Par défaut, elle se place en haut avec des liens promotionnels sur la droite. En réglant l'option dans l'interface Google, vous pouvez générez un nouveau code à coller dans votre page des résultats, pour placer les encarts en haut et en bas. Cela aère un peu plus l'ensemble et donne à votre page un aspect moins homme sandwich ambulant.

Pour en finir avec le thème de la publicité, vous pouvez aussi lier votre moteur de recherche Google avec votre compte Adsense, histoire de profiter financièrement des clics, comme si les encarts publicitaires étaient directement sur votre site. La liaison se fait automatiquement via l'interface Google en fournissant quelques données sur le compte Adsense. Le système envoie un mail de validation vers votre email Adsense et vous validez pour donner en gros l'autorisation à Google d'aller chez lui-même. Concrètement, il faut quelques heures pour que la liaison soit effective. Ensuite, il faut aussi savoir jongler avec Adsense pour optimiser les revenus mais cela, c'est une autre histoire.

Revenons aux fonctionnalités proprement dites de Google Custom Search.

Le moteur vous propose son algorithme de base et vous retrouvez les réponses classiques, avec parfois des propositions de correction pour votre requête, lorsque vous tapez un mot de travers. Sa force est aussi de proposer une recherche multi sites, si jamais vous gérez plusieurs serveurs. Pour Animint, j'en ai profité pour intégrer des fiches provenant de Kelmanga.com, par exemple. 

Sinon, j'ai retenu 2 autres options intéressantes

- Les résultats mis en avant

La fonction consiste à proposer une page en particulier, pour réponse à telle ou telle requête en particulier. Par exemple, lorsque le visiteur demande "DVD", le premier vrai lien proposé dans un cadre, est notre liste mensuelle des DVDs. Vous avez ainsi la main sur l'ordre des résultats pour les requêtes pré-enregistrées.

- Les suggestions

Là, l'option porte mal son nom, tout au moins dans l'usage que j'en fais. Ce sont en fait les étiquettes forum, encyclopédie, actualités et guides, qui sonnent plus comme des catégories que des suggestions. Outre le www.animint.com, j'ai déclaré en tant que sites, les sous-sites www.animint.com/guide/, www.animint.com/encyclopedie, www.animint.com/outils/forum/, etc. j'ai lié chacun avec une étiquette, dont la liste apparait ensuite en haut dans la page de recherche.

En cliquant dessus, vous obtenez les pages liées aux sites, avec des subtilités suivant les catégories. Pour le forum, le filtre est strict alors que pour actualités, des sous-sites sont privilégiés par rapport à d'autres mais toutes les pages sont sélectionnées. Seul l'ordre d'affichage est impacté.   

D'autres méthodes permettent d'aller plus loin dans l'affinage des recherches mais mon but n'est pas de passer à une usine à gaz à une autre, donc je me suis arrêté là pour l'instant. Je verrai à l'usage s'il y a encore des réglages indispensables à effectuer.


Moteur de recherche personnalisé

Discuter de ce billet sur le forum - - Laisser un commentaire »

Cet article vous a plu?

Faites-le connaître ou votez pour cet article sur les sites suivants :

  • anime manga aggregator sama
  • Partager sur del.li.cious
  • Partager sur Facebook
  • Partager sur Google

Commentaires sur ce billet:

  1. Le 19/05/2011 à 23:39
    Eric a dit

    De mon côté, j'ai un sacré problème avec Google Custom Search... Celui-ci n'indexe que ma page d'accueil et cela fait 15 jours que cela dure (alors que 300 pages sont indexées par Google et que cela fonctionne sur d'autres sites).
    A n'y rien comprendre, cela fait un peu bof un moteur qui n'indexe qu'une page ;)

Ajoutez votre commentaire:

Merci de bien vouloir soigner votre orthographe et de proscrire le style SMS.


Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

 

↑ Haut de page