-
Des recherches complexes
Comme les “crawlers” ou robots d’indexation, le robot IREM collecte des informations sur Internet…
Mais, plus “intelligent”, il s’adapte aux contraintes “Métier” des sites Internet et effectue des recherches complexes. A titre d’exemple, il est capable de suivre des liens résultant de l’éxécution d’instructions Javascript. Ce qui n’est pas les cas des “crawlers”, qui se limitent au recensement des liens hypertextes et à la visite des pages obtenues.
Pour ses recherches et les changements des pages, IREM Infos possède plusieurs modules : la vérification de contenu, la détection de pop-up, la sauvegarde de l’historique de navigation, la gestion du chargement des contenus asynchrones conformes aux dernières technologies Web 2.0 (Ajax), etc…
-
Interactivité
Dans le cadre d’un remplissage de formulaires de données, notre “Web robot” interagit sur le site en question. En fonction des données qu’il saisit lui-même, il ne visite pas les mêmes pages et n’effectue pas les mêmes traitements sur le site.
De son côté, le “crawler” ne franchit aucun formulaire, d’autant plus que certains sites mettent en place une navigation qui bloque toute indexation ou référencement.
-
Directement en HTML
Comme les “crawlers” et les robogiciels, IREM interagit avec les serveurs informatiques…
Mais il fait abstraction de toutes les couches d’échange des différents protocoles qui encadrent les données (http, TCP et IP). Basé sur un browser web, le robot travaille directement sur les pages HTML et se concentre ainsi sur la recherche interactive d’informations pour ses clients.