Exploration de sites web

L'exploration de sites web vous permet d'extraire le contenu de n'importe quel site public. KnowStack parcourt toutes les pages du domaine que vous indiquez et enregistre le contenu textuel pour l'utiliser dans la génération de la Base de connaissances.

Comment explorer un site web

  1. Accédez à Collecte de données et sélectionnez l'onglet Sites web.
  2. Dans le champ « Explorer un site web », saisissez un nom de domaine (ex. : example.com) ou une URL complète (ex. : https://example.com/docs).
  3. Cliquez sur « Lancer l'exploration ». Le système commence à extraire le contenu de toutes les pages qu'il trouve sur ce domaine.
  4. Un message d'état s'affiche pour indiquer la progression. L'exploration s'exécute en arrière-plan -- vous pouvez quitter la page et revenir plus tard.
  5. Une fois terminé, le site exploré apparaît dans la liste « Sites explorés » sous le formulaire.

Consulter le contenu exploré

Une fois l'exploration terminée, cliquez sur n'importe quel site web dans la liste des sites explorés pour afficher ses pages individuelles. Chaque page indique l'URL, le contenu textuel extrait et le statut de l'exploration. Vous pouvez consulter le contenu d'une page, supprimer les pages que vous ne souhaitez pas inclure, ou relancer l'exploration du site pour récupérer les nouveaux contenus.

Gestion des explorations

  • Ré-explorer -- Cliquez sur un site exploré pour lancer un nouvel travail d'exploration, qui récupérera toutes les pages modifiées depuis la dernière exploration
  • Supprimer des pages individuelles -- Retirez des pages spécifiques des résultats d'exploration si elles contiennent du contenu non pertinent
  • Supprimer toutes les explorations -- Utilisez le bouton « Tout supprimer » pour retirer tous les sites explorés en une seule fois
  • Consulter l'historique des travaux d'exploration -- Chaque site affiche ses travaux d'exploration avec leur statut (terminé, échoué, en cours) et le nombre de pages trouvées

Le nombre de pages que vous pouvez explorer dépend de votre abonnement. Les abonnements Professionnels permettent d'explorer jusqu'à 100 pages par exploration. Les abonnements Business et Entreprise bénéficient d'une exploration illimitée.

KnowStack ne peut explorer que les pages accessibles publiquement. Les pages protégées par une connexion, un accès payant, ou nécessitant un rendu JavaScript peuvent ne pas être extraites correctement. Si une exploration retourne moins de pages que prévu, il est possible que le site bloque les robots d'exploration.