Сканування сайтів
Сканування вебсайтів дозволяє витягувати вміст із будь-якого публічного сайту. KnowStack обходить усі сторінки вказаного вами домену та зберігає текстовий вміст для подальшого використання під час генерації Бази знань.
Як просканувати вебсайт
- Перейдіть до розділу «Збір даних» і виберіть вкладку «Вебсайти».
- У полі «Сканувати вебсайт» введіть доменне ім'я (наприклад, example.com) або повну URL-адресу (наприклад, https://example.com/docs).
- Натисніть «Почати сканування». Система розпочне витягування вмісту з усіх сторінок, які знайде на цьому домені.
- З'явиться повідомлення про статус із відображенням прогресу. Сканування виконується у фоновому режимі — ви можете залишити сторінку та повернутися пізніше.
- Після завершення просканований вебсайт з'явиться у списку «Просканованих вебсайтів» нижче форми.
Перегляд просканованого вмісту
Після завершення сканування натисніть на будь-який веб-сайт у списку проскановних сайтів, щоб переглянути його окремі сторінки. Для кожної сторінки відображається URL, витягнутий текстовий вміст і статус сканування. Ви можете переглядати вміст сторінок, видаляти окремі сторінки, які не потрібно включати, або повторно сканувати сайт для отримання нового вмісту.
Керування скануванням
- Повторне сканування -- Перейдіть до проскановного сайту, щоб запустити нове завдання сканування, яке підхопить усі сторінки, що змінилися з моменту останнього сканування
- Видалення окремих сторінок -- Видаліть конкретні сторінки з результатів сканування, якщо вони містять нерелевантний вміст
- Видалення всіх результатів -- Використовуйте кнопку «Видалити все», щоб одночасно видалити всі проскановані сайти
- Перегляд історії завдань сканування -- Для кожного сайту відображаються завдання сканування зі статусом (завершено, помилка, виконується) та кількістю знайдених сторінок
Кількість сторінок, які можна сканувати, залежить від вашого тарифного плану. Плани Professional дозволяють сканувати до 100 сторінок за один раз. Плани Business та Enterprise мають необмежене сканування.
KnowStack може сканувати лише загальнодоступні сторінки. Сторінки, захищені авторизацією, платним доступом або які потребують рендерингу JavaScript, можуть не витягуватися коректно. Якщо сканування знаходить менше сторінок, ніж очікувалося, можливо, сайт блокує сканери.