Документація
Все, що потрібно для витягування, очищення та експорту веб-таблиць як професіонал. Від базового експорту до розширених процесів очищення даних.
Вступ
HTML Table Exporter — це розширення Chrome, яке виявляє таблиці на веб-сторінках та експортує їх у бажаний формат. На відміну від веб-скраперів, які вимагають складного налаштування, цей інструмент працює миттєво: клік, вибір формату, завантаження.
Вся обробка відбувається локально у вашому браузері. Ваші дані ніколи не покидають пристрій.
Для кого це?
- Аналітики даних, яким потрібно витягувати таблиці з фінансових звітів, урядових сайтів або дослідницьких баз даних
- Дослідники, які збирають структуровані дані з академічних джерел або Вікіпедії
- Розробники, яким потрібен швидкий доступ до табличних даних без створення скрапера
- Будь-хто, хто втомився копіювати таблиці комірка за коміркою
Коли використовувати HTML Table Exporter
HTML Table Exporter призначений для певного набору сценаріїв використання. Розуміння його сильних сторін — і де інші інструменти можуть бути більш доречними — допоможе використовувати його максимально ефективно.
Ідеально підходить для
- Разового експорту таблиць — фінансові звіти, урядові набори даних, дослідницькі бази даних, таблиці Вікіпедії, спортивна статистика
- Даних з веб-застосунків — багато CRM-платформ, аналітичних дашбордів, ERP-систем та корпоративних інструментів відображають дані як HTML-таблиці, які розширення може виявити
- Повторюваного експорту — збережіть правила очищення та налаштування колонок як профіль і використовуйте щоразу при експорті з того ж джерела
- Середовищ, чутливих до конфіденційності — вся обробка локальна, що робить його придатним для корпоративних, фінансових або медичних контекстів, де дані не можуть покидати браузер
- Даних, що потребують очищення — дати, числа, валюти та null-значення автоматично нормалізуються перед експортом
Не призначений для
- Автоматизованого або запланованого скрапінгу — це ручний інтерактивний інструмент. Якщо вам потрібен headless-скрапер або cron-пайплайн, розгляньте Scrapy, Puppeteer або Playwright
- Нетабличних даних — розширення виявляє HTML-елементи
<table>. Картки, списки, фіди та неструктуровані макети не підтримуються - Доступу до даних через API — якщо потрібні дані доступні через API, пряме використання API буде надійнішим, ніж витягування з відрендереної сторінки
- Гарантованої сумісності з усіма сайтами — структури веб-таблиць значно відрізняються. Розширення працює зі стандартними HTML-таблицями та багатьма складними веб-застосунками, але деякі сайти використовують нестандартний рендеринг, який може не повністю підтримуватися
Безкоштовна версія не має обмежень на рядки та працює з більшістю таблиць. Встановіть і протестуйте на вашому сайті перед розглядом PRO.
Встановлення
-
Відвідайте Chrome Web Store
Відкрийте сторінку HTML Table Exporter у браузері Chrome.
-
Натисніть "Додати до Chrome"
Натисніть синю кнопку та підтвердіть у спливаючому вікні. Встановлення займає близько 3 секунд.
-
Закріпіть розширення (необов'язково)
Натисніть на іконку пазла на панелі інструментів Chrome та закріпіть HTML Table Exporter для швидкого доступу.
Розширення запитує "Читати та змінювати всі ваші дані на веб-сайтах". Це необхідно для виявлення таблиць, але пам'ятайте, що вся обробка локальна і ми ніколи не передаємо жодних даних.
Активація ліцензії
Після покупки HTML Table Exporter PRO ви отримаєте ліцензійний ключ на email. Виконайте ці кроки, щоб розблокувати всі функції PRO.
Ваша ліцензія перевіряється під час активації та кешується локально. Періодичний доступ до інтернету потрібен для повторної перевірки статусу ліцензії, забезпечуючи безперервну роботу.
Як активувати PRO
-
Натисніть "Активувати" в розширенні
Відкрийте спливаюче вікно розширення та натисніть кнопку "Активувати" у верхньому правому куті. Ви також побачите функції PRO, перелічені внизу безкоштовної версії.
-
Введіть ліцензійний ключ
Вставте ліцензійний ключ у форматі
XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXXта натисніть "Активувати". Ключ був надісланий на вашу електронну пошту після покупки. -
Почніть використовувати функції PRO
Після активації розширення покаже "HTML Table Exporter PRO" з кнопкою Історія. Всі функції PRO тепер розблоковані.
Візуальний посібник
Натисніть кнопку «Активувати» у верхньому правому куті. Безкоштовна версія показує, які функції ви розблокуєте з PRO.
Вставте ваш ліцензійний ключ та натисніть «Активувати». Якщо у вас ще немає ключа, натисніть «Get HTML Table Exporter PRO».
Вирішення проблем з ліцензією
«Недійсний ліцензійний ключ»
Переконайтеся, що ви скопіювали повний ліцензійний ключ включно з усіма дефісами. Формат має бути XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX. Перевірте, чи немає зайвих пробілів до або після ключа.
Я не отримав ліцензійний ключ
Перевірте папку спаму. Лист надходить від Lemon Squeezy (наш платіжний процесор). Якщо все ще не можете знайти, відвідайте сторінку Підтримки з вашим номером замовлення.
Мені потрібно перенести ліцензію на інший пристрій
Кожен ліцензійний ключ дійсний для одного пристрою. Якщо вам потрібно використовувати PRO на додаткових пристроях, ви можете придбати додаткові ліцензії або розглянути наші плани TEAM або BUSINESS.
Отримайте HTML Table Exporter PRO з гарантією повернення коштів протягом 14 днів. Переглянути варіанти цін →
Швидкий старт
Експортуйте вашу першу таблицю менш ніж за 60 секунд:
Як експортувати таблиці
Інтелектуальний вибір (найшвидший метод)
Цей підхід економить час, дозволяючи безпосередньо вибрати цільові дані. Просто клікніть будь-де в таблиці на веб-сторінці, а потім відкрийте іконку розширення HTML Table Exporter PRO. Розширення автоматично підсвітить і сфокусується на цій конкретній таблиці, дозволяючи миттєво експортувати без пошуку серед інших виявлених результатів.
Гнучкі формати експорту
Кожну виявлену таблицю можна експортувати в різних професійних форматах, натиснувши відповідну кнопку на картці таблиці:
- Excel (XLSX) — Ідеально підходить для глибокого аналізу даних
- CSV — Ідеально для загального використання в електронних таблицях
- JSON або NDJSON — Ідеально підходить для веб-розробки та баз даних NoSQL
- SQL — Генерує готові оператори INSERT для використання в базах даних
Масове завантаження
Для користувачів, які хочуть витягнути всі таблиці одночасно, доступне масове завантаження. Для цього знайдіть випадаюче меню формату ZIP та виберіть бажаний формат (наприклад, CSV або JSON) для файлів у пакеті. Натиснувши «Export all tables (ZIP)», усі таблиці зі сторінки завантажаться разом в організованому пакеті.
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%
Формати експорту
HTML Table Exporter підтримує п'ять форматів виводу, кожен оптимізований для різних випадків використання.
CSV (значення, розділені комами)
Універсальний формат. Працює з Excel, Google Sheets, базами даних та практично будь-яким інструментом для роботи з даними. Користувачі PRO можуть налаштувати роздільник (кома, крапка з комою, табуляція) для регіональної сумісності.
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending
JSON (JavaScript Object Notation)
Ідеально для розробників та API. Кожен рядок перетворюється на об'єкт з заголовками колонок як ключами.
[
{
"Name": "John Doe",
"Email": "[email protected]",
"Status": "Active"
}
]
Excel (XLSX)
Рідний формат Excel з правильними типами комірок. Числа — це числа, дати — це дати.
NDJSON (JSON з роздільником нового рядка)
Ідеально для потокової обробки даних та баз даних NoSQL. Кожен рядок — окремий об'єкт JSON, що робить його ідеальним для великих наборів даних та обробки логів.
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}
SQL (оператори INSERT)
Генерує готові оператори INSERT для прямого імпорту в бази даних. Ідеально для MySQL, PostgreSQL, SQLite та інших SQL-баз.
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
PRO додає формати експорту NDJSON та SQL. Пакетний ZIP включає всі формати одночасно.
Очищення даних
Веб-дані безладні: символи валют, непослідовні формати дат, приховані символи — все це порушує аналіз та імпорт. HTML Table Exporter автоматично очищає ваші дані.
Автоматичне очищення (Безкоштовно)
- Видаляє пробіли з усіх комірок
- Видаляє приховані символи Unicode
- Нормалізує переноси рядків
- Зберігає структуру об'єднаних комірок
Інтелектуальні профілі очищення (PRO)
PRO включає готові профілі очищення для поширених типів даних:
Профіль валюти
Видаляє символи $, €, £ та роздільники тисяч. Конвертує $1,234.56 в 1234.56.
Профіль відсотків
Видаляє символ %. Конвертує 45.5% в 0.455 або 45.5.
Профіль дати
Стандартизує дати до формату ISO. Конвертує Jan 15, 2024 в 2024-01-15.
// Raw data from website
" $1,234.56 ", "Jan 15, 2024", "45.5%"
// After cleaning profiles
1234.56, "2024-01-15", 0.455
Пакетний експорт
Коли сторінка має кілька таблиць (або вам потрібні кілька форматів), пакетний експорт економить години.
Пакетний експорт доступний виключно для користувачів PRO.
Експортувати всі таблиці
Натисніть "Export All" у спливаючому вікні розширення. Кожна таблиця конвертується в окремий файл.
Завантаження ZIP
Отримайте єдиний ZIP з усіма таблицями у вибраному форматі.
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv
Складні таблиці
Реальні таблиці рідко є простими сітками. HTML Table Exporter обробляє складність, яка ламає інші інструменти.
Об'єднані комірки (Rowspan/Colspan)
Коли комірки охоплюють кілька рядків або колонок, експортовані дані заповнюють відповідні комірки для збереження структури.
Вкладені таблиці
Таблиці всередині таблиць поширені на старих веб-сайтах. Підсвічування при наведенні допомагає перевірити перед експортом.
Динамічні/JavaScript таблиці
Багато сучасних веб-застосунків відображають таблиці за допомогою JavaScript-фреймворків. Якщо таблиця видима у вашому браузері, розширення зазвичай може її виявити. Однак результати можуть відрізнятися залежно від того, як сайт структурує свій DOM — деякі застосунки використовують нестандартні елементи, які можуть не розпізнаватися як таблиці.
Деякі сайти завантажують рядки таблиці під час прокручування. Спочатку прокрутіть до кінця, щоб переконатися, що всі дані завантажені.
Scroll Capture (PRO)
Scroll Capture — це функція PRO, призначена для пагінованих та віртуалізованих таблиць, які показують лише підмножину рядків одночасно. Працює, захоплюючи видимі рядки під час прокручування таблиці, накопичуючи та дедуплікуючи їх у повний набір даних.
Як це працює: Ви активуєте Scroll Capture, а потім прокручуєте таблицю у своєму темпі. Розширення читає рядки, які відрендерені в DOM браузера в цей момент — воно не робить додаткових мережевих запитів, не симулює кліки та не взаємодіє з елементами керування пагінацією. Коли ви пройшли потрібні дані, зупиняєте захоплення та експортуєте накопичений набір даних.
Ключові відмінності від інструментів автопагінації: На відміну від браузерних розширень, які автоматично натискають кнопки "Наступна сторінка" або симулюють нескінченне прокручування, Scroll Capture є пасивним читачем. Він спостерігає за тим, що ваш браузер вже відрендерив, не активуючи навігацію сторінками чи серверні запити. Це робить його менш схильним до активації обмежень швидкості чи анти-бот захисту, і він працює з віртуалізованими сітками, які замінюють DOM-вузли під час прокручування.
Scroll Capture працює з багатьма пагінованими та віртуалізованими таблицями, але результати залежать від конкретної реалізації кожного веб-сайту. Не всі формати таблиць підтримуються. Рекомендуємо спочатку протестувати безкоштовну версію для підтвердження базового виявлення таблиць на вашому цільовому сайті.
Порівняння Безкоштовно vs PRO
Безкоштовна версія справді корисна, без штучних обмежень. PRO додає розширені функції для активних користувачів.
| Функція | Безкоштовно | PRO |
|---|---|---|
| Експорт CSV | ✔ | ✔ |
| Експорт JSON | ✔ | ✔ |
| Експорт Excel | ✔ | ✔ |
| Експорт NDJSON | — | ✔ |
| Експорт SQL | — | ✔ |
| Автоматичне виявлення таблиць | ✔ | ✔ |
| Обробка об'єднаних комірок | ✔ | ✔ |
| Завантаження ZIP (всі таблиці) | Лише CSV | Multi-format |
| Пресети профілів (Pandas, DuckDB тощо) | — | ✔ |
| Пресети очищення (числа, дати, нулі) | — | ✔ |
| Вибір та переупорядкування колонок | — | ✔ |
| Історія експорту | — | ✔ |
| Повторити останній експорт | — | ✔ |
| Попередній перегляд при наведенні | — | ✔ |
| 100% локальна обробка | ✔ | ✔ |
Вирішення проблем
"Таблиці не виявлено"
Деякі сайти використовують макети з <div>, які виглядають як таблиці, але не є семантичними HTML-таблицями. Розширення виявляє переважно елементи <table> і також сумісне з деякими JavaScript-компонентами сіток. Переконайтеся, що сторінка повністю завантажилася перед експортом.
Відсутні дані в експорті
Перевірте, чи таблиця використовує відкладене завантаження. Спочатку прокрутіть всю таблицю, потім експортуйте.
Експорт має неправильне кодування
Розширення використовує кодування UTF-8. Якщо ви бачите нечитабельні символи в Excel, використовуйте Дані → З тексту/CSV для імпорту.
Розширення не працює на сайті
Деякі сайти (як-от сам Chrome Web Store) блокують розширення з міркувань безпеки. Це обмеження Chrome. Якщо ви вважаєте, що розширення повинно працювати на конкретному сайті, але не працює, або якщо ви помітили помилки витягування, повідомте через нашу форму Підтримки, щоб ми могли це дослідити.
Відвідайте нашу сторінку Підтримки та заповніть форму для повідомлення про помилку. Підтримка здійснюється особисто, і відповіді можуть займати до 10 робочих днів.