Dokumentasi

Semua yang anda perlukan untuk mengekstrak, membersih dan mengeksport jadual web seperti profesional. Dari eksport asas hingga aliran pembersihan data lanjutan.

Pengenalan

HTML Table Exporter ialah sambungan Chrome yang mengesan jadual pada halaman web dan mengeksportnya ke format pilihan anda. Tidak seperti web scraper yang memerlukan konfigurasi kompleks, alat ini berfungsi serta-merta: klik, pilih format, muat turun.

100% Peribadi

Semua pemprosesan berlaku secara tempatan dalam pelayar anda. Data anda tidak pernah meninggalkan peranti anda.

Untuk siapa?

  • Penganalisis data yang perlu mengekstrak jadual dari laporan kewangan, tapak kerajaan atau pangkalan data penyelidikan
  • Penyelidik yang mengumpul data berstruktur dari sumber akademik atau Wikipedia
  • Pembangun yang memerlukan akses pantas kepada data jadual tanpa membina scraper
  • Sesiapa yang letih menyalin dan menampal jadual sel demi sel

Bila menggunakan HTML Table Exporter

HTML Table Exporter direka untuk set kes penggunaan tertentu. Memahami di mana ia cemerlang — dan di mana alat lain mungkin lebih sesuai — akan membantu anda memanfaatkannya sepenuhnya.

Sesuai untuk

  • Eksport jadual sekali sahaja — laporan kewangan, dataset kerajaan, pangkalan data penyelidikan, jadual Wikipedia, statistik sukan
  • Data aplikasi web — banyak platform CRM, papan pemuka analitik, sistem ERP dan alat perusahaan merender data sebagai jadual HTML yang boleh dikesan sambungan
  • Eksport berulang — simpan peraturan pembersihan dan konfigurasi lajur anda sebagai profil, dan guna semula setiap kali mengeksport dari sumber yang sama
  • Persekitaran sensitif privasi — semua pemprosesan adalah tempatan, menjadikannya sesuai untuk konteks korporat, kewangan atau kesihatan di mana data tidak boleh meninggalkan pelayar
  • Data yang memerlukan pembersihan — tarikh, nombor, mata wang dan nilai null dinormalisasi secara automatik sebelum eksport

Tidak direka untuk

  • Scraping automatik atau berjadual — ini adalah alat manual dan interaktif. Jika anda memerlukan scraper tanpa kepala atau saluran berasaskan cron, pertimbangkan alat seperti Scrapy, Puppeteer atau Playwright
  • Data bukan jadual — sambungan mengesan elemen HTML <table>. Kad, senarai, suapan dan reka letak tidak berstruktur tidak disokong
  • Akses data melalui API — jika data yang anda perlukan tersedia melalui API, menggunakannya secara langsung akan lebih dipercayai daripada mengekstraknya dari halaman yang dirender
  • Keserasian dijamin dengan semua tapak — struktur jadual web sangat berbeza-beza. Sambungan berfungsi dengan jadual HTML standard dan banyak aplikasi web kompleks, tetapi sesetengah tapak menggunakan rendering bukan standard yang mungkin tidak serasi sepenuhnya
Cuba sebelum membeli

Versi percuma tidak mempunyai had baris dan berfungsi dengan kebanyakan jadual. Pasangkannya dan cuba di tapak khusus anda sebelum mempertimbangkan PRO.

Pemasangan

  1. Lawati Chrome Web Store

    Buka halaman HTML Table Exporter dalam pelayar Chrome anda.

  2. Klik "Tambah ke Chrome"

    Klik butang biru dan sahkan dalam popup. Pemasangan mengambil masa kira-kira 3 saat.

  3. Pin sambungan (pilihan)

    Klik ikon teka-teki di bar alat Chrome dan pin HTML Table Exporter untuk akses pantas.

Kebenaran

Sambungan meminta "Baca dan tukar semua data anda di laman web". Ini diperlukan untuk mengesan jadual, tetapi ingat bahawa semua pemprosesan adalah tempatan dan kami tidak pernah menghantar sebarang data.

Pengaktifan lesen

Selepas membeli HTML Table Exporter PRO, anda akan menerima kunci lesen melalui e-mel. Ikuti langkah-langkah ini untuk membuka kunci semua ciri PRO.

Pengaktifan sekali

Lesen anda disahkan semasa pengaktifan dan dicache secara tempatan. Akses internet berkala diperlukan untuk mengesahkan semula status lesen, memastikan perkhidmatan tanpa gangguan.

Cara mengaktifkan PRO

  1. Klik "Aktifkan" dalam sambungan

    Buka popup sambungan dan klik butang "Aktifkan" di sudut kanan atas. Anda juga akan melihat ciri PRO disenaraikan di bahagian bawah versi percuma.

  2. Masukkan kunci lesen anda

    Tampal kunci lesen anda dalam format XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX dan klik "Aktifkan". Kunci dihantar ke e-mel anda selepas pembelian.

  3. Mula menggunakan ciri PRO

    Setelah diaktifkan, sambungan akan menunjukkan "HTML Table Exporter PRO" dengan butang Sejarah. Semua ciri PRO kini dibuka kunci.

Panduan visual

1 Klik butang "Aktifkan"
Versi percuma HTML Table Exporter menunjukkan butang Aktifkan dan senarai ciri PRO

Klik butang "Aktifkan" di sudut kanan atas. Versi percuma menunjukkan ciri yang anda buka kunci dengan PRO.

2 Masukkan lesen anda
Modal pengaktifan lesen dengan medan untuk memasukkan kunci lesen

Tampal kunci lesen anda dan klik "Aktifkan". Jika anda belum mempunyai kunci, klik "Dapatkan HTML Table Exporter PRO".

Penyelesaian masalah lesen

"Kunci lesen tidak sah"

Pastikan untuk menyalin kunci lesen lengkap termasuk semua tanda sengkang. Format mestilah XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX. Sahkan tiada ruang tambahan sebelum atau selepas kunci.

Saya tidak menerima kunci lesen

Semak folder spam anda. E-mel datang dari Lemon Squeezy (pemproses pembayaran kami). Jika anda masih tidak menemuinya, lawati halaman Sokongan dengan nombor pesanan anda.

Saya perlu memindahkan lesen ke peranti lain

Setiap kunci lesen sah untuk satu peranti sahaja. Jika anda perlu menggunakan PRO pada peranti tambahan, anda boleh membeli lesen tambahan atau mempertimbangkan pelan TEAM atau BUSINESS kami.

Belum mempunyai lesen?

Dapatkan HTML Table Exporter PRO dengan jaminan pulangan wang 14 hari. Lihat pilihan harga →

Mula pantas

Eksport jadual pertama anda dalam kurang dari 60 saat:

Cara mengeksport jadual

Pemilihan pintar (kaedah terpantas)

Pendekatan ini menjimatkan masa dengan membenarkan anda memilih data sasaran secara langsung. Cukup klik di mana-mana bahagian jadual pada halaman web dan kemudian buka ikon sambungan HTML Table Exporter PRO. Sambungan secara automatik menyerlahkan dan memberi tumpuan kepada jadual khusus itu, membolehkan anda mengeksportnya serta-merta tanpa perlu mencari antara hasil lain yang dikesan.

Format eksport fleksibel

Setiap jadual yang dikesan boleh dieksport dalam pelbagai format profesional dengan mengklik butang yang sepadan pada kad jadual:

  • Excel (XLSX) — Sesuai untuk analisis data mendalam
  • CSV — Sempurna untuk kegunaan hamparan umum
  • JSON atau NDJSON — Sesuai untuk pembangunan web dan pangkalan data NoSQL
  • SQL — Menjana pernyataan INSERT sedia untuk digunakan dalam pangkalan data

Muat turun pukal

Untuk pengguna yang ingin mengekstrak semua jadual sekaligus, muat turun pukal tersedia. Untuk ini, cari menu lungsur format ZIP dan pilih format pilihan anda (seperti CSV atau JSON) untuk fail dalam pakej. Dengan mengklik "Export all tables (ZIP)", semua jadual di halaman dimuat turun bersama dalam pakej yang teratur.

Contoh output (CSV)
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%

Format eksport

HTML Table Exporter menyokong lima format output, setiap satu dioptimumkan untuk kes penggunaan berbeza.

CSV (Nilai Dipisahkan Koma)

Format universal. Berfungsi dengan Excel, Google Sheets, pangkalan data dan hampir mana-mana alat data. Pengguna PRO boleh menyesuaikan pemisah (koma, titik bertindih, tab) untuk keserasian serantau.

CSV
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending

JSON (JavaScript Object Notation)

Sempurna untuk pembangun dan API. Setiap baris menjadi objek dengan pengepala lajur sebagai kunci.

JSON
[
  {
    "Name": "John Doe",
    "Email": "[email protected]",
    "Status": "Active"
  }
]

Excel (XLSX)

Format asli Excel dengan jenis sel yang betul. Nombor adalah nombor, tarikh adalah tarikh.

NDJSON (JSON Dipisahkan Baris Baharu)

Sempurna untuk pemprosesan data penstriman dan pangkalan data NoSQL. Setiap baris adalah objek JSON berasingan, menjadikannya sesuai untuk dataset besar dan pemprosesan log.

NDJSON
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}

SQL (Pernyataan INSERT)

Menjana pernyataan INSERT sedia untuk diimport terus ke pangkalan data. Sempurna untuk MySQL, PostgreSQL, SQLite dan pangkalan data SQL lain.

SQL
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
Ciri PRO: NDJSON dan SQL

PRO menambah format eksport NDJSON dan SQL. ZIP kelompok termasuk semua format sekaligus.

Pembersihan data

Data web tidak teratur: simbol mata wang, format tarikh tidak konsisten, aksara tersembunyi; ini merosakkan analisis dan import. HTML Table Exporter membersihkan data anda secara automatik.

Pembersihan automatik (Percuma)

  • Membuang ruang putih dari semua sel
  • Membuang aksara Unicode tersembunyi
  • Menormalkan pemisah baris
  • Mengekalkan struktur sel bergabung

Profil pembersihan pintar (PRO)

PRO termasuk profil pembersihan pra-bina untuk jenis data biasa:

Profil mata wang

Membuang simbol $, , £ dan pemisah ribu. Menukar $1,234.56 kepada 1234.56.

Profil peratusan

Membuang simbol %. Menukar 45.5% kepada 0.455 atau 45.5.

Profil tarikh

Menstandardkan tarikh kepada format ISO. Menukar Jan 15, 2024 kepada 2024-01-15.

Sebelum vs Selepas
// Raw data from website
"  $1,234.56  ", "Jan 15, 2024", "45.5%"

// After cleaning profiles
1234.56, "2024-01-15", 0.455

Eksport kelompok

Apabila halaman mempunyai pelbagai jadual (atau anda memerlukan pelbagai format), eksport kelompok menjimatkan berjam-jam.

Ciri PRO

Eksport kelompok tersedia secara eksklusif untuk pengguna PRO.

Eksport semua jadual

Klik "Export All" dalam popup sambungan. Setiap jadual menjadi fail berasingan.

Muat turun ZIP

Dapatkan ZIP tunggal dengan semua jadual dalam format pilihan anda.

Struktur ZIP
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv

Jadual kompleks

Jadual dunia sebenar jarang menjadi grid mudah. HTML Table Exporter mengendalikan kerumitan yang merosakkan alat lain.

Sel bergabung (Rowspan/Colspan)

Apabila sel merangkumi pelbagai baris atau lajur, data yang dieksport mengisi sel yang sepadan untuk mengekalkan struktur.

Jadual bersarang

Jadual dalam jadual adalah biasa di laman web lama. Penyerlahan semasa hover membantu anda mengesahkan sebelum mengeksport.

Jadual dinamik/JavaScript

Banyak aplikasi web moden merender jadual menggunakan rangka kerja JavaScript. Jika jadual kelihatan dalam pelayar anda, sambungan biasanya boleh mengesannya. Walau bagaimanapun, keputusan mungkin berbeza bergantung pada cara tapak menyusun DOMnya — sesetengah aplikasi menggunakan elemen bukan standard yang mungkin tidak dikenali sebagai jadual.

Jadual dengan muatan tertunda

Sesetengah tapak memuatkan baris jadual semasa anda menatal. Tatal ke akhir dahulu untuk memastikan semua data dimuatkan.

Scroll Capture (PRO)

Scroll Capture ialah ciri PRO yang direka untuk jadual berhalaman dan maya yang hanya menunjukkan subset baris pada satu masa. Ia berfungsi dengan menangkap baris yang kelihatan semasa anda menatal melalui jadual, mengumpul dan menyahduplikasi mereka ke dalam dataset lengkap.

Cara ia berfungsi: Anda mengaktifkan Scroll Capture dan kemudian menatal melalui jadual mengikut kadar anda sendiri. Sambungan membaca baris yang dirender dalam DOM pelayar pada masa itu — ia tidak membuat permintaan rangkaian tambahan, tidak mensimulasikan klik atau berinteraksi dengan kawalan halaman. Setelah anda melalui data yang anda perlukan, anda menghentikan tangkapan dan mengeksport dataset terkumpul.

Perbezaan utama dengan alat halaman automatik: Tidak seperti sambungan pelayar yang secara automatik mengklik butang "Halaman seterusnya" atau mensimulasikan tatal tak terhingga, Scroll Capture ialah pembaca pasif. Ia memerhati apa yang pelayar anda sudah render tanpa mencetuskan navigasi halaman atau permintaan pelayan. Ini menjadikannya kurang berkemungkinan mencetuskan had kadar atau perlindungan anti-bot, dan berfungsi dengan grid maya yang menggantikan nod DOM semasa anda menatal.

Keserasian

Scroll Capture berfungsi dengan banyak jadual berhalaman dan maya, tetapi keputusan bergantung pada pelaksanaan khusus setiap laman web. Tidak semua format jadual serasi. Kami mengesyorkan mencuba dahulu dengan versi percuma untuk mengesahkan pengesanan jadual asas di tapak sasaran anda.

Perbandingan Percuma vs PRO

Versi percuma benar-benar berguna, tanpa had buatan. PRO menambah ciri lanjutan untuk pengguna kerap.

Ciri Percuma PRO
Eksport CSV
Eksport JSON
Eksport Excel
Eksport NDJSON
Eksport SQL
Pengesanan jadual automatik
Pengendalian sel bergabung
Muat turun ZIP (semua jadual) CSV sahaja Pelbagai format
Profil pratetap (Pandas, DuckDB, dll.)
Pratetap pembersihan (nombor, tarikh, null)
Pemilihan dan penyusunan semula lajur
Sejarah eksport
Ulang eksport terakhir
Pratonton semasa hover
Pemprosesan 100% tempatan

Penyelesaian masalah

"Tiada jadual dikesan"

Sesetengah tapak menggunakan reka letak dengan <div> yang kelihatan seperti jadual tetapi bukan jadual HTML semantik. Sambungan terutamanya mengesan elemen <table> dan juga serasi dengan beberapa komponen grid berasaskan JavaScript. Pastikan halaman telah dimuatkan sepenuhnya sebelum mengeksport.

Data hilang dalam eksport

Semak sama ada jadual menggunakan muatan malas. Tatal melalui keseluruhan jadual dahulu, kemudian eksport.

Eksport mempunyai pengekodan yang salah

Sambungan menggunakan pengekodan UTF-8. Jika anda melihat aksara tidak boleh dibaca dalam Excel, gunakan Data → Dari Teks/CSV untuk mengimport.

Sambungan tidak berfungsi di tapak

Sesetengah tapak (seperti Chrome Web Store sendiri) menyekat sambungan atas sebab keselamatan. Ini adalah had Chrome. Jika anda percaya sambungan harus berfungsi di tapak tertentu tetapi tidak, atau jika anda melihat ralat pengekstrakan, laporkan melalui Borang Sokongan kami supaya kami boleh menyiasat.

Masih tidak dapat diselesaikan?

Lawati halaman Sokongan kami dan lengkapkan borang untuk melaporkan pepijat. Sokongan dikendalikan secara peribadi dan respons mungkin mengambil masa sehingga 10 hari bekerja.