Dokumentācija
Viss, kas nepieciešams, lai iegūtu, tīrītu un eksportētu tīmekļa tabulas kā profesionāļi. No pamata eksportēšanas līdz uzlabotām datu tīrīšanas darbplūsmām.
Ievads
HTML Table Exporter ir Chrome paplašinājums, kas atklāj tabulas tīmekļa lapās un eksportē tās jūsu izvēlētajā formātā. Atšķirībā no tīmekļa skrāperiem, kuriem nepieciešama sarežģīta konfigurēšana, šis rīks darbojas uzreiz: noklikšķiniet, izvēlieties formātu, lejupielādējiet.
Visa apstrāde notiek lokāli jūsu pārlūkprogrammā. Jūsu dati nekad neatstāj jūsu ierīci.
Kam tas ir paredzēts?
- Datu analītiķi, kuriem jāiegūst tabulas no finanšu pārskatiem, valdības vietnēm vai pētniecības datu bāzēm
- Pētnieki, kas apkopo strukturētus datus no akadēmiskiem avotiem vai Wikipedia
- Izstrādātāji, kuriem nepieciešama ātra piekļuve tabulārajiem datiem bez skrāpera izveides
- Ikviens, kurš noguris no tabulu kopēšanas un ielīmēšanas pa vienai šūnai
Kad izmantot HTML Table Exporter
HTML Table Exporter ir izstrādāts konkrētam lietošanas gadījumu kopumam. Izpratne par to, kur tas izceļas — un kur citi rīki var būt piemērotāki — palīdzēs jums to maksimāli izmantot.
Ideāli piemērots
- Vienreizējas tabulu eksportēšanas — finanšu pārskati, valdības datu kopas, pētniecības datu bāzes, Wikipedia tabulas, sporta statistika
- Tīmekļa lietotņu dati — daudzas CRM platformas, analītikas paneļi, ERP sistēmas un uzņēmumu rīki renderē datus kā HTML tabulas, ko paplašinājums var atklāt
- Atkārtotas eksportēšanas — saglabājiet tīrīšanas noteikumus un kolonnu konfigurāciju kā profilu un atkārtoti izmantojiet to katru reizi, kad eksportējat no tā paša avota
- Privātumam jutīgas vides — visa apstrāde ir lokāla, padarot to piemērotu korporatīviem, finanšu vai veselības aprūpes kontekstiem, kur dati nedrīkst atstāt pārlūkprogrammu
- Dati, kuriem nepieciešama tīrīšana — datumi, skaitļi, valūtas un null vērtības tiek automātiski normalizētas pirms eksportēšanas
Nav paredzēts
- Automatizētai vai ieplānotai skrāpēšanai — šis ir manuāls un interaktīvs rīks. Ja jums nepieciešams bezgalvas skrāperis vai uz cron balstīta datplūsma, apsveriet tādus rīkus kā Scrapy, Puppeteer vai Playwright
- Dati, kas nav tabulas — paplašinājums atklāj HTML
<table>elementus. Kartiņas, saraksti, plūsmas un nestrukturēti izkārtojumi nav saderīgi - Piekļuve datiem caur API — ja nepieciešamie dati ir pieejami caur API, tās tiešā izmantošana būs uzticamāka nekā to iegūšana no renderētās lapas
- Garantēta saderība ar visām vietnēm — tīmekļa tabulu struktūras ievērojami atšķiras. Paplašinājums darbojas ar standarta HTML tabulām un daudzām sarežģītām tīmekļa lietotnēm, bet dažas vietnes izmanto nestandarta renderēšanu, kas var nebūt pilnībā saderīga
Bezmaksas versijai nav rindu ierobežojuma, un tā darbojas ar lielāko daļu tabulu. Instalējiet to un izmēģiniet savā konkrētajā vietnē pirms PRO apsvēršanas.
Instalēšana
-
Apmeklējiet Chrome Web Store
Atveriet HTML Table Exporter lapu savā Chrome pārlūkprogrammā.
-
Noklikšķiniet uz "Pievienot Chrome"
Noklikšķiniet uz zilās pogas un apstipriniet uznirstošajā logā. Instalēšana aizņem aptuveni 3 sekundes.
-
Piespraudiet paplašinājumu (neobligāti)
Noklikšķiniet uz puzles ikonas Chrome rīkjoslā un piespraudiet HTML Table Exporter ātrajai piekļuvei.
Paplašinājums pieprasa "Lasīt un mainīt visus jūsu datus vietnēs". Tas ir nepieciešams tabulu atklāšanai, taču atcerieties, ka visa apstrāde ir lokāla un mēs nekad nepārsūtām nekādus datus.
Licences aktivēšana
Pēc HTML Table Exporter PRO iegādes jūs saņemsiet licences atslēgu pa e-pastu. Izpildiet šos soļus, lai atbloķētu visas PRO funkcijas.
Jūsu licence tiek validēta aktivēšanas laikā un lokāli saglabāta kešatmiņā. Periodiski nepieciešama piekļuve internetam, lai atkārtoti pārbaudītu licences statusu, nodrošinot nepārtrauktu pakalpojumu.
Kā aktivēt PRO
-
Noklikšķiniet uz "Aktivēt" paplašinājumā
Atveriet paplašinājuma uznirstošo logu un noklikšķiniet uz pogas "Aktivēt" augšējā labajā stūrī. Jūs redzēsiet arī PRO funkcijas, kas norādītas bezmaksas versijas apakšā.
-
Ievadiet savu licences atslēgu
Ielīmējiet savu licences atslēgu formātā
XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXXun noklikšķiniet uz "Aktivēt". Atslēga tika nosūtīta uz jūsu e-pastu pēc pirkuma. -
Sāciet izmantot PRO funkcijas
Pēc aktivēšanas paplašinājums parādīs "HTML Table Exporter PRO" ar vēstures pogu. Visas PRO funkcijas tagad ir atbloķētas.
Vizuālā pamācība
Noklikšķiniet uz pogas "Aktivēt" augšējā labajā stūrī. Bezmaksas versija parāda, kādas funkcijas jūs atbloķējat ar PRO.
Ielīmējiet savu licences atslēgu un noklikšķiniet uz "Aktivēt". Ja jums vēl nav atslēgas, noklikšķiniet uz "Iegūt HTML Table Exporter PRO".
Licences problēmu novēršana
"Nederīga licences atslēga"
Pārliecinieties, ka kopējat pilnu licences atslēgu, ieskaitot visas svītriņas. Formātam jābūt XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX. Pārbaudiet, vai pirms vai pēc atslēgas nav papildu atstarpju.
Nesaņēmu licences atslēgu
Pārbaudiet savu surogātpasta mapi. E-pasts nāk no Lemon Squeezy (mūsu maksājumu apstrādātāja). Ja joprojām nevarat to atrast, apmeklējiet atbalsta lapu ar sava pasūtījuma numuru.
Nepieciešams pārnest licenci uz citu ierīci
Katra licences atslēga ir derīga vienai ierīcei. Ja jums nepieciešams izmantot PRO papildu ierīcēs, varat iegādāties papildu licences vai apsvērt mūsu TEAM vai BUSINESS plānus.
Iegūstiet HTML Table Exporter PRO ar 14 dienu naudas atgriešanas garantiju. Skatīt cenu opcijas →
Ātrā sākšana
Eksportējiet savu pirmo tabulu mazāk nekā 60 sekundēs:
Kā eksportēt tabulas
Viedā atlase (ātrākā metode)
Šī pieeja ietaupa laiku, ļaujot tieši atlasīt mērķa datus. Vienkārši noklikšķiniet jebkurā tabulas vietā tīmekļa lapā un pēc tam atveriet HTML Table Exporter PRO paplašinājuma ikonu. Paplašinājums automātiski izceļ un fokusējas uz šo konkrēto tabulu, ļaujot to uzreiz eksportēt bez nepieciešamības meklēt starp citiem atklātajiem rezultātiem.
Elastīgi eksporta formāti
Katru atklāto tabulu var eksportēt vairākos profesionālos formātos, noklikšķinot uz atbilstošās pogas tabulas kartiņā:
- Excel (XLSX) — Ideāli padziļinātai datu analīzei
- CSV — Perfekti vispārējai izmantošanai izklājlapās
- JSON vai NDJSON — Ideāli tīmekļa izstrādei un NoSQL datu bāzēm
- SQL — Ģenerē lietošanai gatavus INSERT paziņojumus datu bāzēm
Pakešu lejupielāde
Lietotājiem, kas vēlas iegūt visas tabulas uzreiz, ir pieejama masveida lejupielāde. Lai to izdarītu, atrodiet ZIP formāta nolaižamo izvēlni un izvēlieties vēlamo formātu (piemēram, CSV vai JSON) failiem pakotnē. Noklikšķinot uz "Eksportēt visas tabulas (ZIP)", visas lapas tabulas tiek lejupielādētas kopā sakārtotā pakotnē.
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%
Eksporta formāti
HTML Table Exporter atbalsta piecus izvades formātus, katrs optimizēts dažādiem lietošanas gadījumiem.
CSV (Comma-Separated Values)
Universālais formāts. Darbojas ar Excel, Google Sheets, datu bāzēm un praktiski jebkuru datu rīku. PRO lietotāji var pielāgot norobežotāju (komats, semikols, tabulācija) reģionālai saderībai.
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending
JSON (JavaScript Object Notation)
Perfekti izstrādātājiem un API. Katra rinda tiek pārveidota par objektu ar kolonnu galvenēm kā atslēgām.
[
{
"Name": "John Doe",
"Email": "[email protected]",
"Status": "Active"
}
]
Excel (XLSX)
Dabiskais Excel formāts ar pareiziem šūnu tipiem. Skaitļi ir skaitļi, datumi ir datumi.
NDJSON (Newline Delimited JSON)
Perfekti straumēšanas datu apstrādei un NoSQL datu bāzēm. Katra rinda ir atsevišķs JSON objekts, padarot to ideālu lielām datu kopām un žurnālu apstrādei.
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}
SQL (INSERT Statements)
Ģenerē gatavus INSERT paziņojumus tiešai importēšanai datu bāzēs. Perfekti MySQL, PostgreSQL, SQLite un citām SQL datu bāzēm.
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
PRO pievieno NDJSON un SQL eksporta formātus. Pakešu ZIP ietver visus formātus vienlaikus.
Datu tīrīšana
Tīmekļa dati ir nesakārtoti: valūtas simboli, nekonsekventi datumu formāti, slēptas rakstzīmes; tie sabojā analīzi un importēšanu. HTML Table Exporter automātiski tīra jūsu datus.
Automātiskā tīrīšana (Bezmaksas)
- Noņem atstarpjus no visām šūnām
- Noņem slēptās Unicode rakstzīmes
- Normalizē rindu pārtraukumus
- Saglabā apvienoto šūnu struktūru
Viedi tīrīšanas profili (PRO)
PRO ietver iepriekš izveidotus tīrīšanas profilus bieži sastopamiem datu tipiem:
Valūtas profils
Noņem simbolus $, €, £ un tūkstošu atdalītājus. Pārveido $1,234.56 uz 1234.56.
Procentu profils
Noņem simbolu %. Pārveido 45.5% uz 0.455 vai 45.5.
Datuma profils
Standartizē datumus ISO formātā. Pārveido Jan 15, 2024 uz 2024-01-15.
// Raw data from website
" $1,234.56 ", "Jan 15, 2024", "45.5%"
// After cleaning profiles
1234.56, "2024-01-15", 0.455
Pakešu eksportēšana
Kad lapā ir vairākas tabulas (vai nepieciešami vairāki formāti), pakešu eksportēšana ietaupa stundas.
Pakešu eksportēšana ir pieejama tikai PRO lietotājiem.
Eksportēt visas tabulas
Noklikšķiniet uz "Eksportēt visu" paplašinājuma uznirstošajā logā. Katra tabula kļūst par atsevišķu failu.
ZIP lejupielāde
Iegūstiet vienu ZIP ar visām tabulām jūsu izvēlētajā formātā.
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv
Sarežģītas tabulas
Reālās pasaules tabulas reti ir vienkārši režģi. HTML Table Exporter apstrādā sarežģītību, kas sabojā citus rīkus.
Apvienotās šūnas (Rowspan/Colspan)
Kad šūnas aptver vairākas rindas vai kolonnas, eksportētie dati aizpilda atbilstošās šūnas, lai saglabātu struktūru.
Ligzdotas tabulas
Tabulas tabulās ir izplatītas vecākās vietnēs. Izcelšana ar peles kursoru palīdz pārbaudīt pirms eksportēšanas.
Dinamiskas/JavaScript tabulas
Daudzas modernas tīmekļa lietotnes renderē tabulas, izmantojot JavaScript ietvarus. Ja tabula ir redzama jūsu pārlūkprogrammā, paplašinājums parasti var to atklāt. Tomēr rezultāti var atšķirties atkarībā no tā, kā vietne strukturē savu DOM — dažas lietotnes izmanto nestandarta elementus, kas var netikt atpazīti kā tabulas.
Dažas vietnes ielādē tabulas rindas, kad jūs ritināt. Vispirms ritiniet līdz beigām, lai nodrošinātu visu datu ielādi.
Scroll Capture (PRO)
Scroll Capture ir PRO funkcija, kas paredzēta lapotām un virtualizētām tabulām, kas vienlaikus rāda tikai rindu apakškopu. Tā darbojas, uztverot redzamās rindas, kad jūs ritināt tabulu, uzkrājot un deduplikējot tās pilnā datu kopā.
Kā tas darbojas: Jūs aktivējat Scroll Capture un pēc tam ritināt tabulu savā tempā. Paplašinājums nolasa rindas, kas šobrīd ir renderētas pārlūkprogrammas DOM — tas neveic papildu tīkla pieprasījumus, nesimulē klikšķus un nedarbojas ar lapošanas vadīklām. Kad esat pārskatījis nepieciešamos datus, apturiet uztveršanu un eksportējiet uzkrāto datu kopu.
Galvenās atšķirības no automātiskās lapošanas rīkiem: Atšķirībā no pārlūkprogrammas paplašinājumiem, kas automātiski noklikšķina uz "Nākamā lapa" pogām vai simulē bezgalīgu ritināšanu, Scroll Capture ir pasīvs lasītājs. Tas novēro to, ko jūsu pārlūkprogramma jau ir renderējusi, neaktivizējot lapu navigāciju vai servera pieprasījumus. Tas padara to mazāk pakļautu ātruma ierobežojumu vai anti-botu aizsardzības aktivizēšanai, un tas darbojas ar virtualizētiem režģiem, kas aizstāj DOM mezglus ritināšanas laikā.
Scroll Capture darbojas ar daudzām lapotām un virtualizētām tabulām, bet rezultāti ir atkarīgi no katras vietnes specifiskās implementācijas. Ne visi tabulu formāti ir saderīgi. Mēs iesakām vispirms izmēģināt ar bezmaksas versiju, lai apstiprinātu pamata tabulu atklāšanu jūsu mērķa vietnē.
Bezmaksas vs PRO salīdzinājums
Bezmaksas versija ir patiesi noderīga, bez mākslīgiem ierobežojumiem. PRO pievieno uzlabotas funkcijas biežiem lietotājiem.
| Funkcija | Bezmaksas | PRO |
|---|---|---|
| CSV eksportēšana | ✔ | ✔ |
| JSON eksportēšana | ✔ | ✔ |
| Excel eksportēšana | ✔ | ✔ |
| NDJSON eksportēšana | — | ✔ |
| SQL eksportēšana | — | ✔ |
| Automātiska tabulu atklāšana | ✔ | ✔ |
| Apvienoto šūnu apstrāde | ✔ | ✔ |
| ZIP lejupielāde (visas tabulas) | Tikai CSV | Daudzformātu |
| Iepriekš iestatīti profili (Pandas, DuckDB, u.c.) | — | ✔ |
| Tīrīšanas iestatījumi (skaitļi, datumi, null) | — | ✔ |
| Kolonnu atlase un pārkārtošana | — | ✔ |
| Eksportu vēsture | — | ✔ |
| Atkārtot pēdējo eksportēšanu | — | ✔ |
| Priekšskatījums ar peles kursoru | — | ✔ |
| 100% lokāla apstrāde | ✔ | ✔ |
Problēmu novēršana
"Tabulas nav atklātas"
Dažas vietnes izmanto <div> izkārtojumus, kas izskatās kā tabulas, bet nav semantiskas HTML tabulas. Paplašinājums galvenokārt atklāj <table> elementus un ir saderīgs arī ar dažiem uz JavaScript balstītiem režģu komponentiem. Pārliecinieties, ka lapa ir pilnībā ielādēta pirms eksportēšanas.
Trūkst datu eksportā
Pārbaudiet, vai tabula izmanto atlikto ielādi. Vispirms ritiniet cauri visai tabulai, pēc tam eksportējiet.
Eksportam ir nepareizs kodējums
Paplašinājums izmanto UTF-8 kodējumu. Ja Excel redzat nelasāmas rakstzīmes, izmantojiet Dati → No teksta/CSV importēšanai.
Paplašinājums nedarbojas vietnē
Dažas vietnes (piemēram, pati Chrome Web Store) bloķē paplašinājumus drošības dēļ. Šis ir Chrome ierobežojums. Ja domājat, ka paplašinājumam vajadzētu darboties konkrētā vietnē, bet tas nedarbojas, vai ja pamanāt ieguves kļūdas, ziņojiet par to caur mūsu atbalsta veidlapu, lai mēs varētu to izmeklēt.
Apmeklējiet mūsu atbalsta lapu un aizpildiet veidlapu, lai ziņotu par kļūdu. Atbalsts tiek sniegts individuāli, un atbildes var aizņemt līdz 10 darba dienām.