Dokumentācija

Viss, kas nepieciešams, lai iegūtu, tīrītu un eksportētu tīmekļa tabulas kā profesionāļi. No pamata eksportēšanas līdz uzlabotām datu tīrīšanas darbplūsmām.

Ievads

HTML Table Exporter ir Chrome paplašinājums, kas atklāj tabulas tīmekļa lapās un eksportē tās jūsu izvēlētajā formātā. Atšķirībā no tīmekļa skrāperiem, kuriem nepieciešama sarežģīta konfigurēšana, šis rīks darbojas uzreiz: noklikšķiniet, izvēlieties formātu, lejupielādējiet.

100% Privāts

Visa apstrāde notiek lokāli jūsu pārlūkprogrammā. Jūsu dati nekad neatstāj jūsu ierīci.

Kam tas ir paredzēts?

  • Datu analītiķi, kuriem jāiegūst tabulas no finanšu pārskatiem, valdības vietnēm vai pētniecības datu bāzēm
  • Pētnieki, kas apkopo strukturētus datus no akadēmiskiem avotiem vai Wikipedia
  • Izstrādātāji, kuriem nepieciešama ātra piekļuve tabulārajiem datiem bez skrāpera izveides
  • Ikviens, kurš noguris no tabulu kopēšanas un ielīmēšanas pa vienai šūnai

Kad izmantot HTML Table Exporter

HTML Table Exporter ir izstrādāts konkrētam lietošanas gadījumu kopumam. Izpratne par to, kur tas izceļas — un kur citi rīki var būt piemērotāki — palīdzēs jums to maksimāli izmantot.

Ideāli piemērots

  • Vienreizējas tabulu eksportēšanas — finanšu pārskati, valdības datu kopas, pētniecības datu bāzes, Wikipedia tabulas, sporta statistika
  • Tīmekļa lietotņu dati — daudzas CRM platformas, analītikas paneļi, ERP sistēmas un uzņēmumu rīki renderē datus kā HTML tabulas, ko paplašinājums var atklāt
  • Atkārtotas eksportēšanas — saglabājiet tīrīšanas noteikumus un kolonnu konfigurāciju kā profilu un atkārtoti izmantojiet to katru reizi, kad eksportējat no tā paša avota
  • Privātumam jutīgas vides — visa apstrāde ir lokāla, padarot to piemērotu korporatīviem, finanšu vai veselības aprūpes kontekstiem, kur dati nedrīkst atstāt pārlūkprogrammu
  • Dati, kuriem nepieciešama tīrīšana — datumi, skaitļi, valūtas un null vērtības tiek automātiski normalizētas pirms eksportēšanas

Nav paredzēts

  • Automatizētai vai ieplānotai skrāpēšanai — šis ir manuāls un interaktīvs rīks. Ja jums nepieciešams bezgalvas skrāperis vai uz cron balstīta datplūsma, apsveriet tādus rīkus kā Scrapy, Puppeteer vai Playwright
  • Dati, kas nav tabulas — paplašinājums atklāj HTML <table> elementus. Kartiņas, saraksti, plūsmas un nestrukturēti izkārtojumi nav saderīgi
  • Piekļuve datiem caur API — ja nepieciešamie dati ir pieejami caur API, tās tiešā izmantošana būs uzticamāka nekā to iegūšana no renderētās lapas
  • Garantēta saderība ar visām vietnēm — tīmekļa tabulu struktūras ievērojami atšķiras. Paplašinājums darbojas ar standarta HTML tabulām un daudzām sarežģītām tīmekļa lietotnēm, bet dažas vietnes izmanto nestandarta renderēšanu, kas var nebūt pilnībā saderīga
Izmēģiniet pirms pirkšanas

Bezmaksas versijai nav rindu ierobežojuma, un tā darbojas ar lielāko daļu tabulu. Instalējiet to un izmēģiniet savā konkrētajā vietnē pirms PRO apsvēršanas.

Instalēšana

  1. Apmeklējiet Chrome Web Store

    Atveriet HTML Table Exporter lapu savā Chrome pārlūkprogrammā.

  2. Noklikšķiniet uz "Pievienot Chrome"

    Noklikšķiniet uz zilās pogas un apstipriniet uznirstošajā logā. Instalēšana aizņem aptuveni 3 sekundes.

  3. Piespraudiet paplašinājumu (neobligāti)

    Noklikšķiniet uz puzles ikonas Chrome rīkjoslā un piespraudiet HTML Table Exporter ātrajai piekļuvei.

Atļaujas

Paplašinājums pieprasa "Lasīt un mainīt visus jūsu datus vietnēs". Tas ir nepieciešams tabulu atklāšanai, taču atcerieties, ka visa apstrāde ir lokāla un mēs nekad nepārsūtām nekādus datus.

Licences aktivēšana

Pēc HTML Table Exporter PRO iegādes jūs saņemsiet licences atslēgu pa e-pastu. Izpildiet šos soļus, lai atbloķētu visas PRO funkcijas.

Vienreizēja aktivēšana

Jūsu licence tiek validēta aktivēšanas laikā un lokāli saglabāta kešatmiņā. Periodiski nepieciešama piekļuve internetam, lai atkārtoti pārbaudītu licences statusu, nodrošinot nepārtrauktu pakalpojumu.

Kā aktivēt PRO

  1. Noklikšķiniet uz "Aktivēt" paplašinājumā

    Atveriet paplašinājuma uznirstošo logu un noklikšķiniet uz pogas "Aktivēt" augšējā labajā stūrī. Jūs redzēsiet arī PRO funkcijas, kas norādītas bezmaksas versijas apakšā.

  2. Ievadiet savu licences atslēgu

    Ielīmējiet savu licences atslēgu formātā XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX un noklikšķiniet uz "Aktivēt". Atslēga tika nosūtīta uz jūsu e-pastu pēc pirkuma.

  3. Sāciet izmantot PRO funkcijas

    Pēc aktivēšanas paplašinājums parādīs "HTML Table Exporter PRO" ar vēstures pogu. Visas PRO funkcijas tagad ir atbloķētas.

Vizuālā pamācība

1 Noklikšķiniet uz pogas "Aktivēt"
HTML Table Exporter bezmaksas versija, kas parāda Aktivēt pogu un PRO funkciju sarakstu

Noklikšķiniet uz pogas "Aktivēt" augšējā labajā stūrī. Bezmaksas versija parāda, kādas funkcijas jūs atbloķējat ar PRO.

2 Ievadiet savu licenci
Licences aktivēšanas logs ar lauku licences atslēgas ievadei

Ielīmējiet savu licences atslēgu un noklikšķiniet uz "Aktivēt". Ja jums vēl nav atslēgas, noklikšķiniet uz "Iegūt HTML Table Exporter PRO".

Licences problēmu novēršana

"Nederīga licences atslēga"

Pārliecinieties, ka kopējat pilnu licences atslēgu, ieskaitot visas svītriņas. Formātam jābūt XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX. Pārbaudiet, vai pirms vai pēc atslēgas nav papildu atstarpju.

Nesaņēmu licences atslēgu

Pārbaudiet savu surogātpasta mapi. E-pasts nāk no Lemon Squeezy (mūsu maksājumu apstrādātāja). Ja joprojām nevarat to atrast, apmeklējiet atbalsta lapu ar sava pasūtījuma numuru.

Nepieciešams pārnest licenci uz citu ierīci

Katra licences atslēga ir derīga vienai ierīcei. Ja jums nepieciešams izmantot PRO papildu ierīcēs, varat iegādāties papildu licences vai apsvērt mūsu TEAM vai BUSINESS plānus.

Vēl nav licences?

Iegūstiet HTML Table Exporter PRO ar 14 dienu naudas atgriešanas garantiju. Skatīt cenu opcijas →

Ātrā sākšana

Eksportējiet savu pirmo tabulu mazāk nekā 60 sekundēs:

Kā eksportēt tabulas

Viedā atlase (ātrākā metode)

Šī pieeja ietaupa laiku, ļaujot tieši atlasīt mērķa datus. Vienkārši noklikšķiniet jebkurā tabulas vietā tīmekļa lapā un pēc tam atveriet HTML Table Exporter PRO paplašinājuma ikonu. Paplašinājums automātiski izceļ un fokusējas uz šo konkrēto tabulu, ļaujot to uzreiz eksportēt bez nepieciešamības meklēt starp citiem atklātajiem rezultātiem.

Elastīgi eksporta formāti

Katru atklāto tabulu var eksportēt vairākos profesionālos formātos, noklikšķinot uz atbilstošās pogas tabulas kartiņā:

  • Excel (XLSX) — Ideāli padziļinātai datu analīzei
  • CSV — Perfekti vispārējai izmantošanai izklājlapās
  • JSON vai NDJSON — Ideāli tīmekļa izstrādei un NoSQL datu bāzēm
  • SQL — Ģenerē lietošanai gatavus INSERT paziņojumus datu bāzēm

Pakešu lejupielāde

Lietotājiem, kas vēlas iegūt visas tabulas uzreiz, ir pieejama masveida lejupielāde. Lai to izdarītu, atrodiet ZIP formāta nolaižamo izvēlni un izvēlieties vēlamo formātu (piemēram, CSV vai JSON) failiem pakotnē. Noklikšķinot uz "Eksportēt visas tabulas (ZIP)", visas lapas tabulas tiek lejupielādētas kopā sakārtotā pakotnē.

Izvades piemērs (CSV)
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%

Eksporta formāti

HTML Table Exporter atbalsta piecus izvades formātus, katrs optimizēts dažādiem lietošanas gadījumiem.

CSV (Comma-Separated Values)

Universālais formāts. Darbojas ar Excel, Google Sheets, datu bāzēm un praktiski jebkuru datu rīku. PRO lietotāji var pielāgot norobežotāju (komats, semikols, tabulācija) reģionālai saderībai.

CSV
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending

JSON (JavaScript Object Notation)

Perfekti izstrādātājiem un API. Katra rinda tiek pārveidota par objektu ar kolonnu galvenēm kā atslēgām.

JSON
[
  {
    "Name": "John Doe",
    "Email": "[email protected]",
    "Status": "Active"
  }
]

Excel (XLSX)

Dabiskais Excel formāts ar pareiziem šūnu tipiem. Skaitļi ir skaitļi, datumi ir datumi.

NDJSON (Newline Delimited JSON)

Perfekti straumēšanas datu apstrādei un NoSQL datu bāzēm. Katra rinda ir atsevišķs JSON objekts, padarot to ideālu lielām datu kopām un žurnālu apstrādei.

NDJSON
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}

SQL (INSERT Statements)

Ģenerē gatavus INSERT paziņojumus tiešai importēšanai datu bāzēs. Perfekti MySQL, PostgreSQL, SQLite un citām SQL datu bāzēm.

SQL
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
PRO funkcija: NDJSON un SQL

PRO pievieno NDJSON un SQL eksporta formātus. Pakešu ZIP ietver visus formātus vienlaikus.

Datu tīrīšana

Tīmekļa dati ir nesakārtoti: valūtas simboli, nekonsekventi datumu formāti, slēptas rakstzīmes; tie sabojā analīzi un importēšanu. HTML Table Exporter automātiski tīra jūsu datus.

Automātiskā tīrīšana (Bezmaksas)

  • Noņem atstarpjus no visām šūnām
  • Noņem slēptās Unicode rakstzīmes
  • Normalizē rindu pārtraukumus
  • Saglabā apvienoto šūnu struktūru

Viedi tīrīšanas profili (PRO)

PRO ietver iepriekš izveidotus tīrīšanas profilus bieži sastopamiem datu tipiem:

Valūtas profils

Noņem simbolus $, , £ un tūkstošu atdalītājus. Pārveido $1,234.56 uz 1234.56.

Procentu profils

Noņem simbolu %. Pārveido 45.5% uz 0.455 vai 45.5.

Datuma profils

Standartizē datumus ISO formātā. Pārveido Jan 15, 2024 uz 2024-01-15.

Pirms vs Pēc
// Raw data from website
"  $1,234.56  ", "Jan 15, 2024", "45.5%"

// After cleaning profiles
1234.56, "2024-01-15", 0.455

Pakešu eksportēšana

Kad lapā ir vairākas tabulas (vai nepieciešami vairāki formāti), pakešu eksportēšana ietaupa stundas.

PRO funkcija

Pakešu eksportēšana ir pieejama tikai PRO lietotājiem.

Eksportēt visas tabulas

Noklikšķiniet uz "Eksportēt visu" paplašinājuma uznirstošajā logā. Katra tabula kļūst par atsevišķu failu.

ZIP lejupielāde

Iegūstiet vienu ZIP ar visām tabulām jūsu izvēlētajā formātā.

ZIP struktūra
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv

Sarežģītas tabulas

Reālās pasaules tabulas reti ir vienkārši režģi. HTML Table Exporter apstrādā sarežģītību, kas sabojā citus rīkus.

Apvienotās šūnas (Rowspan/Colspan)

Kad šūnas aptver vairākas rindas vai kolonnas, eksportētie dati aizpilda atbilstošās šūnas, lai saglabātu struktūru.

Ligzdotas tabulas

Tabulas tabulās ir izplatītas vecākās vietnēs. Izcelšana ar peles kursoru palīdz pārbaudīt pirms eksportēšanas.

Dinamiskas/JavaScript tabulas

Daudzas modernas tīmekļa lietotnes renderē tabulas, izmantojot JavaScript ietvarus. Ja tabula ir redzama jūsu pārlūkprogrammā, paplašinājums parasti var to atklāt. Tomēr rezultāti var atšķirties atkarībā no tā, kā vietne strukturē savu DOM — dažas lietotnes izmanto nestandarta elementus, kas var netikt atpazīti kā tabulas.

Tabulas ar atlikto ielādi

Dažas vietnes ielādē tabulas rindas, kad jūs ritināt. Vispirms ritiniet līdz beigām, lai nodrošinātu visu datu ielādi.

Scroll Capture (PRO)

Scroll Capture ir PRO funkcija, kas paredzēta lapotām un virtualizētām tabulām, kas vienlaikus rāda tikai rindu apakškopu. Tā darbojas, uztverot redzamās rindas, kad jūs ritināt tabulu, uzkrājot un deduplikējot tās pilnā datu kopā.

Kā tas darbojas: Jūs aktivējat Scroll Capture un pēc tam ritināt tabulu savā tempā. Paplašinājums nolasa rindas, kas šobrīd ir renderētas pārlūkprogrammas DOM — tas neveic papildu tīkla pieprasījumus, nesimulē klikšķus un nedarbojas ar lapošanas vadīklām. Kad esat pārskatījis nepieciešamos datus, apturiet uztveršanu un eksportējiet uzkrāto datu kopu.

Galvenās atšķirības no automātiskās lapošanas rīkiem: Atšķirībā no pārlūkprogrammas paplašinājumiem, kas automātiski noklikšķina uz "Nākamā lapa" pogām vai simulē bezgalīgu ritināšanu, Scroll Capture ir pasīvs lasītājs. Tas novēro to, ko jūsu pārlūkprogramma jau ir renderējusi, neaktivizējot lapu navigāciju vai servera pieprasījumus. Tas padara to mazāk pakļautu ātruma ierobežojumu vai anti-botu aizsardzības aktivizēšanai, un tas darbojas ar virtualizētiem režģiem, kas aizstāj DOM mezglus ritināšanas laikā.

Saderība

Scroll Capture darbojas ar daudzām lapotām un virtualizētām tabulām, bet rezultāti ir atkarīgi no katras vietnes specifiskās implementācijas. Ne visi tabulu formāti ir saderīgi. Mēs iesakām vispirms izmēģināt ar bezmaksas versiju, lai apstiprinātu pamata tabulu atklāšanu jūsu mērķa vietnē.

Bezmaksas vs PRO salīdzinājums

Bezmaksas versija ir patiesi noderīga, bez mākslīgiem ierobežojumiem. PRO pievieno uzlabotas funkcijas biežiem lietotājiem.

Funkcija Bezmaksas PRO
CSV eksportēšana
JSON eksportēšana
Excel eksportēšana
NDJSON eksportēšana
SQL eksportēšana
Automātiska tabulu atklāšana
Apvienoto šūnu apstrāde
ZIP lejupielāde (visas tabulas) Tikai CSV Daudzformātu
Iepriekš iestatīti profili (Pandas, DuckDB, u.c.)
Tīrīšanas iestatījumi (skaitļi, datumi, null)
Kolonnu atlase un pārkārtošana
Eksportu vēsture
Atkārtot pēdējo eksportēšanu
Priekšskatījums ar peles kursoru
100% lokāla apstrāde

Problēmu novēršana

"Tabulas nav atklātas"

Dažas vietnes izmanto <div> izkārtojumus, kas izskatās kā tabulas, bet nav semantiskas HTML tabulas. Paplašinājums galvenokārt atklāj <table> elementus un ir saderīgs arī ar dažiem uz JavaScript balstītiem režģu komponentiem. Pārliecinieties, ka lapa ir pilnībā ielādēta pirms eksportēšanas.

Trūkst datu eksportā

Pārbaudiet, vai tabula izmanto atlikto ielādi. Vispirms ritiniet cauri visai tabulai, pēc tam eksportējiet.

Eksportam ir nepareizs kodējums

Paplašinājums izmanto UTF-8 kodējumu. Ja Excel redzat nelasāmas rakstzīmes, izmantojiet Dati → No teksta/CSV importēšanai.

Paplašinājums nedarbojas vietnē

Dažas vietnes (piemēram, pati Chrome Web Store) bloķē paplašinājumus drošības dēļ. Šis ir Chrome ierobežojums. Ja domājat, ka paplašinājumam vajadzētu darboties konkrētā vietnē, bet tas nedarbojas, vai ja pamanāt ieguves kļūdas, ziņojiet par to caur mūsu atbalsta veidlapu, lai mēs varētu to izmeklēt.

Joprojām neizdodas?

Apmeklējiet mūsu atbalsta lapu un aizpildiet veidlapu, lai ziņotu par kļūdu. Atbalsts tiek sniegts individuāli, un atbildes var aizņemt līdz 10 darba dienām.