Dokumentatsioon

Kõik, mida vajad veebitabelite ekstraheerimiseks, puhastamiseks ja eksportimiseks nagu professionaal. Põhilistest eksportidest keerukate andmete puhastamise töövoogudeni.

Sissejuhatus

HTML Table Exporter on Chrome'i laiendus, mis tuvastab veebilehtedel tabeleid ja ekspordib need sinu eelistatud formaati. Erinevalt veebiskreepritest, mis vajavad keerulist seadistust, töötab see tööriist koheselt: klõps, vali formaat, laadi alla.

100% Privaatne

Kogu töötlemine toimub lokaalselt sinu brauseris. Sinu andmed ei lahku kunagi seadmest.

Kellele see mõeldud on?

  • Andmeanalüütikud, kes vajavad tabelite ekstraheerimist finantsaruannetest, valitsuse veebisaitidelt või uurimisandmebaasidest
  • Teadlased, kes koguvad struktureeritud andmeid akadeemilistest allikatest või Wikipediast
  • Arendajad, kes vajavad kiiret juurdepääsu tabeliandmetele ilma skreeprit ehitamata
  • Kõik, kes on tüdinenud tabelite lahtrite kaupa kopeerimisest ja kleepimisest

Millal kasutada HTML Table Exporterit

HTML Table Exporter on loodud konkreetsete kasutusjuhtude jaoks. Mõistmine, kus see paistab silma — ja kus muud tööriistad võivad paremini sobida — aitab sul seda maksimaalselt ära kasutada.

Ideaalne:

  • Ühekordsed tabelite ekspordid — finantsaruanded, valitsuse andmekogud, uurimisandmebaasid, Wikipedia tabelid, spordistatistika
  • Veebirakenduste andmed — paljud CRM-platvormid, analüütika töölauad, ERP-süsteemid ja äriterakendustööriistad renderdavad andmeid HTML-tabelitena, mida laiendus suudab tuvastada
  • Korduvad ekspordid — salvesta oma puhastusreeglid ja veergude konfiguratsioon profiilina ning kasuta seda uuesti iga kord, kui samast allikast ekspordid
  • Privaatsustundlikud keskkonnad — kogu töötlemine on lokaalne, mis teeb selle sobivaks ettevõtte, finants- või tervishoiukontekstides, kus andmed ei tohi brauserist lahkuda
  • Puhastamist vajavad andmed — kuupäevad, numbrid, valuutad ja tühjad väärtused normaliseeritakse automaatselt enne eksportimist

Pole mõeldud:

  • Automatiseeritud või ajastatud skreepimine — see on manuaalne ja interaktiivne tööriist. Kui vajad headless-skreeprit või cron-põhist torustikku, kaalu tööriistu nagu Scrapy, Puppeteer või Playwright
  • Mittetabeli andmed — laiendus tuvastab HTML <table> elemente. Kaardid, loendid, vood ja struktureerimata paigutused pole toetatud
  • Andmetele juurdepääs API kaudu — kui vajalikud andmed on saadaval API kaudu, on selle otsene kasutamine usaldusväärsem kui renderdatud lehelt ekstraheerimine
  • Garanteeritud ühilduvus kõigi saitidega — veebist tabelite struktuurid varieeruvad laialdaselt. Laiendus töötab standardsete HTML-tabelite ja paljude keeruliste veebirakendustega, kuid mõned saidid kasutavad mittestandardset renderdamist, mis ei pruugi olla täielikult ühilduv
Proovi enne ostmist

Tasuta versioonil pole ridade piirangut ja see töötab enamiku tabelitega. Paigalda ja proovi oma konkreetsel saidil enne PRO kaalumist.

Paigaldamine

  1. Külasta Chrome Web Store'i

    Ava HTML Table Exporteri leht oma Chrome'i brauseris.

  2. Klõpsa "Lisa Chrome'i"

    Klõpsa sinisel nupul ja kinnita hüpikaknas. Paigaldamine võtab umbes 3 sekundit.

  3. Kinnita laiendus (valikuline)

    Klõpsa pusletüki ikoonil Chrome'i tööriistaribal ja kinnita HTML Table Exporter kiireks juurdepääsuks.

Õigused

Laiendus küsib õigust "Lugeda ja muuta kõiki sinu andmeid veebisaitidel". See on vajalik tabelite tuvastamiseks, kuid pea meeles, et kogu töötlemine on lokaalne ja me ei edasta kunagi mingeid andmeid.

Litsentsi aktiveerimine

Pärast HTML Table Exporter PRO ostmist saad litsentsivõtme e-posti teel. Järgi neid samme, et avada kõik PRO funktsioonid.

Ühekordne aktiveerimine

Sinu litsents valideeritakse aktiveerimise ajal ja salvestatakse lokaalselt vahemällu. Litsentsi oleku uuesti kontrollimiseks on perioodiliselt vaja internetiühendust, tagades katkematu teenuse.

Kuidas aktiveerida PRO

  1. Klõpsa laienduses "Aktiveeri"

    Ava laienduse hüpikaken ja klõpsa paremas ülanurgas nupul "Aktiveeri". Tasuta versiooni allosas näed ka PRO funktsioonide loendit.

  2. Sisesta oma litsentsivõti

    Kleebi oma litsentsivõti formaadis XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX ja klõpsa "Aktiveeri". Võti saadeti sinu e-postile pärast ostu.

  3. Alusta PRO funktsioonide kasutamist

    Pärast aktiveerimist näitab laiendus "HTML Table Exporter PRO" koos Ajaloo nupuga. Kõik PRO funktsioonid on nüüd avatud.

Visuaalne juhend

1 Klõpsa nupul "Aktiveeri"
HTML Table Exporteri tasuta versioon, mis näitab Aktiveeri nuppu ja PRO funktsioonide loendit

Klõpsa paremas ülanurgas nupul "Aktiveeri". Tasuta versioon näitab, millised funktsioonid PRO-ga avatakse.

2 Sisesta oma litsents
Litsentsi aktiveerimise modaal litsentsivõtme sisestamise väljaga

Kleebi oma litsentsivõti ja klõpsa "Aktiveeri". Kui sul pole veel võtit, klõpsa "Hangi HTML Table Exporter PRO".

Litsentsi probleemide lahendamine

"Vigane litsentsivõti"

Veendu, et kopeerid kogu litsentsivõtme koos kõigi sidekriipsudega. Formaat peab olema XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX. Kontrolli, et võtme ees ega järel poleks lisatühikuid.

Ma ei saanud litsentsivõtit

Kontrolli oma rämpsposti kausta. E-kiri tuleb Lemon Squeezy'lt (meie maksete töötleja). Kui sa ikka ei leia, külasta Tugi lehte oma tellimuse numbriga.

Pean litsentsi teise seadmesse üle kandma

Iga litsentsivõti kehtib ainult ühele seadmele. Kui vajad PRO-d lisakseadmetes, saad osta lisalitsentsid või kaaluda meie MEESKOND või ÄRIKLIENT plaane.

Pole veel litsentsi?

Hangi HTML Table Exporter PRO 14-päevase raha tagasi garantiiga. Vaata hinnavõimalusi →

Kiirstart

Ekspordi oma esimene tabel alla 60 sekundiga:

Kuidas tabeleid eksportida

Nutikas valik (kiireim meetod)

See lähenemine säästab aega, võimaldades valida sihtandmed otse. Lihtsalt klõpsa veebilehel mis tahes tabeli sees ja seejärel ava HTML Table Exporter PRO laienduse ikoon. Laiendus tõstab automaatselt esile ja fokusseerib sellele konkreetsele tabelile, võimaldades seda koheselt eksportida ilma teiste tuvastatud tulemuste vahel otsimata.

Paindlikud ekspordiformaadid

Iga tuvastatud tabeli saab eksportida mitmesse professionaalsesse formaati, klõpsates tabeli kaardil vastavat nuppu:

  • Excel (XLSX) — Ideaalne süvaandmeanalüüsiks
  • CSV — Ideaalne üldiseks kasutamiseks tabelarvutuses
  • JSON või NDJSON — Ideaalne veebiarenduseks ja NoSQL andmebaasidele
  • SQL — Genereerib INSERT laused, mis on valmis andmebaasides kasutamiseks

Hulgi allalaadimine

Kasutajatele, kes soovivad kõik tabelid korraga ekstraheerida, on saadaval hulgi allalaadimine. Selleks leia ZIP-formaadi rippmenüü ja vali oma eelistatud formaat (nagu CSV või JSON) paketi failide jaoks. Klõpsates "Ekspordi kõik tabelid (ZIP)", laaditakse kõik lehe tabelid korrastatult paketti alla.

Väljundi näide (CSV)
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%

Ekspordiformaadid

HTML Table Exporter toetab viit väljundformaati, igaüks optimeeritud erinevateks kasutusjuhtudeks.

CSV (komaeraldusega väärtused)

Universaalne formaat. Töötab Excel, Google Sheets, andmebaasidega ja praktiliselt iga andmetööriistaga. PRO kasutajad saavad kohandada eraldajat (koma, semikoolon, tabeldusmärk) piirkondliku ühilduvuse jaoks.

CSV
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending

JSON (JavaScript Object Notation)

Ideaalne arendajatele ja API-dele. Iga rida teisendatakse objektiks, kus veergude päised on võtmed.

JSON
[
  {
    "Name": "John Doe",
    "Email": "[email protected]",
    "Status": "Active"
  }
]

Excel (XLSX)

Exceli natiivformaat õigete lahtritüüpidega. Numbrid on numbrid, kuupäevad on kuupäevad.

NDJSON (reavahedega eraldatud JSON)

Ideaalne voogedastuse andmetöötluseks ja NoSQL andmebaasidele. Iga rida on eraldi JSON-objekt, mis teeb selle ideaalseks suurte andmekogude ja logide töötlemiseks.

NDJSON
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}

SQL (INSERT laused)

Genereerib INSERT laused, mis on valmis otse andmebaasidesse importimiseks. Ideaalne MySQL, PostgreSQL, SQLite ja teiste SQL-andmebaaside jaoks.

SQL
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
PRO funktsioon: NDJSON ja SQL

PRO lisab NDJSON ja SQL ekspordiformaadid. Partii ZIP sisaldab kõiki formaate korraga.

Andmete puhastamine

Veebiandmed on segased: valuutasümbolid, ebajärjekindlad kuupäevaformaadid, peidetud märgid — need rikuvad analüüsi ja importi. HTML Table Exporter puhastab su andmed automaatselt.

Automaatne puhastamine (Tasuta)

  • Eemaldab kõigist lahtritest tühikud
  • Eemaldab peidetud Unicode'i märgid
  • Normaliseerib reapiire
  • Säilitab ühendatud lahtrite struktuuri

Nutikad puhastusprofiilid (PRO)

PRO sisaldab eelehitatud puhastusprofiile levinud andmetüüpide jaoks:

Valuutaprofiil

Eemaldab sümbolid $, , £ ja tuhandete eraldajad. Teisendab $1,234.56 väärtuseks 1234.56.

Protsendiprofiil

Eemaldab sümboli %. Teisendab 45.5% väärtuseks 0.455 või 45.5.

Kuupäevaprofiil

Standardiseerib kuupäevad ISO formaati. Teisendab Jan 15, 2024 väärtuseks 2024-01-15.

Enne vs Pärast
// Raw data from website
"  $1,234.56  ", "Jan 15, 2024", "45.5%"

// After cleaning profiles
1234.56, "2024-01-15", 0.455

Partii eksport

Kui lehel on mitu tabelit (või vajad mitut formaati), säästab partii eksport tunde.

Funktsioon PRO

Partii eksport on saadaval ainult PRO kasutajatele.

Ekspordi kõik tabelid

Klõpsa laienduse hüpikaknas "Ekspordi kõik". Iga tabel teisendatakse eraldi failiks.

ZIP allalaadimine

Saa üks ZIP-fail kõigi tabelitega sinu valitud formaadis.

ZIP struktuur
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv

Keerulised tabelid

Pärismaailma tabelid on harva lihtsad ruudustikud. HTML Table Exporter käsitleb keerukust, mis lõhub teisi tööriistu.

Ühendatud lahtrid (Rowspan/Colspan)

Kui lahtrid ulatuvad üle mitme rea või veeru, täidab eksporditud andmestik vastavad lahtrid struktuuri säilitamiseks.

Pesastatud tabelid

Tabelid tabelite sees on tavalised vanadel veebisaitidel. Hõljumise esiletõstmine aitab sul enne eksportimist kontrollida.

Dünaamilised/JavaScripti tabelid

Paljud kaasaegsed veebirakendused renderdavad tabeleid JavaScripti raamistike abil. Kui tabel on sinu brauseris nähtav, suudab laiendus seda tavaliselt tuvastada. Tulemused võivad siiski varieeruda sõltuvalt sellest, kuidas sait oma DOM-i struktureerib — mõned rakendused kasutavad mittestandardseid elemente, mida ei pruugita tabelitena ära tunda.

Viivitatud laadimisega tabelid

Mõned saidid laadivad tabeli ridu kerimise käigus. Keri esmalt lõpuni, et tagada kõigi andmete laadimine.

Kerimise jäädvustamine (PRO)

Kerimise jäädvustamine on PRO funktsioon, mis on loodud lehekülgedeks jagatud ja virtualiseeritud tabelite jaoks, mis näitavad korraga ainult ridade alamhulka. See töötab jäädvustades nähtavaid ridu tabeli kerimisel, kogudes ja deduplitseerides need täielikuks andmestikuks.

Kuidas see töötab: Aktiveerid Kerimise jäädvustamise ja seejärel kerid tabelit oma tempos. Laiendus loeb ridu, mis on sel hetkel brauseri DOM-is renderdatud — see ei tee täiendavaid võrgupäringuid, ei simuleeri klõpse ega suhtle lehekülgede juhtseadmetega. Kui oled vajalikud andmed läbi kerinud, peatad jäädvustamise ja ekspordid kogutud andmestiku.

Peamised erinevused auto-lehekülgede tööriistadest: Erinevalt brauserilaiendusest, mis klõpsavad automaatselt "Järgmine leht" nuppudel või simuleerivad lõpmatut kerimist, on Kerimise jäädvustamine passiivne lugeja. See jälgib, mida sinu brauser on juba renderdanud, ilma lehe navigeerimist või serveripäringuid käivitamata. See teeb selle vähem altiks kiirusepiirangute või robotivastaste kaitsemehhanismide aktiveerimisele ja töötab virtualiseeritud ruudustikega, mis asendavad DOM-i sõlmi kerimise ajal.

Ühilduvus

Kerimise jäädvustamine töötab paljude lehekülgedeks jagatud ja virtualiseeritud tabelitega, kuid tulemused sõltuvad iga veebisaidi konkreetsest rakendusest. Kõik tabelite formaadid pole ühilduvad. Soovitame esmalt proovida tasuta versiooni, et kinnitada põhiline tabelite tuvastamine sinu sihtveebisaidil.

Võrdlus Tasuta vs PRO

Tasuta versioon on tõeliselt kasulik, ilma kunstlike piiranguteta. PRO lisab täiustatud funktsioone sagedastele kasutajatele.

Funktsioon Tasuta PRO
CSV eksport
JSON eksport
Excel eksport
NDJSON eksport
SQL eksport
Automaatne tabelite tuvastamine
Ühendatud lahtrite käsitlemine
ZIP allalaadimine (kõik tabelid) Ainult CSV Mitu formaati
Eelseadistatud profiilid (Pandas, DuckDB jne)
Puhastusseaded (numbrid, kuupäevad, tühjad)
Veergude valimine ja ümberjärjestamine
Ekspordiajalugu
Korda viimast eksporti
Eelvaade hõljumisel
100% lokaalne töötlemine

Probleemide lahendamine

"Tabeleid ei tuvastatud"

Mõned saidid kasutavad <div> paigutusi, mis näevad välja nagu tabelid, kuid pole semantilised HTML-tabelid. Laiendus tuvastab peamiselt <table> elemente ja ühildub ka mõnede JavaScriptil põhinevate võrgukomponentidega. Veendu, et leht on enne eksportimist täielikult laaditud.

Ekspordist puuduvad andmed

Kontrolli, kas tabel kasutab viivitatud laadimist. Keri esmalt kogu tabel läbi, seejärel ekspordi.

Ekspordil on vale kodeering

Laiendus kasutab UTF-8 kodeeringut. Kui näed Excelis loetamatuid märke, kasuta importimiseks Andmed → Tekstist/CSV-st.

Laiendus ei tööta saidil

Mõned saidid (nagu Chrome Web Store ise) blokeerivad turvalisuse tõttu laiendused. See on Chrome'i piirang. Kui arvad, et laiendus peaks konkreetsel saidil töötama, kuid ei tööta, või märkad ekstraheerimisvigu, teata sellest meie Tugivormi kaudu, et saaksime uurida.

Ikka lahendamata?

Külasta meie tugilehte ja täida veavõrm. Tugiteenust pakutakse isiklikult ja vastused võivad võtta kuni 10 tööpäeva.