Dokumentáció
Minden, ami a webes táblázatok professzionális kinyeréséhez, tisztításához és exportálásához kell. Az alapvető exportálásoktól a haladó adattisztítási munkafolyamatokig.
Bevezetés
A HTML Table Exporter egy Chrome bővítmény, amely felismeri a weboldalak táblázatait és exportálja őket a kívánt formátumba. A komplex konfigurációt igénylő web scraperekkel ellentétben ez az eszköz azonnal működik: kattints, válassz formátumot, töltsd le.
Minden feldolgozás helyileg történik a böngésződben. Az adataid soha nem hagyják el az eszközödet.
Kinek való?
- Adatelemzők akiknek pénzügyi jelentésekből, kormányzati oldalakról vagy kutatási adatbázisokból kell táblázatokat kinyerniük
- Kutatók akik strukturált adatokat gyűjtenek akadémiai forrásokból vagy Wikipédiából
- Fejlesztők akiknek gyors hozzáférés kell táblázatos adatokhoz scraper építése nélkül
- Bárki aki elege van a celláról cellára másolásból
Mikor használd a HTML Table Exportert
A HTML Table Exporter egy specifikus használati esetkörre van tervezve. Ha megérted, hol ragyog — és hol lehetnek más eszközök megfelelőbbek — a legtöbbet hozhatod ki belőle.
Ideális a következőkre
- Egyszeri táblázatexportálások — pénzügyi jelentések, kormányzati adatkészletek, kutatási adatbázisok, Wikipédia táblázatok, sportstatisztikák
- Webalkalmazások adatai — sok CRM platform, analitikai irányítópult, ERP rendszer és vállalati eszköz HTML táblázatként jeleníti meg az adatokat, amelyeket a bővítmény felismerhet
- Visszatérő exportálások — mentsd el a tisztítási szabályaidat és oszlopkonfigurációdat profilként, és használd újra minden alkalommal, amikor ugyanabból a forrásból exportálsz
- Adatvédelmi szempontból érzékeny környezetek — minden feldolgozás helyi, ami alkalmassá teszi vállalati, pénzügyi vagy egészségügyi kontextusokhoz, ahol az adatok nem hagyhatják el a böngészőt
- Tisztítást igénylő adatok — a dátumok, számok, pénznemek és null értékek automatikusan normalizálódnak exportálás előtt
Nem a következőkre tervezve
- Automatizált vagy ütemezett scraping — ez egy kézi, interaktív eszköz. Ha headless scraperre vagy cron-alapú pipeline-ra van szükséged, fontold meg az olyan eszközöket, mint a Scrapy, Puppeteer vagy Playwright
- Nem táblázatos adatok — a bővítmény HTML
<table>elemeket ismer fel. Kártyák, listák, feedek és strukturálatlan elrendezések nem támogatottak - Adathozzáférés API-n keresztül — ha a szükséges adatok elérhetők API-n keresztül, annak közvetlen használata megbízhatóbb lesz, mint a renderelt oldalról való kinyerés
- Garantált kompatibilitás minden oldallal — a webes táblázatszerkezetek széles skálán mozognak. A bővítmény működik szabványos HTML táblázatokkal és sok összetett webalkalmazással, de néhány oldal nem szabványos renderelést használ, amely nem feltétlenül lesz teljesen kompatibilis
Az ingyenes verziónak nincs sorkészlete, és a legtöbb táblázattal működik. Telepítsd és próbáld ki a konkrét oldalon, mielőtt PRO-ra gondolnál.
Telepítés
-
Látogasd meg a Chrome Web Store-t
Nyisd meg a HTML Table Exporter oldalát a Chrome böngésződben.
-
Kattints a "Hozzáadás a Chrome-hoz" gombra
Kattints a kék gombra és erősítsd meg a felugró ablakban. A telepítés körülbelül 3 másodpercet vesz igénybe.
-
Rögzítsd a bővítményt (opcionális)
Kattints a puzzle ikonra a Chrome eszköztárán, és rögzítsd a HTML Table Exportert a gyors hozzáféréshez.
A bővítmény "Összes adatod olvasása és módosítása webhelyeken" engedélyt kér. Ez szükséges a táblázatok felismeréséhez, de ne feledd, hogy minden feldolgozás helyi, és soha nem továbbítunk semmilyen adatot.
Licenc aktiválás
A HTML Table Exporter PRO megvásárlása után e-mailben kapni fogsz egy licenckulcsot. Kövesd ezeket a lépéseket az összes PRO funkció feloldásához.
A licenced az aktiválás során kerül ellenőrzésre és helyileg tárolódik. Időszakos internetkapcsolat szükséges a licenc állapotának újraellenőrzéséhez, biztosítva a zavartalan szolgáltatást.
Hogyan aktiváld a PRO-t
-
Kattints az "Aktiválás" gombra a bővítményben
Nyisd meg a bővítmény felugró ablakát és kattints az "Aktiválás" gombra a jobb felső sarokban. A PRO funkciókat az ingyenes verzió alján is láthatod felsorolva.
-
Add meg a licenckulcsodat
Illeszd be a licenckulcsodat
XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXXformátumban és kattints az "Aktiválás" gombra. A kulcsot a vásárlás után e-mailben kaptad. -
Kezdd el használni a PRO funkciókat
Az aktiválás után a bővítmény "HTML Table Exporter PRO" feliratot mutat egy Előzmények gombbal. Minden PRO funkció most már feloldott.
Vizuális útmutató
Kattints az "Aktiválás" gombra a jobb felső sarokban. Az ingyenes verzió megmutatja, mely funkciókat oldod fel a PRO-val.
Illeszd be a licenckulcsodat és kattints az "Aktiválás" gombra. Ha még nincs kulcsod, kattints a "Szerezd be a HTML Table Exporter PRO-t" gombra.
Licencproblémák megoldása
"Érvénytelen licenckulcs"
Győződj meg róla, hogy a teljes licenckulcsot másoltad, beleértve az összes kötőjelet. A formátumnak XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX kell lennie. Ellenőrizd, hogy nincs extra szóköz a kulcs előtt vagy után.
Nem kaptam meg a licenckulcsot
Ellenőrizd a spam mappádat. Az e-mail a Lemon Squeezy-től érkezik (a fizetési szolgáltatónktól). Ha még mindig nem találod, látogasd meg a Támogatás oldalt a rendelési számoddal.
Át kell vinnem a licencet egy másik eszközre
Minden licenckulcs egyetlen eszközre érvényes. Ha további eszközökön kell használnod a PRO-t, további licenceket vásárolhatsz, vagy fontold meg a TEAM vagy BUSINESS csomagjainkat.
Szerezd be a HTML Table Exporter PRO-t 14 napos pénzvisszafizetési garanciával. Árazási lehetőségek megtekintése →
Gyors kezdés
Exportáld az első táblázatodat 60 másodperc alatt:
Hogyan exportálj táblázatokat
Intelligens kiválasztás (leggyorsabb módszer)
Ez a megközelítés időt takarít meg, lehetővé téve a céladatok közvetlen kiválasztását. Egyszerűen kattints bárhová egy táblázatban a weboldalon, majd nyisd meg a HTML Table Exporter PRO bővítmény ikonját. A bővítmény automatikusan kiemeli és arra a táblázatra fókuszál, lehetővé téve az azonnali exportálást anélkül, hogy más felismert eredmények között kellene keresgélned.
Rugalmas exportálási formátumok
Minden felismert táblázat exportálható többféle professzionális formátumban a táblázatkártyán lévő megfelelő gombra kattintva:
- Excel (XLSX) — Ideális mélyreható adatelemzéshez
- CSV — Tökéletes általános táblázatkezelő használathoz
- JSON vagy NDJSON — Ideális webfejlesztéshez és NoSQL adatbázisokhoz
- SQL — Azonnal használható INSERT utasításokat generál adatbázisokhoz
Tömeges letöltés
Azoknak a felhasználóknak, akik egyszerre szeretnék kinyerni az összes táblázatot, elérhető a tömeges letöltés. Ehhez keresd meg a ZIP formátum legördülő menüt, és válaszd ki a kívánt formátumot (például CSV vagy JSON) a csomagban lévő fájlokhoz. Az "Összes táblázat exportálása (ZIP)" gombra kattintva az oldal összes táblázata letöltődik egy rendezett csomagban.
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%
Exportálási formátumok
A HTML Table Exporter öt kimeneti formátumot támogat, mindegyik különböző használati esetekre optimalizálva.
CSV (vesszővel elválasztott értékek)
Az univerzális formátum. Működik Excellel, Google Sheets-szel, adatbázisokkal és gyakorlatilag bármilyen adateszközzel. A PRO felhasználók testreszabhatják az elválasztót (vessző, pontosvessző, tabulátor) a regionális kompatibilitáshoz.
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending
JSON (JavaScript Object Notation)
Tökéletes fejlesztőknek és API-khoz. Minden sor objektummá alakul az oszlopfejlécekkel mint kulcsokkal.
[
{
"Name": "John Doe",
"Email": "[email protected]",
"Status": "Active"
}
]
Excel (XLSX)
Natív Excel formátum helyes cellatípusokkal. A számok számok, a dátumok dátumok.
NDJSON (újsorral elválasztott JSON)
Tökéletes streaming adatfeldolgozáshoz és NoSQL adatbázisokhoz. Minden sor külön JSON objektum, ami ideálissá teszi nagy adatkészletekhez és naplófeldolgozáshoz.
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}
SQL (INSERT utasítások)
Azonnal importálható INSERT utasításokat generál adatbázisokhoz. Tökéletes MySQL, PostgreSQL, SQLite és más SQL adatbázisokhoz.
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
A PRO hozzáadja a NDJSON és SQL exportálási formátumokat. A kötegelt ZIP egyszerre tartalmazza az összes formátumot.
Adattisztítás
A webes adatok rendezetlenek: pénznemszimbólumok, következetlen dátumformátumok, rejtett karakterek; ezek tönkreteszik az elemzéseket és importálásokat. A HTML Table Exporter automatikusan tisztítja az adataidat.
Automatikus tisztítás (Ingyenes)
- Eltávolítja a szóközöket minden cellából
- Eltávolítja a rejtett Unicode karaktereket
- Normalizálja a sortöréseket
- Megőrzi az egyesített cellák szerkezetét
Intelligens tisztítási profilok (PRO)
A PRO előre elkészített tisztítási profilokat tartalmaz gyakori adattípusokhoz:
Pénznem profil
Eltávolítja a $, €, £ szimbólumokat és ezres elválasztókat. A $1,234.56-ot 1234.56-ra konvertálja.
Százalék profil
Eltávolítja a % szimbólumot. A 45.5%-ot 0.455-re vagy 45.5-re konvertálja.
Dátum profil
ISO formátumra szabványosítja a dátumokat. A Jan 15, 2024-et 2024-01-15-re konvertálja.
// Raw data from website
" $1,234.56 ", "Jan 15, 2024", "45.5%"
// After cleaning profiles
1234.56, "2024-01-15", 0.455
Kötegelt exportálás
Ha egy oldalon több táblázat van (vagy több formátumra van szükséged), a kötegelt exportálás órákat takarít meg.
A kötegelt exportálás kizárólag PRO felhasználóknak érhető el.
Összes táblázat exportálása
Kattints az "Összes exportálása" gombra a bővítmény felugró ablakában. Minden táblázat külön fájllá alakul.
ZIP letöltés
Kapj egyetlen ZIP fájlt az összes táblázattal a választott formátumban.
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv
Összetett táblázatok
A valós táblázatok ritkán egyszerű rácsok. A HTML Table Exporter kezeli azt a komplexitást, ami más eszközöket megtör.
Egyesített cellák (Rowspan/Colspan)
Amikor a cellák több sort vagy oszlopot fednek le, az exportált adatok kitöltik a megfelelő cellákat a szerkezet megőrzése érdekében.
Beágyazott táblázatok
A táblázatok táblázatokon belül gyakoriak régebbi weboldalakon. Az egérrel való kiemelés segít ellenőrizni az exportálás előtt.
Dinamikus/JavaScript táblázatok
Sok modern webalkalmazás JavaScript keretrendszerekkel rendereli a táblázatokat. Ha a táblázat látható a böngésződben, a bővítmény általában képes felismerni. Az eredmények azonban változhatnak attól függően, hogyan strukturálja az oldal a DOM-ját — néhány alkalmazás nem szabványos elemeket használ, amelyek nem feltétlenül ismerhetők fel táblázatként.
Néhány oldal görgetés közben tölti be a táblázat sorait. Először görgess a végéig, hogy minden adat betöltődjön.
Görgetéses rögzítés (PRO)
A Görgetéses rögzítés egy PRO funkció, amelyet lapozott és virtualizált táblázatokhoz terveztek, amelyek egyszerre csak a sorok egy részhalmazát mutatják. A látható sorok rögzítésével működik, ahogy görgetsz a táblázatban, összegyűjtve és deduplikálva őket egy teljes adatkészletbe.
Hogyan működik: Aktiváld a Görgetéses rögzítést, majd görgess a táblázatban a saját tempódban. A bővítmény olvassa a böngésző DOM-jában éppen renderelt sorokat — nem végez extra hálózati kéréseket, nem szimulál kattintásokat, és nem interaktál lapozási vezérlőkkel. Miután végigmentél a szükséges adatokon, állítsd le a rögzítést és exportáld az összegyűjtött adatkészletet.
Fő különbségek az auto-lapozó eszközöktől: A böngészőbővítményekkel ellentétben, amelyek automatikusan kattintanak a "Következő oldal" gombokra vagy végtelen görgetést szimulálnak, a Görgetéses rögzítés passzív olvasó. Megfigyeli, amit a böngésződ már renderelt, anélkül hogy oldalnavigációt vagy szerverkéréseket aktiválna. Ez kevésbé valószínű, hogy sebességkorlátokat vagy anti-bot védelmet aktivál, és működik virtualizált rácsokkal, amelyek görgetés közben cserélik a DOM csomópontokat.
A Görgetéses rögzítés sok lapozott és virtualizált táblázattal működik, de az eredmények az egyes weboldalak konkrét implementációjától függnek. Nem minden táblázatformátum kompatibilis. Javasoljuk, hogy először próbáld ki az ingyenes verzióval, hogy megerősítsd az alapvető táblázatfelismerést a céloldalon.
Ingyenes vs PRO összehasonlítás
Az ingyenes verzió valóban hasznos, mesterséges korlátozások nélkül. A PRO haladó funkciókat ad a gyakori felhasználóknak.
| Funkció | Ingyenes | PRO |
|---|---|---|
| CSV exportálás | ✔ | ✔ |
| JSON exportálás | ✔ | ✔ |
| Excel exportálás | ✔ | ✔ |
| NDJSON exportálás | — | ✔ |
| SQL exportálás | — | ✔ |
| Automatikus táblázatfelismerés | ✔ | ✔ |
| Egyesített cellák kezelése | ✔ | ✔ |
| ZIP letöltés (összes táblázat) | Csak CSV | Több formátum |
| Előre beállított profilok (Pandas, DuckDB, stb.) | — | ✔ |
| Tisztítási előbeállítások (számok, dátumok, null értékek) | — | ✔ |
| Oszlopválasztás és átrendezés | — | ✔ |
| Exportálási előzmények | — | ✔ |
| Utolsó exportálás ismétlése | — | ✔ |
| Előnézet egérmutatóval | — | ✔ |
| 100% helyi feldolgozás | ✔ | ✔ |
Hibaelhárítás
"Nem található táblázat"
Néhány oldal <div> elrendezéseket használ, amelyek táblázatnak tűnnek, de nem szemantikus HTML táblázatok. A bővítmény elsősorban <table> elemeket ismer fel, és néhány JavaScript-alapú rács komponenssel is kompatibilis. Győződj meg róla, hogy az oldal teljesen betöltődött az exportálás előtt.
Hiányzó adatok az exportálásban
Ellenőrizd, hogy a táblázat késleltetett betöltést használ-e. Először görgess végig az egész táblázaton, majd exportálj.
Az exportálásnak helytelen a kódolása
A bővítmény UTF-8 kódolást használ. Ha olvashatatlan karaktereket látsz Excelben, használd az Adatok → Szövegből/CSV-ből importálást.
A bővítmény nem működik egy oldalon
Néhány oldal (mint maga a Chrome Web Store) biztonsági okokból blokkolja a bővítményeket. Ez a Chrome korlátozása. Ha úgy gondolod, hogy a bővítménynek működnie kellene egy adott oldalon, de nem működik, vagy ha kinyerési hibákat észlelsz, jelentsd a Támogatási űrlapunkon keresztül, hogy kivizsgálhassuk.
Látogasd meg a Támogatás oldalunkat és töltsd ki az űrlapot a hiba bejelentéséhez. A támogatást személyesen kezeljük, és a válaszok akár 10 munkanapot is igénybe vehetnek.