Τεκμηρίωση
Όλα όσα χρειάζεστε για να εξάγετε, καθαρίσετε και εξάγετε πίνακες web σαν επαγγελματίας. Από βασικές εξαγωγές έως προηγμένες ροές καθαρισμού δεδομένων.
Εισαγωγή
Το HTML Table Exporter είναι μια επέκταση Chrome που ανιχνεύει πίνακες σε ιστοσελίδες και τους εξάγει στη μορφή που προτιμάτε. Σε αντίθεση με τα web scrapers που απαιτούν πολύπλοκη διαμόρφωση, αυτό το εργαλείο λειτουργεί αμέσως: κλικ, επιλέξτε μορφή, λήψη.
Όλη η επεξεργασία γίνεται τοπικά στο πρόγραμμα περιήγησής σας. Τα δεδομένα σας δεν φεύγουν ποτέ από τη συσκευή σας.
Για ποιον είναι;
- Αναλυτές δεδομένων που χρειάζονται να εξάγουν πίνακες από οικονομικές αναφορές, κυβερνητικές ιστοσελίδες ή ερευνητικές βάσεις δεδομένων
- Ερευνητές που συλλέγουν δομημένα δεδομένα από ακαδημαϊκές πηγές ή τη Wikipedia
- Προγραμματιστές που χρειάζονται γρήγορη πρόσβαση σε πινακοποιημένα δεδομένα χωρίς να χτίσουν scraper
- Οποιοσδήποτε έχει κουραστεί να αντιγράφει και να επικολλά πίνακες κελί-κελί
Πότε να χρησιμοποιήσετε το HTML Table Exporter
Το HTML Table Exporter είναι σχεδιασμένο για ένα συγκεκριμένο σύνολο περιπτώσεων χρήσης. Η κατανόηση του πού υπερέχει — και πού άλλα εργαλεία μπορεί να είναι πιο κατάλληλα — θα σας βοηθήσει να το αξιοποιήσετε στο μέγιστο.
Ιδανικό για
- Μεμονωμένες εξαγωγές πινάκων — οικονομικές αναφορές, κυβερνητικά datasets, ερευνητικές βάσεις δεδομένων, πίνακες Wikipedia, αθλητικά στατιστικά
- Δεδομένα από web εφαρμογές — πολλές πλατφόρμες CRM, dashboards αναλυτικών, συστήματα ERP και επιχειρηματικά εργαλεία αποδίδουν δεδομένα ως πίνακες HTML που η επέκταση μπορεί να ανιχνεύσει
- Επαναλαμβανόμενες εξαγωγές — αποθηκεύστε τους κανόνες καθαρισμού και τη διαμόρφωση στηλών ως προφίλ και επαναχρησιμοποιήστε το κάθε φορά που εξάγετε από την ίδια πηγή
- Περιβάλλοντα ευαίσθητα στην ιδιωτικότητα — όλη η επεξεργασία είναι τοπική, καθιστώντας το κατάλληλο για εταιρικά, οικονομικά ή υγειονομικά πλαίσια όπου τα δεδομένα δεν μπορούν να φύγουν από το πρόγραμμα περιήγησης
- Δεδομένα που χρειάζονται καθαρισμό — ημερομηνίες, αριθμοί, νομίσματα και null τιμές κανονικοποιούνται αυτόματα πριν την εξαγωγή
Δεν είναι σχεδιασμένο για
- Αυτοματοποιημένο ή προγραμματισμένο scraping — αυτό είναι ένα χειροκίνητο και διαδραστικό εργαλείο. Αν χρειάζεστε headless scraper ή pipeline βασισμένο σε cron, σκεφτείτε εργαλεία όπως Scrapy, Puppeteer ή Playwright
- Δεδομένα που δεν είναι πίνακες — η επέκταση ανιχνεύει στοιχεία HTML
<table>. Κάρτες, λίστες, feeds και μη δομημένες διατάξεις δεν υποστηρίζονται - Πρόσβαση δεδομένων μέσω API — αν τα δεδομένα που χρειάζεστε είναι διαθέσιμα μέσω API, η απευθείας χρήση του θα είναι πιο αξιόπιστη από την εξαγωγή από την αποδοθείσα σελίδα
- Εγγυημένη συμβατότητα με όλες τις ιστοσελίδες — οι δομές πινάκων web ποικίλλουν ευρέως. Η επέκταση λειτουργεί με τυπικούς πίνακες HTML και πολλές πολύπλοκες web εφαρμογές, αλλά ορισμένες ιστοσελίδες χρησιμοποιούν μη τυπική απόδοση που μπορεί να μην είναι πλήρως συμβατή
Η δωρεάν έκδοση δεν έχει όριο γραμμών και λειτουργεί με τους περισσότερους πίνακες. Εγκαταστήστε την και δοκιμάστε στη συγκεκριμένη ιστοσελίδα σας πριν εξετάσετε το PRO.
Εγκατάσταση
-
Επισκεφθείτε το Chrome Web Store
Ανοίξτε τη σελίδα του HTML Table Exporter στο πρόγραμμα περιήγησης Chrome σας.
-
Κάντε κλικ στο "Προσθήκη στο Chrome"
Κάντε κλικ στο μπλε κουμπί και επιβεβαιώστε στο popup. Η εγκατάσταση διαρκεί περίπου 3 δευτερόλεπτα.
-
Καρφιτσώστε την επέκταση (προαιρετικό)
Κάντε κλικ στο εικονίδιο παζλ στη γραμμή εργαλείων του Chrome και καρφιτσώστε το HTML Table Exporter για γρήγορη πρόσβαση.
Η επέκταση ζητά "Ανάγνωση και αλλαγή όλων των δεδομένων σας σε ιστοσελίδες". Αυτό είναι απαραίτητο για την ανίχνευση πινάκων, αλλά θυμηθείτε ότι όλη η επεξεργασία είναι τοπική και ποτέ δεν μεταδίδουμε κανένα δεδομένο.
Ενεργοποίηση άδειας
Μετά την αγορά του HTML Table Exporter PRO, θα λάβετε ένα κλειδί άδειας μέσω email. Ακολουθήστε αυτά τα βήματα για να ξεκλειδώσετε όλα τα χαρακτηριστικά PRO.
Η άδειά σας επικυρώνεται κατά την ενεργοποίηση και αποθηκεύεται τοπικά. Απαιτείται περιοδική πρόσβαση στο internet για επανεπαλήθευση της κατάστασης της άδειας, διασφαλίζοντας αδιάκοπη υπηρεσία.
Πώς να ενεργοποιήσετε το PRO
-
Κάντε κλικ στο "Ενεργοποίηση" στην επέκταση
Ανοίξτε το popup της επέκτασης και κάντε κλικ στο κουμπί "Ενεργοποίηση" στην επάνω δεξιά γωνία. Θα δείτε επίσης τα χαρακτηριστικά PRO να αναφέρονται στο κάτω μέρος της δωρεάν έκδοσης.
-
Εισαγάγετε το κλειδί άδειας σας
Επικολλήστε το κλειδί άδειας σας στη μορφή
XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXXκαι κάντε κλικ στο "Ενεργοποίηση". Το κλειδί στάλθηκε στο email σας μετά την αγορά. -
Ξεκινήστε να χρησιμοποιείτε τα χαρακτηριστικά PRO
Μόλις ενεργοποιηθεί, η επέκταση θα εμφανίζει "HTML Table Exporter PRO" με ένα κουμπί Ιστορικού. Όλα τα χαρακτηριστικά PRO είναι τώρα ξεκλειδωμένα.
Οπτικός οδηγός
Κάντε κλικ στο κουμπί "Ενεργοποίηση" στην επάνω δεξιά γωνία. Η δωρεάν έκδοση δείχνει ποια χαρακτηριστικά ξεκλειδώνετε με το PRO.
Επικολλήστε το κλειδί άδειας σας και κάντε κλικ στο "Ενεργοποίηση". Αν δεν έχετε ακόμα κλειδί, κάντε κλικ στο "Get HTML Table Exporter PRO".
Αντιμετώπιση προβλημάτων άδειας
"Μη έγκυρο κλειδί άδειας"
Βεβαιωθείτε ότι αντιγράφετε ολόκληρο το κλειδί άδειας συμπεριλαμβανομένων όλων των παύλων. Η μορφή πρέπει να είναι XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX. Ελέγξτε ότι δεν υπάρχουν επιπλέον κενά πριν ή μετά το κλειδί.
Δεν έλαβα το κλειδί άδειας
Ελέγξτε τον φάκελο spam σας. Το email έρχεται από τη Lemon Squeezy (τον επεξεργαστή πληρωμών μας). Αν ακόμα δεν το βρίσκετε, επισκεφθείτε τη σελίδα Υποστήριξης με τον αριθμό παραγγελίας σας.
Χρειάζομαι να μεταφέρω την άδεια σε άλλη συσκευή
Κάθε κλειδί άδειας είναι έγκυρο για μία μόνο συσκευή. Αν χρειάζεστε να χρησιμοποιήσετε το PRO σε επιπλέον συσκευές, μπορείτε να αγοράσετε επιπλέον άδειες ή να εξετάσετε τα πακέτα TEAM ή BUSINESS μας.
Αποκτήστε το HTML Table Exporter PRO με εγγύηση επιστροφής χρημάτων 14 ημερών. Δείτε επιλογές τιμών →
Γρήγορη εκκίνηση
Εξαγωγή του πρώτου σας πίνακα σε λιγότερο από 60 δευτερόλεπτα:
Πώς να εξάγετε πίνακες
Έξυπνη επιλογή (γρηγορότερη μέθοδος)
Αυτή η προσέγγιση εξοικονομεί χρόνο επιτρέποντάς σας να επιλέξετε τα δεδομένα στόχο απευθείας. Απλά κάντε κλικ οπουδήποτε σε έναν πίνακα στην ιστοσελίδα και μετά ανοίξτε το εικονίδιο της επέκτασης HTML Table Exporter PRO. Η επέκταση επισημαίνει αυτόματα και εστιάζει σε αυτόν τον συγκεκριμένο πίνακα, επιτρέποντάς σας να τον εξάγετε αμέσως χωρίς να χρειάζεται να ψάχνετε μεταξύ άλλων ανιχνευμένων αποτελεσμάτων.
Ευέλικτες μορφές εξαγωγής
Κάθε ανιχνευμένος πίνακας μπορεί να εξαχθεί σε διάφορες επαγγελματικές μορφές κάνοντας κλικ στο αντίστοιχο κουμπί στην κάρτα πίνακα:
- Excel (XLSX) — Ιδανικό για εις βάθος ανάλυση δεδομένων
- CSV — Τέλειο για γενική χρήση σε υπολογιστικά φύλλα
- JSON ή NDJSON — Ιδανικό για web development και NoSQL βάσεις δεδομένων
- SQL — Δημιουργεί εντολές INSERT έτοιμες για χρήση σε βάσεις δεδομένων
Μαζική λήψη
Για χρήστες που θέλουν να εξάγουν όλους τους πίνακες ταυτόχρονα, η μαζική λήψη είναι διαθέσιμη. Για αυτό, εντοπίστε το αναπτυσσόμενο μενού μορφής ZIP και επιλέξτε την προτιμώμενη μορφή σας (όπως CSV ή JSON) για τα αρχεία μέσα στο πακέτο. Κάνοντας κλικ στο "Export all tables (ZIP)", όλοι οι πίνακες της σελίδας κατεβαίνουν μαζί σε ένα οργανωμένο πακέτο.
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%
Μορφές εξαγωγής
Το HTML Table Exporter υποστηρίζει πέντε μορφές εξόδου, η καθεμία βελτιστοποιημένη για διαφορετικές περιπτώσεις χρήσης.
CSV (Τιμές Διαχωρισμένες με Κόμμα)
Η παγκόσμια μορφή. Λειτουργεί με Excel, Google Sheets, βάσεις δεδομένων και σχεδόν οποιοδήποτε εργαλείο δεδομένων. Οι χρήστες PRO μπορούν να προσαρμόσουν τον διαχωριστή (κόμμα, ελληνικό ερωτηματικό, tab) για περιφερειακή συμβατότητα.
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending
JSON (JavaScript Object Notation)
Τέλειο για προγραμματιστές και APIs. Κάθε γραμμή μετατρέπεται σε αντικείμενο με τις επικεφαλίδες στηλών ως κλειδιά.
[
{
"Name": "John Doe",
"Email": "[email protected]",
"Status": "Active"
}
]
Excel (XLSX)
Εγγενής μορφή Excel με σωστούς τύπους κελιών. Οι αριθμοί είναι αριθμοί, οι ημερομηνίες είναι ημερομηνίες.
NDJSON (JSON με Διαχωρισμό Νέας Γραμμής)
Τέλειο για επεξεργασία δεδομένων streaming και βάσεις δεδομένων NoSQL. Κάθε γραμμή είναι ένα ξεχωριστό αντικείμενο JSON, καθιστώντας το ιδανικό για μεγάλα datasets και επεξεργασία logs.
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}
SQL (Εντολές INSERT)
Δημιουργεί εντολές INSERT έτοιμες για άμεση εισαγωγή σε βάσεις δεδομένων. Τέλειο για MySQL, PostgreSQL, SQLite και άλλες SQL βάσεις.
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
Το PRO προσθέτει μορφές εξαγωγής NDJSON και SQL. Το μαζικό ZIP περιλαμβάνει όλες τις μορφές ταυτόχρονα.
Καθαρισμός δεδομένων
Τα web δεδομένα είναι ακατάστατα: σύμβολα νομισμάτων, ασυνεπείς μορφές ημερομηνίας, κρυφοί χαρακτήρες· αυτά χαλάνε αναλύσεις και εισαγωγές. Το HTML Table Exporter καθαρίζει τα δεδομένα σας αυτόματα.
Αυτόματος καθαρισμός (Δωρεάν)
- Αφαίρεση κενών από όλα τα κελιά
- Αφαίρεση κρυφών χαρακτήρων Unicode
- Κανονικοποίηση αλλαγών γραμμής
- Διατήρηση δομής συγχωνευμένων κελιών
Έξυπνα προφίλ καθαρισμού (PRO)
Το PRO περιλαμβάνει προκατασκευασμένα προφίλ καθαρισμού για κοινούς τύπους δεδομένων:
Προφίλ νομίσματος
Αφαίρεση συμβόλων $, €, £ και διαχωριστών χιλιάδων. Μετατροπή $1,234.56 σε 1234.56.
Προφίλ ποσοστού
Αφαίρεση του συμβόλου %. Μετατροπή 45.5% σε 0.455 ή 45.5.
Προφίλ ημερομηνίας
Τυποποίηση ημερομηνιών σε μορφή ISO. Μετατροπή Jan 15, 2024 σε 2024-01-15.
// Raw data from website
" $1,234.56 ", "Jan 15, 2024", "45.5%"
// After cleaning profiles
1234.56, "2024-01-15", 0.455
Μαζική εξαγωγή
Όταν μια σελίδα έχει πολλαπλούς πίνακες (ή χρειάζεστε πολλαπλές μορφές), η μαζική εξαγωγή εξοικονομεί ώρες.
Η μαζική εξαγωγή είναι διαθέσιμη αποκλειστικά για χρήστες PRO.
Εξαγωγή όλων των πινάκων
Κάντε κλικ στο "Export All" στο popup της επέκτασης. Κάθε πίνακας μετατρέπεται σε ξεχωριστό αρχείο.
Λήψη ZIP
Λάβετε ένα μόνο ZIP με όλους τους πίνακες στη μορφή που επιλέγετε.
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv
Πολύπλοκοι πίνακες
Οι πίνακες του πραγματικού κόσμου σπάνια είναι απλά grids. Το HTML Table Exporter χειρίζεται την πολυπλοκότητα που χαλάει άλλα εργαλεία.
Συγχωνευμένα κελιά (Rowspan/Colspan)
Όταν τα κελιά εκτείνονται σε πολλαπλές γραμμές ή στήλες, τα εξαγόμενα δεδομένα συμπληρώνουν τα αντίστοιχα κελιά για τη διατήρηση της δομής.
Ενσωματωμένοι πίνακες
Οι πίνακες μέσα σε πίνακες είναι συνηθισμένοι σε παλαιότερες ιστοσελίδες. Η επισήμανση με hover σας βοηθά να επαληθεύσετε πριν την εξαγωγή.
Δυναμικοί/JavaScript πίνακες
Πολλές σύγχρονες web εφαρμογές αποδίδουν πίνακες χρησιμοποιώντας JavaScript frameworks. Αν ο πίνακας είναι ορατός στο πρόγραμμα περιήγησής σας, η επέκταση συνήθως μπορεί να τον ανιχνεύσει. Ωστόσο, τα αποτελέσματα μπορεί να ποικίλλουν ανάλογα με το πώς η ιστοσελίδα δομεί το DOM της — ορισμένες εφαρμογές χρησιμοποιούν μη τυπικά στοιχεία που μπορεί να μην αναγνωρίζονται ως πίνακες.
Ορισμένες ιστοσελίδες φορτώνουν τις γραμμές του πίνακα καθώς κυλάτε. Κυλήστε μέχρι το τέλος πρώτα για να διασφαλίσετε ότι φορτώνονται όλα τα δεδομένα.
Scroll Capture (PRO)
Το Scroll Capture είναι ένα χαρακτηριστικό PRO σχεδιασμένο για σελιδοποιημένους και εικονικοποιημένους πίνακες που εμφανίζουν μόνο ένα υποσύνολο γραμμών τη φορά. Λειτουργεί καταγράφοντας τις ορατές γραμμές καθώς κυλάτε τον πίνακα, συσσωρεύοντάς τες και αποδιπλασιάζοντάς τες σε ένα πλήρες dataset.
Πώς λειτουργεί: Ενεργοποιείτε το Scroll Capture και μετά κυλάτε τον πίνακα με τον δικό σας ρυθμό. Η επέκταση διαβάζει τις γραμμές που είναι αποδοθείσες στο DOM του browser εκείνη τη στιγμή — δεν κάνει επιπλέον αιτήματα δικτύου, δεν προσομοιώνει κλικ ούτε αλληλεπιδρά με χειριστήρια σελιδοποίησης. Μόλις έχετε περιηγηθεί στα δεδομένα που χρειάζεστε, σταματάτε την καταγραφή και εξάγετε το συσσωρευμένο dataset.
Βασικές διαφορές από εργαλεία αυτόματης σελιδοποίησης: Σε αντίθεση με επεκτάσεις browser που κάνουν αυτόματα κλικ σε κουμπιά "Επόμενη σελίδα" ή προσομοιώνουν άπειρο scroll, το Scroll Capture είναι ένας παθητικός αναγνώστης. Παρατηρεί ό,τι έχει ήδη αποδώσει το browser σας χωρίς να ενεργοποιεί πλοήγηση σελίδων ή αιτήματα διακομιστή. Αυτό το καθιστά λιγότερο πιθανό να ενεργοποιήσει όρια ταχύτητας ή προστασίες anti-bot, και λειτουργεί με εικονικοποιημένα grids που αντικαθιστούν κόμβους DOM καθώς κυλάτε.
Το Scroll Capture λειτουργεί με πολλούς σελιδοποιημένους και εικονικοποιημένους πίνακες, αλλά τα αποτελέσματα εξαρτώνται από τη συγκεκριμένη υλοποίηση κάθε ιστοσελίδας. Δεν είναι όλες οι μορφές πινάκων συμβατές. Συνιστούμε να δοκιμάσετε πρώτα με τη δωρεάν έκδοση για να επιβεβαιώσετε τη βασική ανίχνευση πινάκων στην ιστοσελίδα στόχο σας.
Σύγκριση Δωρεάν vs PRO
Η δωρεάν έκδοση είναι πραγματικά χρήσιμη, χωρίς τεχνητούς περιορισμούς. Το PRO προσθέτει προηγμένα χαρακτηριστικά για συχνούς χρήστες.
| Χαρακτηριστικό | Δωρεάν | PRO |
|---|---|---|
| Εξαγωγή CSV | ✔ | ✔ |
| Εξαγωγή JSON | ✔ | ✔ |
| Εξαγωγή Excel | ✔ | ✔ |
| Εξαγωγή NDJSON | — | ✔ |
| Εξαγωγή SQL | — | ✔ |
| Αυτόματη ανίχνευση πινάκων | ✔ | ✔ |
| Διαχείριση συγχωνευμένων κελιών | ✔ | ✔ |
| Λήψη ZIP (όλοι οι πίνακες) | Μόνο CSV | Πολλαπλές μορφές |
| Προρυθμισμένα προφίλ (Pandas, DuckDB, κλπ.) | — | ✔ |
| Προρυθμίσεις καθαρισμού (αριθμοί, ημερομηνίες, null) | — | ✔ |
| Επιλογή και αναδιάταξη στηλών | — | ✔ |
| Ιστορικό εξαγωγών | — | ✔ |
| Επανάληψη τελευταίας εξαγωγής | — | ✔ |
| Προεπισκόπηση με hover | — | ✔ |
| 100% τοπική επεξεργασία | ✔ | ✔ |
Αντιμετώπιση προβλημάτων
"Δεν ανιχνεύθηκαν πίνακες"
Ορισμένες ιστοσελίδες χρησιμοποιούν διατάξεις με <div> που μοιάζουν με πίνακες αλλά δεν είναι σημασιολογικοί HTML πίνακες. Η επέκταση ανιχνεύει κυρίως στοιχεία <table> και είναι επίσης συμβατή με ορισμένα JavaScript-based grid components. Βεβαιωθείτε ότι η σελίδα έχει φορτωθεί πλήρως πριν την εξαγωγή.
Λείπουν δεδομένα στην εξαγωγή
Ελέγξτε αν ο πίνακας χρησιμοποιεί lazy loading. Κυλήστε σε όλο τον πίνακα πρώτα, μετά εξάγετε.
Η εξαγωγή έχει λανθασμένη κωδικοποίηση
Η επέκταση χρησιμοποιεί κωδικοποίηση UTF-8. Αν βλέπετε δυσανάγνωστους χαρακτήρες στο Excel, χρησιμοποιήστε Δεδομένα → Από Κείμενο/CSV για εισαγωγή.
Η επέκταση δεν λειτουργεί σε μια ιστοσελίδα
Ορισμένες ιστοσελίδες (όπως το ίδιο το Chrome Web Store) μπλοκάρουν επεκτάσεις για λόγους ασφαλείας. Αυτός είναι ένας περιορισμός του Chrome. Αν πιστεύετε ότι η επέκταση πρέπει να λειτουργεί σε μια συγκεκριμένη ιστοσελίδα αλλά δεν λειτουργεί, ή αν παρατηρείτε σφάλματα εξαγωγής, αναφέρετέ το μέσω της Φόρμας Υποστήριξης μας ώστε να το διερευνήσουμε.
Επισκεφθείτε τη σελίδα Υποστήριξής μας και συμπληρώστε τη φόρμα για να αναφέρετε ένα bug. Η υποστήριξη παρέχεται προσωπικά και οι απαντήσεις μπορεί να καθυστερήσουν έως 10 εργάσιμες ημέρες.