दस्तावेज़ीकरण
एक प्रोफ़ेशनल की तरह वेब टेबल एक्सट्रैक्ट, क्लीन और एक्सपोर्ट करने के लिए आपको जो चाहिए वो सब। बेसिक एक्सपोर्ट से लेकर एडवांस्ड डेटा क्लीनिंग वर्कफ़्लो तक।
परिचय
HTML Table Exporter एक Chrome एक्सटेंशन है जो वेब पेजों पर टेबल डिटेक्ट करता है और उन्हें आपके पसंदीदा फ़ॉर्मेट में एक्सपोर्ट करता है। जटिल कॉन्फ़िगरेशन की ज़रूरत वाले वेब स्क्रेपर के विपरीत, यह टूल तुरंत काम करता है: क्लिक करें, फ़ॉर्मेट चुनें, डाउनलोड करें।
सारी प्रोसेसिंग आपके ब्राउज़र में लोकली होती है। आपका डेटा कभी आपके डिवाइस से बाहर नहीं जाता।
यह किसके लिए है?
- डेटा विश्लेषक जिन्हें वित्तीय रिपोर्ट, सरकारी साइटों या रिसर्च डेटाबेस से टेबल एक्सट्रैक्ट करनी होती हैं
- शोधकर्ता जो अकादमिक स्रोतों या Wikipedia से संरचित डेटा एकत्र करते हैं
- डेवलपर जिन्हें स्क्रेपर बनाए बिना टेबुलर डेटा तक त्वरित पहुँच चाहिए
- कोई भी जो सेल दर सेल टेबल कॉपी-पेस्ट करने से थक गया है
HTML Table Exporter कब उपयोग करें
HTML Table Exporter विशिष्ट उपयोग मामलों के लिए डिज़ाइन किया गया है। यह समझना कि यह कहाँ बेहतरीन है — और कहाँ अन्य टूल अधिक उपयुक्त हो सकते हैं — आपको इसका अधिकतम लाभ उठाने में मदद करेगा।
इसके लिए बेहतरीन
- एक बार की टेबल एक्सपोर्ट — वित्तीय रिपोर्ट, सरकारी डेटासेट, रिसर्च डेटाबेस, Wikipedia टेबल, खेल आँकड़े
- वेब ऐप डेटा — कई CRM प्लेटफ़ॉर्म, एनालिटिक्स डैशबोर्ड, ERP सिस्टम और एंटरप्राइज़ टूल डेटा को HTML टेबल के रूप में रेंडर करते हैं जिन्हें एक्सटेंशन डिटेक्ट कर सकता है
- रिकरिंग एक्सपोर्ट — अपने क्लीनिंग नियम और कॉलम कॉन्फ़िगरेशन को प्रोफ़ाइल के रूप में सेव करें, और जब भी उसी स्रोत से एक्सपोर्ट करें तो रीयूज़ करें
- गोपनीयता-संवेदनशील वातावरण — सारी प्रोसेसिंग लोकल है, जो इसे कॉर्पोरेट, वित्तीय या स्वास्थ्य संदर्भों के लिए उपयुक्त बनाती है जहाँ डेटा ब्राउज़र से बाहर नहीं जा सकता
- सफ़ाई की ज़रूरत वाला डेटा — तारीखें, नंबर, करेंसी और null वैल्यू एक्सपोर्ट से पहले ऑटोमैटिक नॉर्मलाइज़ होती हैं
इसके लिए डिज़ाइन नहीं किया गया
- ऑटोमेटेड या शेड्यूल्ड स्क्रेपिंग — यह एक मैन्युअल और इंटरैक्टिव टूल है। अगर आपको headless स्क्रेपर या cron-आधारित पाइपलाइन चाहिए, तो Scrapy, Puppeteer या Playwright जैसे टूल पर विचार करें
- गैर-टेबल डेटा — एक्सटेंशन HTML
<table>एलिमेंट डिटेक्ट करता है। कार्ड, लिस्ट, फ़ीड और असंरचित लेआउट सपोर्टेड नहीं हैं - API के माध्यम से डेटा एक्सेस — अगर आपको जो डेटा चाहिए वह API से उपलब्ध है, तो रेंडर किए गए पेज से एक्सट्रैक्ट करने की तुलना में सीधे API का उपयोग अधिक विश्वसनीय होगा
- सभी साइटों के साथ गारंटीड संगतता — वेब टेबल संरचनाएं व्यापक रूप से भिन्न होती हैं। एक्सटेंशन मानक HTML टेबल और कई जटिल वेब ऐप्स के साथ काम करता है, लेकिन कुछ साइटें गैर-मानक रेंडरिंग का उपयोग करती हैं जो पूरी तरह संगत नहीं हो सकती
मुफ़्त वर्शन में कोई पंक्ति सीमा नहीं है और अधिकांश टेबल के साथ काम करता है। PRO पर विचार करने से पहले इसे इंस्टॉल करें और अपनी विशिष्ट साइट पर आज़माएं।
इंस्टॉलेशन
-
Chrome Web Store पर जाएं
अपने Chrome ब्राउज़र में HTML Table Exporter पेज खोलें।
-
"Chrome में जोड़ें" पर क्लिक करें
नीले बटन पर क्लिक करें और पॉपअप में कन्फ़र्म करें। इंस्टॉलेशन लगभग 3 सेकंड लेता है।
-
एक्सटेंशन पिन करें (वैकल्पिक)
Chrome टूलबार में पज़ल आइकन पर क्लिक करें और त्वरित पहुँच के लिए HTML Table Exporter पिन करें।
एक्सटेंशन "वेबसाइटों पर आपका सारा डेटा पढ़ने और बदलने" की अनुमति माँगता है। टेबल डिटेक्ट करने के लिए यह ज़रूरी है, लेकिन याद रखें कि सारी प्रोसेसिंग लोकल है और हम कभी कोई डेटा ट्रांसमिट नहीं करते।
लाइसेंस सक्रियण
HTML Table Exporter PRO खरीदने के बाद, आपको ईमेल से एक लाइसेंस कुंजी (license key) मिलेगी। सभी PRO फ़ीचर अनलॉक करने के लिए इन चरणों का पालन करें।
सक्रियण के दौरान आपका लाइसेंस सत्यापित होता है और लोकली कैश हो जाता है। लाइसेंस स्थिति को पुनः सत्यापित करने के लिए समय-समय पर इंटरनेट एक्सेस ज़रूरी है, जिससे निर्बाध सेवा सुनिश्चित होती है।
PRO कैसे एक्टिवेट करें
-
एक्सटेंशन में "सक्रिय करें" पर क्लिक करें
एक्सटेंशन पॉपअप खोलें और ऊपरी दाएं कोने में "सक्रिय करें" बटन पर क्लिक करें। आप मुफ़्त वर्शन के नीचे PRO फ़ीचर की सूची भी देखेंगे।
-
अपनी लाइसेंस कुंजी दर्ज करें
अपनी लाइसेंस कुंजी
XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXXफ़ॉर्मेट में पेस्ट करें और "सक्रिय करें" पर क्लिक करें। लाइसेंस कुंजी खरीदारी के बाद आपके ईमेल पर भेजी गई थी। -
PRO फ़ीचर इस्तेमाल करना शुरू करें
एक्टिवेट होने के बाद, एक्सटेंशन "HTML Table Exporter PRO" दिखाएगा जिसमें History बटन होगा। सभी PRO फ़ीचर अब अनलॉक हैं।
विज़ुअल गाइड
ऊपरी दाएं कोने में "सक्रिय करें" बटन पर क्लिक करें। मुफ़्त वर्शन दिखाता है कि PRO के साथ कौन से फ़ीचर अनलॉक होते हैं।
अपनी लाइसेंस कुंजी पेस्ट करें और "सक्रिय करें" पर क्लिक करें। अगर आपके पास अभी तक लाइसेंस कुंजी नहीं है, तो "Get HTML Table Exporter PRO" पर क्लिक करें।
लाइसेंस समस्या निवारण
"अमान्य लाइसेंस कुंजी"
सुनिश्चित करें कि सभी हाइफ़न सहित पूरी लाइसेंस कुंजी कॉपी की गई है। फ़ॉर्मेट XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX होना चाहिए। जाँचें कि कुंजी के पहले या बाद में कोई अतिरिक्त स्पेस न हो।
मुझे लाइसेंस कुंजी नहीं मिली
अपना स्पैम फ़ोल्डर जाँचें। ईमेल Lemon Squeezy (हमारे पेमेंट प्रोसेसर) से आता है। अगर अभी भी नहीं मिला, तो अपने ऑर्डर नंबर के साथ सहायता पेज पर जाएं।
मुझे लाइसेंस दूसरे डिवाइस पर ट्रांसफ़र करनी है
प्रत्येक लाइसेंस कुंजी एक डिवाइस के लिए मान्य है। अगर आपको अतिरिक्त डिवाइस पर PRO इस्तेमाल करना है, तो आप अतिरिक्त लाइसेंस खरीद सकते हैं या हमारे TEAM या BUSINESS प्लान पर विचार कर सकते हैं।
14 दिन की मनी-बैक गारंटी के साथ HTML Table Exporter PRO प्राप्त करें। मूल्य विकल्प देखें →
क्विक स्टार्ट
60 सेकंड से कम में अपनी पहली टेबल एक्सपोर्ट करें:
टेबल कैसे एक्सपोर्ट करें
स्मार्ट सेलेक्शन (सबसे तेज़ तरीका)
यह तरीका आपको लक्षित डेटा सीधे चुनने की सुविधा देकर समय बचाता है। बस वेब पेज पर किसी टेबल में कहीं भी क्लिक करें और फिर HTML Table Exporter PRO एक्सटेंशन आइकन खोलें। एक्सटेंशन ऑटोमैटिक उस विशिष्ट टेबल को हाइलाइट करता है और उस पर फ़ोकस करता है, जिससे अन्य डिटेक्टेड रिज़ल्ट में खोजे बिना तुरंत एक्सपोर्ट किया जा सकता है।
लचीले एक्सपोर्ट फ़ॉर्मेट
प्रत्येक डिटेक्ट की गई टेबल को टेबल कार्ड पर संबंधित बटन क्लिक करके कई प्रोफ़ेशनल फ़ॉर्मेट में एक्सपोर्ट किया जा सकता है:
- Excel (XLSX) — गहन डेटा विश्लेषण के लिए आदर्श
- CSV — सामान्य स्प्रेडशीट उपयोग के लिए बेहतरीन
- JSON या NDJSON — वेब डेवलपमेंट और NoSQL डेटाबेस के लिए आदर्श
- SQL — डेटाबेस में उपयोग के लिए तैयार INSERT स्टेटमेंट जेनरेट करता है
बल्क डाउनलोड
जो उपयोगकर्ता एक बार में सभी टेबल एक्सट्रैक्ट करना चाहते हैं, उनके लिए बल्क डाउनलोड उपलब्ध है। इसके लिए ZIP फ़ॉर्मेट ड्रॉपडाउन मेनू खोजें और पैकेज के अंदर फ़ाइलों के लिए अपना पसंदीदा फ़ॉर्मेट (जैसे CSV या JSON) चुनें। "Export all tables (ZIP)" पर क्लिक करने पर, पेज की सभी टेबल एक व्यवस्थित पैकेज में एक साथ डाउनलोड हो जाती हैं।
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%
एक्सपोर्ट फ़ॉर्मेट
HTML Table Exporter पाँच आउटपुट फ़ॉर्मेट सपोर्ट करता है, प्रत्येक अलग-अलग उपयोग मामलों के लिए ऑप्टिमाइज़्ड।
CSV (Comma-Separated Values)
यूनिवर्सल फ़ॉर्मेट। Excel, Google Sheets, डेटाबेस और लगभग किसी भी डेटा टूल के साथ काम करता है। PRO यूज़र क्षेत्रीय संगतता के लिए डिलिमिटर (कॉमा, सेमीकोलन, टैब) कस्टमाइज़ कर सकते हैं।
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending
JSON (JavaScript Object Notation)
डेवलपर और API के लिए बेहतरीन। प्रत्येक पंक्ति कॉलम हेडर को कीज़ के रूप में एक ऑब्जेक्ट में बदल जाती है।
[
{
"Name": "John Doe",
"Email": "[email protected]",
"Status": "Active"
}
]
Excel (XLSX)
सही सेल टाइप के साथ नेटिव Excel फ़ॉर्मेट। नंबर नंबर हैं, तारीखें तारीखें हैं।
NDJSON (Newline Delimited JSON)
स्ट्रीमिंग डेटा प्रोसेसिंग और NoSQL डेटाबेस के लिए बेहतरीन। प्रत्येक लाइन एक अलग JSON ऑब्जेक्ट है, जो इसे बड़े डेटासेट और लॉग प्रोसेसिंग के लिए आदर्श बनाता है।
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}
SQL (INSERT Statements)
सीधे डेटाबेस में इम्पोर्ट करने के लिए तैयार INSERT स्टेटमेंट जेनरेट करता है। MySQL, PostgreSQL, SQLite और अन्य SQL डेटाबेस के लिए बेहतरीन।
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
PRO NDJSON और SQL एक्सपोर्ट फ़ॉर्मेट जोड़ता है। बैच ZIP में सभी फ़ॉर्मेट एक साथ शामिल हैं।
डेटा क्लीनिंग
वेब डेटा गड़बड़ होता है: करेंसी प्रतीक, असंगत तारीख फ़ॉर्मेट, छिपे हुए कैरेक्टर — ये विश्लेषण और इम्पोर्ट तोड़ देते हैं। HTML Table Exporter आपके डेटा को ऑटोमैटिक साफ़ करता है।
ऑटोमैटिक क्लीनिंग (मुफ़्त)
- सभी सेल से व्हाइटस्पेस हटाता है
- छिपे Unicode कैरेक्टर हटाता है
- लाइन ब्रेक नॉर्मलाइज़ करता है
- मर्ज्ड सेल संरचना संरक्षित करता है
स्मार्ट क्लीनिंग प्रोफ़ाइल (PRO)
PRO में सामान्य डेटा प्रकारों के लिए पूर्व-निर्मित क्लीनिंग प्रोफ़ाइल शामिल हैं:
करेंसी प्रोफ़ाइल
$, €, £ प्रतीक और हज़ार विभाजक हटाता है। $1,234.56 को 1234.56 में बदलता है।
प्रतिशत प्रोफ़ाइल
% प्रतीक हटाता है। 45.5% को 0.455 या 45.5 में बदलता है।
तारीख प्रोफ़ाइल
तारीखों को ISO फ़ॉर्मेट में मानकीकृत करता है। Jan 15, 2024 को 2024-01-15 में बदलता है।
// Raw data from website
" $1,234.56 ", "Jan 15, 2024", "45.5%"
// After cleaning profiles
1234.56, "2024-01-15", 0.455
बैच एक्सपोर्ट
जब एक पेज पर कई टेबल हों (या आपको कई फ़ॉर्मेट चाहिए), बैच एक्सपोर्ट घंटों बचाता है।
बैच एक्सपोर्ट विशेष रूप से PRO उपयोगकर्ताओं के लिए उपलब्ध है।
सभी टेबल एक्सपोर्ट करें
एक्सटेंशन पॉपअप में "Export All" पर क्लिक करें। प्रत्येक टेबल एक अलग फ़ाइल बन जाती है।
ZIP डाउनलोड
अपनी पसंद के फ़ॉर्मेट में सभी टेबल के साथ एक ही ZIP प्राप्त करें।
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv
जटिल टेबल
वास्तविक दुनिया की टेबल शायद ही कभी सरल ग्रिड होती हैं। HTML Table Exporter उस जटिलता को हैंडल करता है जो अन्य टूल तोड़ देती है।
मर्ज्ड सेल (Rowspan/Colspan)
जब सेल कई पंक्तियों या कॉलम में फैलती हैं, एक्सपोर्टेड डेटा संरचना बनाए रखने के लिए संबंधित सेल भरता है।
नेस्टेड टेबल
टेबल के अंदर टेबल पुरानी वेबसाइटों में आम हैं। होवर हाइलाइटिंग एक्सपोर्ट से पहले सत्यापित करने में मदद करती है।
डायनामिक/JavaScript टेबल
कई आधुनिक वेब ऐप्स JavaScript फ़्रेमवर्क का उपयोग करके टेबल रेंडर करते हैं। अगर टेबल आपके ब्राउज़र में दिखती है, तो एक्सटेंशन आमतौर पर इसे डिटेक्ट कर सकता है। हालांकि, परिणाम इस पर निर्भर करते हैं कि साइट अपने DOM को कैसे स्ट्रक्चर करती है — कुछ ऐप्स गैर-मानक एलिमेंट इस्तेमाल करते हैं जिन्हें टेबल के रूप में पहचाना नहीं जा सकता।
कुछ साइटें स्क्रॉल करने पर टेबल पंक्तियाँ लोड करती हैं। सभी डेटा लोड होने के लिए पहले अंत तक स्क्रॉल करें।
Scroll Capture (PRO)
Scroll Capture एक PRO फ़ीचर है जो पेजिनेटेड और वर्चुअलाइज़्ड टेबल के लिए डिज़ाइन किया गया है जो एक समय में पंक्तियों का केवल एक सबसेट दिखाती हैं। यह टेबल में स्क्रॉल करते समय दिखने वाली पंक्तियों को कैप्चर करके, उन्हें संचित और डिडुप्लिकेट करके एक पूरा डेटासेट बनाता है।
कैसे काम करता है: आप Scroll Capture एक्टिवेट करते हैं और फिर अपनी गति से टेबल में स्क्रॉल करते हैं। एक्सटेंशन उस समय ब्राउज़र DOM में रेंडर की गई पंक्तियों को पढ़ता है — कोई अतिरिक्त नेटवर्क रिक्वेस्ट नहीं करता, क्लिक सिमुलेट नहीं करता और न ही पेजिनेशन कंट्रोल के साथ इंटरैक्ट करता है। जब आप ज़रूरी डेटा देख लें, कैप्चर रोकें और संचित डेटासेट एक्सपोर्ट करें।
ऑटो-पेजिनेशन टूल से मुख्य अंतर: ब्राउज़र एक्सटेंशन के विपरीत जो "अगला पेज" बटन पर ऑटोमैटिक क्लिक करते हैं या इनफ़ाइनाइट स्क्रॉल सिमुलेट करते हैं, Scroll Capture एक पैसिव रीडर है। यह देखता है कि आपके ब्राउज़र ने पहले से क्या रेंडर किया है, बिना पेज नेविगेशन या सर्वर रिक्वेस्ट ट्रिगर किए। इससे रेट लिमिट या एंटी-बॉट प्रोटेक्शन एक्टिवेट होने की संभावना कम होती है, और यह उन वर्चुअलाइज़्ड ग्रिड के साथ काम करता है जो स्क्रॉल करते समय DOM नोड बदलती हैं।
Scroll Capture कई पेजिनेटेड और वर्चुअलाइज़्ड टेबल के साथ काम करता है, लेकिन परिणाम प्रत्येक वेबसाइट के विशिष्ट कार्यान्वयन पर निर्भर करते हैं। सभी टेबल फ़ॉर्मेट संगत नहीं हैं। हम अपनी लक्ष्य साइट पर बेसिक टेबल डिटेक्शन कन्फ़र्म करने के लिए पहले मुफ़्त वर्शन आज़माने की सलाह देते हैं।
तुलना मुफ़्त vs PRO
मुफ़्त वर्शन वास्तव में उपयोगी है, बिना कृत्रिम सीमाओं के। PRO नियमित उपयोगकर्ताओं के लिए एडवांस्ड फ़ीचर जोड़ता है।
| फ़ीचर | मुफ़्त | PRO |
|---|---|---|
| CSV एक्सपोर्ट | ✔ | ✔ |
| JSON एक्सपोर्ट | ✔ | ✔ |
| Excel एक्सपोर्ट | ✔ | ✔ |
| NDJSON एक्सपोर्ट | — | ✔ |
| SQL एक्सपोर्ट | — | ✔ |
| ऑटोमैटिक टेबल डिटेक्शन | ✔ | ✔ |
| मर्ज्ड सेल हैंडलिंग | ✔ | ✔ |
| ZIP डाउनलोड (सभी टेबल) | सिर्फ़ CSV | मल्टी-फ़ॉर्मेट |
| प्रीसेट प्रोफ़ाइल (Pandas, DuckDB, आदि) | — | ✔ |
| क्लीनिंग प्रीसेट (नंबर, तारीखें, null) | — | ✔ |
| कॉलम चयन और रीऑर्डरिंग | — | ✔ |
| एक्सपोर्ट इतिहास | — | ✔ |
| पिछला एक्सपोर्ट दोहराएं | — | ✔ |
| होवर प्रीव्यू | — | ✔ |
| 100% लोकल प्रोसेसिंग | ✔ | ✔ |
समस्या निवारण
"कोई टेबल डिटेक्ट नहीं हुई"
कुछ साइटें <div> लेआउट का उपयोग करती हैं जो टेबल जैसे दिखते हैं लेकिन सिमैंटिक HTML टेबल नहीं हैं। एक्सटेंशन मुख्य रूप से <table> एलिमेंट डिटेक्ट करता है और कुछ JavaScript-आधारित ग्रिड कंपोनेंट भी सपोर्ट करता है। एक्सपोर्ट करने से पहले सुनिश्चित करें कि पेज पूरी तरह लोड हो गया है।
एक्सपोर्ट में डेटा गायब है
जाँचें कि क्या टेबल लेज़ी लोडिंग का उपयोग करती है। पहले पूरी टेबल में स्क्रॉल करें, फिर एक्सपोर्ट करें।
एक्सपोर्ट में गलत एन्कोडिंग है
एक्सटेंशन UTF-8 एन्कोडिंग का उपयोग करता है। अगर Excel में अपठनीय कैरेक्टर दिखते हैं, तो Data → From Text/CSV से इम्पोर्ट करें।
एक्सटेंशन किसी साइट पर काम नहीं कर रहा
कुछ साइटें (जैसे Chrome Web Store स्वयं) सुरक्षा के लिए एक्सटेंशन ब्लॉक करती हैं। यह Chrome की सीमा है। अगर आपको लगता है कि एक्सटेंशन किसी विशिष्ट साइट पर काम करना चाहिए लेकिन नहीं कर रहा, या एक्सट्रैक्शन त्रुटियाँ दिखती हैं, तो हमारे सहायता फ़ॉर्म के माध्यम से रिपोर्ट करें ताकि हम जाँच कर सकें।
हमारे सहायता पेज पर जाएं और बग रिपोर्ट करने के लिए फ़ॉर्म भरें। सहायता व्यक्तिगत रूप से दी जाती है और जवाब में 10 कार्य दिवस तक लग सकते हैं।