เอกสาร
ทุกสิ่งที่คุณต้องการเพื่อดึง ล้าง และส่งออกตารางเว็บอย่างมืออาชีพ ตั้งแต่การส่งออกพื้นฐานไปจนถึงเวิร์กโฟลว์การล้างข้อมูลขั้นสูง
บทนำ
HTML Table Exporter เป็นส่วนขยาย Chrome ที่ตรวจจับตารางในหน้าเว็บและส่งออกไปยังรูปแบบที่คุณต้องการ แตกต่างจาก web scrapers ที่ต้องการการกำหนดค่าที่ซับซ้อน เครื่องมือนี้ทำงานได้ทันที: คลิก เลือกรูปแบบ ดาวน์โหลด
การประมวลผลทั้งหมดเกิดขึ้นในเครื่องในเบราว์เซอร์ของคุณ ข้อมูลของคุณไม่เคยออกจากอุปกรณ์
สำหรับใคร?
- นักวิเคราะห์ข้อมูล ที่ต้องการดึงตารางจากรายงานการเงิน เว็บไซต์รัฐบาล หรือฐานข้อมูลวิจัย
- นักวิจัย ที่รวบรวมข้อมูลที่มีโครงสร้างจากแหล่งข้อมูลทางวิชาการหรือ Wikipedia
- นักพัฒนา ที่ต้องการเข้าถึงข้อมูลตารางอย่างรวดเร็วโดยไม่ต้องสร้าง scraper
- ใครก็ตาม ที่เบื่อการคัดลอกและวางตารางทีละเซลล์
เมื่อไหร่ควรใช้ HTML Table Exporter
HTML Table Exporter ออกแบบมาสำหรับกรณีการใช้งานเฉพาะ การเข้าใจว่ามันเก่งตรงไหน — และเครื่องมืออื่นอาจเหมาะสมกว่าตรงไหน — จะช่วยให้คุณใช้ประโยชน์ได้เต็มที่
เหมาะสำหรับ
- การส่งออกตารางเฉพาะจุด — รายงานการเงิน ชุดข้อมูลรัฐบาล ฐานข้อมูลวิจัย ตาราง Wikipedia สถิติกีฬา
- ข้อมูลจากแอปพลิเคชันเว็บ — แพลตฟอร์ม CRM หลายตัว แดชบอร์ด analytics ระบบ ERP และเครื่องมือองค์กรแสดงผลข้อมูลเป็นตาราง HTML ที่ส่วนขยายสามารถตรวจจับได้
- การส่งออกที่ต้องทำซ้ำ — บันทึกกฎการล้างข้อมูลและการกำหนดค่าคอลัมน์เป็นโปรไฟล์ และนำกลับมาใช้ทุกครั้งที่คุณส่งออกจากแหล่งเดียวกัน
- สภาพแวดล้อมที่ให้ความสำคัญกับความเป็นส่วนตัว — การประมวลผลทั้งหมดเป็นแบบ local ทำให้เหมาะสำหรับบริบทองค์กร การเงิน หรือสุขภาพที่ข้อมูลไม่สามารถออกจากเบราว์เซอร์ได้
- ข้อมูลที่ต้องการการล้าง — วันที่ ตัวเลข สกุลเงิน และค่า null จะถูกปรับให้เป็นมาตรฐานโดยอัตโนมัติก่อนส่งออก
ไม่ได้ออกแบบมาสำหรับ
- Scraping อัตโนมัติหรือตามกำหนดเวลา — นี่คือเครื่องมือแบบ manual และ interactive หากคุณต้องการ headless scraper หรือ pipeline แบบ cron พิจารณาเครื่องมือเช่น Scrapy, Puppeteer หรือ Playwright
- ข้อมูลที่ไม่ใช่ตาราง — ส่วนขยายตรวจจับองค์ประกอบ HTML
<table>การ์ด รายการ ฟีด และเลย์เอาต์ที่ไม่มีโครงสร้างไม่รองรับ - การเข้าถึงข้อมูลผ่าน API — หากข้อมูลที่คุณต้องการมีอยู่ผ่าน API การใช้ API โดยตรงจะน่าเชื่อถือกว่าการดึงจากหน้าที่แสดงผล
- ความเข้ากันได้ที่รับประกันกับทุกไซต์ — โครงสร้างตารางเว็บแตกต่างกันอย่างมาก ส่วนขยายทำงานกับตาราง HTML มาตรฐานและแอปพลิเคชันเว็บที่ซับซ้อนหลายตัว แต่บางไซต์ใช้การแสดงผลที่ไม่เป็นมาตรฐานซึ่งอาจไม่เข้ากันได้อย่างสมบูรณ์
เวอร์ชันฟรีไม่มีจำกัดจำนวนแถวและทำงานกับตารางส่วนใหญ่ ติดตั้งและทดสอบบนไซต์เฉพาะของคุณก่อนพิจารณา PRO
การติดตั้ง
-
เยี่ยมชม Chrome Web Store
เปิดหน้า HTML Table Exporter ในเบราว์เซอร์ Chrome ของคุณ
-
คลิก "เพิ่มใน Chrome"
คลิกปุ่มสีน้ำเงินและยืนยันใน popup การติดตั้งใช้เวลาประมาณ 3 วินาที
-
ปักหมุดส่วนขยาย (ไม่บังคับ)
คลิกที่ไอคอนปริศนาในแถบเครื่องมือ Chrome และปักหมุด HTML Table Exporter เพื่อการเข้าถึงอย่างรวดเร็ว
ส่วนขยายขอ "อ่านและเปลี่ยนแปลงข้อมูลทั้งหมดของคุณบนเว็บไซต์" สิ่งนี้จำเป็นสำหรับการตรวจจับตาราง แต่จำไว้ว่าการประมวลผลทั้งหมดเป็นแบบ local และเราไม่เคยส่งข้อมูลใดๆ
เปิดใช้งานไลเซนส์
หลังจากซื้อ HTML Table Exporter PRO คุณจะได้รับคีย์ไลเซนส์ทางอีเมล ทำตามขั้นตอนเหล่านี้เพื่อปลดล็อกฟีเจอร์ PRO ทั้งหมด
ไลเซนส์ของคุณจะถูกตรวจสอบระหว่างการเปิดใช้งานและ cache ไว้ในเครื่อง ต้องเข้าถึงอินเทอร์เน็ตเป็นระยะเพื่อตรวจสอบสถานะไลเซนส์อีกครั้ง เพื่อให้บริการไม่หยุดชะงัก
วิธีเปิดใช้งาน PRO
-
คลิก "เปิดใช้งาน" ในส่วนขยาย
เปิด popup ของส่วนขยายและคลิกปุ่ม "เปิดใช้งาน" ที่มุมขวาบน คุณจะเห็นฟีเจอร์ PRO แสดงรายการที่ด้านล่างของเวอร์ชันฟรีด้วย
-
ใส่คีย์ไลเซนส์ของคุณ
วางคีย์ไลเซนส์ของคุณในรูปแบบ
XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXXและคลิก "เปิดใช้งาน" คีย์ถูกส่งไปยังอีเมลของคุณหลังจากซื้อ -
เริ่มใช้ฟีเจอร์ PRO
เมื่อเปิดใช้งานแล้ว ส่วนขยายจะแสดง "HTML Table Exporter PRO" พร้อมปุ่มประวัติ ฟีเจอร์ PRO ทั้งหมดถูกปลดล็อกแล้ว
คู่มือภาพ
คลิกปุ่ม "เปิดใช้งาน" ที่มุมขวาบน เวอร์ชันฟรีจะแสดงฟีเจอร์ที่คุณปลดล็อกได้ด้วย PRO
วางคีย์ไลเซนส์ของคุณและคลิก "เปิดใช้งาน" หากคุณยังไม่มีคีย์ คลิก "Get HTML Table Exporter PRO"
การแก้ไขปัญหาไลเซนส์
"คีย์ไลเซนส์ไม่ถูกต้อง"
ตรวจสอบให้แน่ใจว่าคุณคัดลอกคีย์ไลเซนส์ทั้งหมดรวมถึงขีดกลางทั้งหมด รูปแบบต้องเป็น XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX ตรวจสอบว่าไม่มีช่องว่างพิเศษก่อนหรือหลังคีย์
ไม่ได้รับคีย์ไลเซนส์
ตรวจสอบโฟลเดอร์สแปมของคุณ อีเมลมาจาก Lemon Squeezy (ผู้ประมวลผลการชำระเงินของเรา) หากยังไม่พบ กรุณาเยี่ยมชมหน้าสนับสนุนพร้อมหมายเลขคำสั่งซื้อของคุณ
ต้องการโอนไลเซนส์ไปยังอุปกรณ์อื่น
คีย์ไลเซนส์แต่ละตัวใช้ได้กับอุปกรณ์เดียว หากคุณต้องการใช้ PRO บนอุปกรณ์เพิ่มเติม คุณสามารถซื้อไลเซนส์เพิ่มเติมหรือพิจารณาแผน TEAM หรือ BUSINESS ของเรา
รับ HTML Table Exporter PRO พร้อมรับประกันคืนเงิน 14 วัน ดูตัวเลือกราคา →
เริ่มต้นอย่างรวดเร็ว
ส่งออกตารางแรกของคุณในเวลาน้อยกว่า 60 วินาที:
วิธีส่งออกตาราง
การเลือกอัจฉริยะ (วิธีที่เร็วที่สุด)
วิธีนี้ประหยัดเวลาโดยให้คุณเลือกข้อมูลเป้าหมายโดยตรง เพียงคลิกที่ใดก็ได้ในตารางบนหน้าเว็บแล้วเปิดไอคอนส่วนขยาย HTML Table Exporter PRO ส่วนขยายจะไฮไลต์และโฟกัสที่ตารางนั้นโดยอัตโนมัติ ให้คุณส่งออกได้ทันทีโดยไม่ต้องค้นหาในผลลัพธ์อื่นๆ ที่ตรวจพบ
รูปแบบการส่งออกที่หลากหลาย
ตารางที่ตรวจพบแต่ละตารางสามารถส่งออกในรูปแบบมืออาชีพหลายรูปแบบโดยคลิกปุ่มที่เกี่ยวข้องในการ์ดตาราง:
- Excel (XLSX) — เหมาะสำหรับการวิเคราะห์ข้อมูลเชิงลึก
- CSV — เหมาะสำหรับการใช้งานทั่วไปในสเปรดชีต
- JSON หรือ NDJSON — เหมาะสำหรับการพัฒนาเว็บและฐานข้อมูล NoSQL
- SQL — สร้างคำสั่ง INSERT พร้อมใช้ในฐานข้อมูล
ดาวน์โหลดแบบ batch
สำหรับผู้ใช้ที่ต้องการดึงตารางทั้งหมดในครั้งเดียว การดาวน์โหลดแบบ batch พร้อมใช้งาน ให้ค้นหาเมนูดรอปดาวน์รูปแบบ ZIP และเลือกรูปแบบที่คุณต้องการ (เช่น CSV หรือ JSON) สำหรับไฟล์ในแพ็คเกจ เมื่อคลิก "Export all tables (ZIP)" ตารางทั้งหมดในหน้าจะถูกดาวน์โหลดพร้อมกันในแพ็คเกจที่จัดระเบียบ
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%
รูปแบบการส่งออก
HTML Table Exporter รองรับรูปแบบผลลัพธ์ห้ารูปแบบ แต่ละรูปแบบปรับแต่งสำหรับกรณีการใช้งานที่แตกต่างกัน
CSV (Comma-Separated Values)
รูปแบบสากล ใช้งานได้กับ Excel, Google Sheets, ฐานข้อมูล และเครื่องมือข้อมูลแทบทุกชนิด ผู้ใช้ PRO สามารถปรับแต่งตัวคั่น (จุลภาค เซมิโคลอน แท็บ) สำหรับความเข้ากันได้ในภูมิภาค
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending
JSON (JavaScript Object Notation)
เหมาะสำหรับนักพัฒนาและ API แต่ละแถวจะถูกแปลงเป็นออบเจ็กต์พร้อมส่วนหัวคอลัมน์เป็นคีย์
[
{
"Name": "John Doe",
"Email": "[email protected]",
"Status": "Active"
}
]
Excel (XLSX)
รูปแบบ Excel ดั้งเดิมพร้อมประเภทเซลล์ที่ถูกต้อง ตัวเลขคือตัวเลข วันที่คือวันที่
NDJSON (Newline Delimited JSON)
เหมาะสำหรับการประมวลผลข้อมูลแบบ streaming และฐานข้อมูล NoSQL แต่ละบรรทัดคือออบเจ็กต์ JSON แยกต่างหาก ทำให้เหมาะสำหรับ dataset ขนาดใหญ่และการประมวลผล log
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}
SQL (INSERT Statements)
สร้างคำสั่ง INSERT พร้อมนำเข้าฐานข้อมูลโดยตรง เหมาะสำหรับ MySQL, PostgreSQL, SQLite และฐานข้อมูล SQL อื่นๆ
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
PRO เพิ่มรูปแบบการส่งออก NDJSON และ SQL ZIP แบบ batch รวมทุกรูปแบบในครั้งเดียว
การล้างข้อมูล
ข้อมูลเว็บไม่เป็นระเบียบ: สัญลักษณ์สกุลเงิน รูปแบบวันที่ที่ไม่สอดคล้องกัน อักขระที่ซ่อนอยู่ สิ่งเหล่านี้ทำลายการวิเคราะห์และการนำเข้า HTML Table Exporter ล้างข้อมูลของคุณโดยอัตโนมัติ
การล้างข้อมูลอัตโนมัติ (ฟรี)
- ลบช่องว่างออกจากทุกเซลล์
- ลบอักขระ Unicode ที่ซ่อนอยู่
- ปรับการขึ้นบรรทัดใหม่ให้เป็นมาตรฐาน
- รักษาโครงสร้างเซลล์ที่ผสาน
โปรไฟล์การล้างข้อมูลอัจฉริยะ (PRO)
PRO รวมโปรไฟล์การล้างข้อมูลที่สร้างไว้ล่วงหน้าสำหรับประเภทข้อมูลทั่วไป:
โปรไฟล์สกุลเงิน
ลบสัญลักษณ์ $, €, £ และตัวคั่นหลักพัน แปลง $1,234.56 เป็น 1234.56
โปรไฟล์เปอร์เซ็นต์
ลบสัญลักษณ์ % แปลง 45.5% เป็น 0.455 หรือ 45.5
โปรไฟล์วันที่
ปรับวันที่ให้เป็นรูปแบบ ISO มาตรฐาน แปลง 15 ม.ค. 2567 เป็น 2024-01-15
// Raw data from website
" $1,234.56 ", "15 ม.ค. 2567", "45.5%"
// After cleaning profiles
1234.56, "2024-01-15", 0.455
ส่งออกแบบ batch
เมื่อหน้ามีหลายตาราง (หรือคุณต้องการหลายรูปแบบ) การส่งออกแบบ batch ประหยัดเวลาหลายชั่วโมง
การส่งออกแบบ batch พร้อมใช้งานสำหรับผู้ใช้ PRO เท่านั้น
ส่งออกตารางทั้งหมด
คลิก "Export All" ใน popup ของส่วนขยาย แต่ละตารางจะถูกแปลงเป็นไฟล์แยกต่างหาก
ดาวน์โหลด ZIP
รับ ZIP เดียวที่มีตารางทั้งหมดในรูปแบบที่คุณเลือก
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv
ตารางที่ซับซ้อน
ตารางในโลกจริงแทบไม่เคยเป็นกริดธรรมดา HTML Table Exporter จัดการความซับซ้อนที่ทำให้เครื่องมืออื่นพัง
เซลล์ที่ผสาน (Rowspan/Colspan)
เมื่อเซลล์ครอบคลุมหลายแถวหรือคอลัมน์ ข้อมูลที่ส่งออกจะเติมเซลล์ที่เกี่ยวข้องเพื่อรักษาโครงสร้าง
ตารางซ้อน
ตารางภายในตารางพบได้ทั่วไปในเว็บไซต์เก่า การไฮไลต์เมื่อชี้เมาส์ช่วยให้คุณตรวจสอบก่อนส่งออก
ตารางไดนามิก/JavaScript
แอปพลิเคชันเว็บสมัยใหม่หลายตัวแสดงผลตารางโดยใช้ framework JavaScript หากตารางมองเห็นได้ในเบราว์เซอร์ของคุณ ส่วนขยายโดยทั่วไปสามารถตรวจจับได้ อย่างไรก็ตาม ผลลัพธ์อาจแตกต่างกันขึ้นอยู่กับวิธีที่ไซต์จัดโครงสร้าง DOM — บางแอปพลิเคชันใช้องค์ประกอบที่ไม่เป็นมาตรฐานที่อาจไม่ถูกรู้จักว่าเป็นตาราง
บางไซต์โหลดแถวตารางเมื่อคุณเลื่อน เลื่อนไปที่จุดสิ้นสุดก่อนเพื่อให้แน่ใจว่าข้อมูลทั้งหมดถูกโหลด
Scroll Capture (PRO)
Scroll Capture เป็นฟีเจอร์ PRO ที่ออกแบบมาสำหรับตารางแบบแบ่งหน้าและ virtualized ที่แสดงเพียงส่วนย่อยของแถวในแต่ละครั้ง ทำงานโดยจับภาพแถวที่มองเห็นได้เมื่อคุณเลื่อนผ่านตาราง รวบรวมและกำจัดข้อมูลซ้ำเป็น dataset ที่สมบูรณ์
วิธีการทำงาน: คุณเปิดใช้งาน Scroll Capture แล้วเลื่อนผ่านตารางตามจังหวะของคุณเอง ส่วนขยายอ่านแถวที่แสดงใน DOM ของเบราว์เซอร์ในขณะนั้น — ไม่ส่งคำขอเครือข่ายเพิ่มเติม ไม่จำลองการคลิก หรือโต้ตอบกับตัวควบคุมการแบ่งหน้า เมื่อคุณเลื่อนผ่านข้อมูลที่ต้องการแล้ว คุณหยุดการจับภาพและส่งออก dataset ที่รวบรวมไว้
ความแตกต่างหลักจากเครื่องมือ auto-pagination: แตกต่างจากส่วนขยายเบราว์เซอร์ที่คลิกปุ่ม "หน้าถัดไป" โดยอัตโนมัติหรือจำลองการเลื่อนแบบ infinite Scroll Capture เป็นตัวอ่านแบบ passive มันสังเกตสิ่งที่เบราว์เซอร์ของคุณแสดงผลแล้วโดยไม่เรียกการนำทางหน้าหรือคำขอไปยังเซิร์ฟเวอร์ สิ่งนี้ทำให้มีโอกาสน้อยที่จะเรียกการจำกัดอัตราหรือการป้องกัน anti-bot และทำงานกับกริด virtualized ที่แทนที่โหนด DOM เมื่อคุณเลื่อน
Scroll Capture ทำงานกับตารางแบบแบ่งหน้าและ virtualized หลายตัว แต่ผลลัพธ์ขึ้นอยู่กับการใช้งานเฉพาะของแต่ละเว็บไซต์ ไม่ใช่ทุกรูปแบบตารางที่รองรับ เราแนะนำให้ทดสอบกับเวอร์ชันฟรีก่อนเพื่อยืนยันการตรวจจับตารางพื้นฐานบนไซต์เป้าหมายของคุณ
เปรียบเทียบ ฟรี vs PRO
เวอร์ชันฟรีมีประโยชน์จริงๆ ไม่มีข้อจำกัดเทียม PRO เพิ่มฟีเจอร์ขั้นสูงสำหรับผู้ใช้ที่ใช้บ่อย
| ฟีเจอร์ | ฟรี | PRO |
|---|---|---|
| ส่งออก CSV | ✔ | ✔ |
| ส่งออก JSON | ✔ | ✔ |
| ส่งออก Excel | ✔ | ✔ |
| ส่งออก NDJSON | — | ✔ |
| ส่งออก SQL | — | ✔ |
| ตรวจจับตารางอัตโนมัติ | ✔ | ✔ |
| จัดการเซลล์ที่ผสาน | ✔ | ✔ |
| ดาวน์โหลด ZIP (ทุกตาราง) | CSV เท่านั้น | หลายรูปแบบ |
| โปรไฟล์พรีเซ็ต (Pandas, DuckDB ฯลฯ) | — | ✔ |
| พรีเซ็ตการล้างข้อมูล (ตัวเลข วันที่ null) | — | ✔ |
| เลือกและจัดเรียงคอลัมน์ | — | ✔ |
| ประวัติการส่งออก | — | ✔ |
| ทำซ้ำการส่งออกล่าสุด | — | ✔ |
| ดูตัวอย่างเมื่อชี้เมาส์ | — | ✔ |
| ประมวลผล 100% ในเครื่อง | ✔ | ✔ |
การแก้ไขปัญหา
"ไม่พบตาราง"
บางไซต์ใช้เลย์เอาต์ <div> ที่ดูเหมือนตารางแต่ไม่ใช่ตาราง HTML เชิงความหมาย ส่วนขยายตรวจจับองค์ประกอบ <table> เป็นหลักและยังรองรับส่วนประกอบกริดที่ใช้ JavaScript บางตัว ตรวจสอบให้แน่ใจว่าหน้าโหลดเสร็จสมบูรณ์ก่อนส่งออก
ข้อมูลหายไปในการส่งออก
ตรวจสอบว่าตารางใช้การโหลดแบบ lazy หรือไม่ เลื่อนผ่านตารางทั้งหมดก่อน จากนั้นส่งออก
การส่งออกมีการเข้ารหัสไม่ถูกต้อง
ส่วนขยายใช้การเข้ารหัส UTF-8 หากคุณเห็นอักขระที่อ่านไม่ได้ใน Excel ใช้ Data → From Text/CSV เพื่อนำเข้า
ส่วนขยายไม่ทำงานบนไซต์
บางเว็บไซต์ (เช่น Chrome Web Store เอง) บล็อกส่วนขยายเพื่อความปลอดภัย นี่คือข้อจำกัดของ Chrome หากคุณคิดว่าส่วนขยายควรทำงานบนเว็บไซต์เฉพาะแต่ไม่ทำงาน หรือหากคุณพบข้อผิดพลาดในการดึงข้อมูล กรุณารายงานผ่านแบบฟอร์มสนับสนุนของเราเพื่อให้เราสามารถตรวจสอบได้
เยี่ยมชมหน้าสนับสนุนของเราและกรอกแบบฟอร์มเพื่อรายงานบั๊ก การสนับสนุนได้รับการดูแลเป็นการส่วนตัวและการตอบกลับอาจใช้เวลาถึง 10 วันทำการ