說明文件
專業擷取、清理和匯出網頁表格所需的一切。從基礎匯出到進階資料清理流程,完整涵蓋。
簡介
HTML Table Exporter 是一款 Chrome 擴充功能,能偵測網頁中的表格並匯出為你偏好的格式。不同於需要複雜設定的網頁爬蟲工具,這款工具即開即用:點擊、選擇格式、下載。
所有處理皆在瀏覽器本機進行,你的資料絕不會離開你的裝置。
適用對象
- 資料分析師:需要從財務報告、政府網站或研究資料庫擷取表格
- 研究人員:從學術來源或 Wikipedia 蒐集結構化資料
- 開發人員:需要快速取得表格資料,無需自行建構爬蟲
- 所有人:厭倦逐格複製貼上表格資料的任何人
安裝
-
前往 Chrome Web Store
在 Chrome 瀏覽器中開啟 HTML Table Exporter 頁面。
-
點擊「加到 Chrome」
點擊藍色按鈕並在彈出視窗中確認。安裝約需 3 秒。
-
釘選擴充功能(選用)
點擊 Chrome 工具列上的拼圖圖示,將 HTML Table Exporter 釘選以便快速存取。
擴充功能會要求「讀取及變更你在網站上的所有資料」權限。這是偵測表格所必需的,但請放心,所有處理皆在本機完成,我們絕不會傳送任何資料。
授權啟用
購買 HTML Table Exporter PRO 後,你將透過電子郵件收到授權金鑰。請依照以下步驟解鎖所有 PRO 功能。
授權在啟用時驗證並在本機快取。系統會定期需要網路連線重新驗證授權狀態,以確保服務不中斷。
如何啟用 PRO
-
在擴充功能中點擊「Activate」
開啟擴充功能彈出視窗,點擊右上角的「Activate」按鈕。你也會在免費版底部看到 PRO 功能列表。
-
輸入授權金鑰
貼上格式為
XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX的授權金鑰,然後點擊「Activate」。金鑰會在購買後寄送至你的電子郵件。 -
開始使用 PRO 功能
啟用後,擴充功能會顯示「HTML Table Exporter PRO」及歷史記錄按鈕。所有 PRO 功能已全部解鎖。
圖示說明
點擊右上角的「Activate」按鈕。免費版會顯示升級 PRO 後可解鎖的功能。
貼上授權金鑰並點擊「Activate」。若尚未取得金鑰,請點擊「Get HTML Table Exporter PRO」。
授權問題排解
「授權金鑰無效」
請確認已完整複製包含所有連字號的授權金鑰。格式應為 XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX。請確認金鑰前後沒有多餘的空格。
未收到授權金鑰
請檢查垃圾郵件資料夾。郵件來自 Lemon Squeezy(我們的付款處理商)。如仍未找到,請攜帶訂單編號前往支援頁面。
需要將授權轉移至其他裝置
每組授權金鑰僅限單一裝置使用。如需在其他裝置上使用 PRO,可購買額外授權或考慮我們的 TEAM 或 BUSINESS 方案。
取得 HTML Table Exporter PRO,享有 14 天退款保證。查看方案價格 →
快速開始
60 秒內匯出你的第一個表格:
如何匯出表格
智慧選取(最快方法)
此方法讓你直接選取目標資料,節省時間。只需在網頁上的表格任意處點擊,然後開啟 HTML Table Exporter PRO 擴充功能圖示。擴充功能會自動高亮並聚焦於該特定表格,讓你能立即匯出,無需在其他偵測結果中搜尋。
彈性匯出格式
每個偵測到的表格都可透過點擊表格卡片上對應的按鈕,匯出為多種專業格式:
- Excel (XLSX) — 適合深度資料分析
- CSV — 適合一般試算表使用
- JSON 或 NDJSON — 適合網頁開發和 NoSQL 資料庫
- SQL — 產生可直接用於資料庫的 INSERT 語句
批量下載
如需一次擷取所有表格,可使用批量下載功能。找到 ZIP 格式下拉選單,選擇封裝檔案的偏好格式(如 CSV 或 JSON)。點擊「Export all tables (ZIP)」後,頁面上的所有表格將一起下載為整理好的壓縮封裝。
Company,Revenue,Growth
Apple,394.33B,+7.8%
Microsoft,211.91B,+12.4%
Google,282.84B,+9.8%
匯出格式
HTML Table Exporter 支援五種輸出格式,各自針對不同使用情境最佳化。
CSV (Comma-Separated Values)
通用格式。可與 Excel、Google Sheets、資料庫及幾乎所有資料工具搭配使用。PRO 使用者可自訂分隔符號(逗號、分號、Tab 鍵),以相容各地區格式。
Name,Email,Status
John Doe,[email protected],Active
Jane Smith,[email protected],Pending
JSON (JavaScript Object Notation)
適合開發人員和 API 使用。每一列會轉換為以欄位標題為鍵值的物件。
[
{
"Name": "John Doe",
"Email": "[email protected]",
"Status": "Active"
}
]
Excel (XLSX)
Excel 原生格式,儲存格類型正確。數字就是數字,日期就是日期。
NDJSON (Newline Delimited JSON)
適合串流資料處理和 NoSQL 資料庫。每一行是獨立的 JSON 物件,非常適合大型資料集和日誌處理。
{"Name":"John Doe","Email":"[email protected]","Status":"Active"}
{"Name":"Jane Smith","Email":"[email protected]","Status":"Pending"}
SQL (INSERT Statements)
產生可直接匯入資料庫的 INSERT 語句。適用於 MySQL、PostgreSQL、SQLite 及其他 SQL 資料庫。
INSERT INTO table_name (Name, Email, Status) VALUES
('John Doe', '[email protected]', 'Active'),
('Jane Smith', '[email protected]', 'Pending');
PRO 新增 NDJSON 和 SQL 匯出格式。批次 ZIP 可同時包含所有格式。
資料清理
網頁資料往往雜亂:貨幣符號、日期格式不一致、隱藏字元——這些都會破壞分析和匯入。HTML Table Exporter 會自動清理你的資料。
自動清理(免費)
- 移除所有儲存格的空白字元
- 移除隱藏的 Unicode 字元
- 標準化換行符號
- 保留合併儲存格結構
智慧清理設定檔(PRO)
PRO 內建適用於常見資料類型的預設清理設定檔:
貨幣設定檔
移除 $、€、£ 符號及千位分隔符號。將 $1,234.56 轉換為 1234.56。
百分比設定檔
移除 % 符號。將 45.5% 轉換為 0.455 或 45.5。
日期設定檔
將日期標準化為 ISO 格式。將 Jan 15, 2024 轉換為 2024-01-15。
// Raw data from website
" $1,234.56 ", "Jan 15, 2024", "45.5%"
// After cleaning profiles
1234.56, "2024-01-15", 0.455
批次匯出
當頁面有多個表格(或你需要多種格式)時,批次匯出可節省大量時間。
批次匯出為 PRO 使用者專屬功能。
匯出所有表格
在擴充功能彈出視窗中點擊「Export All」。每個表格會轉換為獨立檔案。
ZIP 下載
取得包含所有表格的單一 ZIP 檔,格式由你選擇。
tables-export.zip
├── table-1-revenue-summary.csv
├── table-2-revenue-summary.csv
└── table-3-revenue-summary.csv
複雜表格
現實世界的表格很少是簡單的網格。HTML Table Exporter 能處理讓其他工具出錯的複雜結構。
合併儲存格 (Rowspan/Colspan)
當儲存格跨越多列或多欄時,匯出的資料會自動填入對應儲存格以保持結構完整。
巢狀表格
表格中的表格在舊式網站中很常見。滑鼠懸停高亮功能可幫助你在匯出前確認。
動態/JavaScript 表格
如果表格已在瀏覽器中渲染並可見,通常就能匯出。如果表格使用分頁,請先瀏覽所有頁面以載入全部資料。
部分網站會在你滾動時才載入表格列。請先滾動至底部,確保所有資料已載入。
免費版 vs PRO 比較
免費版真正實用,沒有人為限制。PRO 為重度使用者新增進階功能。
| 功能 | 免費 | PRO |
|---|---|---|
| CSV 匯出 | ✔ | ✔ |
| JSON 匯出 | ✔ | ✔ |
| Excel 匯出 | ✔ | ✔ |
| NDJSON 匯出 | — | ✔ |
| SQL 匯出 | — | ✔ |
| 自動偵測表格 | ✔ | ✔ |
| 合併儲存格處理 | ✔ | ✔ |
| ZIP 下載(所有表格) | 僅 CSV | 多格式 |
| 預設設定檔 (Pandas、DuckDB 等) | — | ✔ |
| 清理預設(數字、日期、空值) | — | ✔ |
| 欄位選擇與重新排序 | — | ✔ |
| 匯出歷史記錄 | — | ✔ |
| 重複上次匯出 | — | ✔ |
| 滑鼠懸停預覽 | — | ✔ |
| 100% 本機處理 | ✔ | ✔ |
疑難排解
「未偵測到表格」
部分網站使用 <div> 佈局,看起來像表格但並非語意化的 HTML 表格。擴充功能主要偵測 <table> 元素,同時也相容部分 JavaScript 網格元件。請確保頁面已完全載入後再匯出。
匯出資料缺漏
請確認表格是否使用延遲載入。先滾動瀏覽整個表格,再進行匯出。
匯出的編碼不正確
擴充功能使用 UTF-8 編碼。如在 Excel 中看到亂碼,請使用「資料 → 從文字/CSV」匯入。
擴充功能在某網站無法運作
部分網站(如 Chrome Web Store 本身)基於安全性會封鎖擴充功能。這是 Chrome 的限制。如果你認為擴充功能應在某特定網站運作卻無法使用,或發現擷取錯誤,請透過我們的支援表單回報,以便我們調查。
請前往我們的支援頁面填寫表單回報問題。支援由專人處理,回覆時間最長為 10 個工作天。