免費線上讓 PDF 可搜尋 — OCR 文字圖層

將掃描或圖片型 PDF 轉換為可搜尋文件。OCR 提取文字並嵌入為隱形搜尋圖層。所有處理都在瀏覽器中完成。

將掃描 PDF 拖放到這裡或從裝置選取 — 掃描或圖片型 PDF 選擇 PDF

尚未選擇 PDF。加入一個掃描 PDF 使其變為可搜尋。

OCR 語言

尚未載入 PDF

如何讓掃描 PDF 變為可搜尋

掃描 PDF 或圖片型 PDF 只包含頁面圖片 — 即使螢幕上能看到文字，電腦也只看到像素。此工具使用 OCR（光學字元辨識）讀取這些像素，提取實際文字，並將其嵌入為新 PDF 中的隱形文字圖層。可見頁面看起來相同，但現在 Ctrl+F 可以找到文字，你也可以選取和複製文字。

隱形文字圖層的位置與每頁的可見文字對齊，因此文字選取會遵循閱讀順序，搜尋高亮會出現在你期望的位置。

Tesseract OCR 支援 12 種以上語言，包括英文、繁體中文、簡體中文、西班牙文、葡萄牙文、法文、德文、俄文、阿拉伯文、日文、韓文、義大利文、印尼文、荷蘭文、泰文和越南文。選擇主要語言以獲得最佳準確度。

你的 PDF 會留在瀏覽器中。OCR 完全在你的裝置上執行，使用 Tesseract.js 編譯為 WebAssembly。PDF2atom 不會上傳、儲存或檢查你的文件。無伺服器端處理、無 API 呼叫、無第三方存取。

建立可搜尋 PDF 時文件會上傳嗎？

不會。OCR 和 PDF 建立完全在瀏覽器中執行，使用 Tesseract.js 和 pdf-lib。PDF2atom 不會收到你的文件。

可搜尋 PDF 看起來會和原版不同嗎？

可見頁面看起來相同 — 原始頁面圖片會被保留。文字圖層是隱形的，只影響搜尋和文字選取行為。

讓 PDF 變為可搜尋需要多長時間？

Tesseract.js 首次載入約需 4-6 秒，之後每頁約需 5-20 秒。在現代筆電上，5 頁掃描文件通常可在 2 分鐘內完成。

數位產生的 PDF 也可以變為可搜尋嗎？

數位 PDF 通常已有可選取文字。此工具是為掃描/圖片型 PDF 設計的。對於數位 PDF，可以跳過此步驟 — 它們已經可以搜尋。

OCR 可以辨識哪些語言？

英文、繁體中文、簡體中文、西班牙文、葡萄牙文、法文、德文、俄文、阿拉伯文、日文、韓文、義大利文、印尼文、荷蘭文、泰文和越南文。選擇與文件相符的主要語言。

密碼保護的 PDF 可以使用嗎？

密碼鎖定的 PDF 需要先使用你知道的密碼解鎖。PDF2atom 不提供破解或繞過密碼功能。

什麼掃描品質能獲得最佳可搜尋結果？

200-300 DPI 的掃描、良好的對比度和正確的對齊會產生最佳的 OCR 準確度。傾斜、模糊或低對比度的頁面會降低辨識品質。