免費線上讓 PDF 可搜尋 — OCR 文字圖層

將掃描或圖片型 PDF 轉換為可搜尋文件。OCR 提取文字並嵌入為隱形搜尋圖層。所有處理都在瀏覽器中完成。

將掃描 PDF 拖放到這裡 或從裝置選取 — 掃描或圖片型 PDF 選擇 PDF

尚未選擇 PDF。加入一個掃描 PDF 使其變為可搜尋。

    尚未載入 PDF

    如何讓掃描 PDF 變為可搜尋

    1. 選擇你的掃描 PDF:檔案會在瀏覽器中讀取,不會上傳到 PDF2atom。
    2. 選擇 OCR 語言:選擇與文件文字相符的語言以獲得準確的辨識結果。
    3. 開始處理:每個頁面以高品質渲染,OCR 提取文字,並將隱形可搜尋文字圖層嵌入新的 PDF。
    4. 下載可搜尋 PDF:在任何 PDF 閱讀器中開啟 — Ctrl+F(Mac 上為 Cmd+F)現在可以在原本只有圖片的文件中找到文字。

    「讓 PDF 可搜尋」實際做了什麼

    掃描 PDF 或圖片型 PDF 只包含頁面圖片 — 即使螢幕上能看到文字,電腦也只看到像素。此工具使用 OCR(光學字元辨識)讀取這些像素,提取實際文字,並將其嵌入為新 PDF 中的隱形文字圖層。可見頁面看起來相同,但現在 Ctrl+F 可以找到文字,你也可以選取和複製文字。

    隱形文字圖層的位置與每頁的可見文字對齊,因此文字選取會遵循閱讀順序,搜尋高亮會出現在你期望的位置。

    何時需要可搜尋的 PDF

    • 掃描的合約和法律文件 — 搜尋條款、姓名、日期,無需閱讀每一頁。
    • 研究論文和學術文章 — 立即找到引用和關鍵詞。
    • 存檔的政府和醫療記錄 — 在多頁掃描中定位特定資訊。
    • 數位化書籍和手冊 — 在數百頁中搜尋。
    • 法院文件和發現文件 — 對大量文件集進行關鍵字搜尋。

    支援的語言

    Tesseract OCR 支援 12 種以上語言,包括英文、繁體中文、簡體中文、西班牙文、葡萄牙文、法文、德文、俄文、阿拉伯文、日文、韓文、義大利文、印尼文、荷蘭文、泰文和越南文。選擇主要語言以獲得最佳準確度。

    隱私與安全

    你的 PDF 會留在瀏覽器中。OCR 完全在你的裝置上執行,使用 Tesseract.js 編譯為 WebAssembly。PDF2atom 不會上傳、儲存或檢查你的文件。無伺服器端處理、無 API 呼叫、無第三方存取。

    常見問題

    建立可搜尋 PDF 時文件會上傳嗎?

    不會。OCR 和 PDF 建立完全在瀏覽器中執行,使用 Tesseract.js 和 pdf-lib。PDF2atom 不會收到你的文件。

    可搜尋 PDF 看起來會和原版不同嗎?

    可見頁面看起來相同 — 原始頁面圖片會被保留。文字圖層是隱形的,只影響搜尋和文字選取行為。

    讓 PDF 變為可搜尋需要多長時間?

    Tesseract.js 首次載入約需 4-6 秒,之後每頁約需 5-20 秒。在現代筆電上,5 頁掃描文件通常可在 2 分鐘內完成。

    數位產生的 PDF 也可以變為可搜尋嗎?

    數位 PDF 通常已有可選取文字。此工具是為掃描/圖片型 PDF 設計的。對於數位 PDF,可以跳過此步驟 — 它們已經可以搜尋。

    OCR 可以辨識哪些語言?

    英文、繁體中文、簡體中文、西班牙文、葡萄牙文、法文、德文、俄文、阿拉伯文、日文、韓文、義大利文、印尼文、荷蘭文、泰文和越南文。選擇與文件相符的主要語言。

    密碼保護的 PDF 可以使用嗎?

    密碼鎖定的 PDF 需要先使用你知道的密碼解鎖。PDF2atom 不提供破解或繞過密碼功能。

    什麼掃描品質能獲得最佳可搜尋結果?

    200-300 DPI 的掃描、良好的對比度和正確的對齊會產生最佳的 OCR 準確度。傾斜、模糊或低對比度的頁面會降低辨識品質。