• 首頁
  • 部落格
  • 智慧文件處理革命:生成式 AI 與大型語言模型的興起
Blog Doc

對企業而言,文件處理向來是耗費大量人力和時間的工作:必須手動識別文件、將文件轉送給適當負責人,以及擷取相關資訊。數十年來,人們仰賴光學字元辨識 (OCR) 技術,將影像轉換為文字,以及透過複雜度各自不同的智慧文件處理 (IDP) 解決方案,從 OCR 文字中擷取所需欄位。

現在的做法,是使用機器學習 (ML) 演算法改善傳統資料擷取方法 (例如區塊 OCR 和規則型鍵/值組合擷取技術),也就是訓練模型從結構化、半結構化和非結構化文件中擷取資料。然而,這些傳統方法通常需針對特定領域訓練機器學習模型,並為龐大訓練資料手動加上標籤,因此維護與建置都必須耗費大量時間和資源。

生成式 AI 與 LLM 的興起

隨著 IDP 不斷演進,以及近期 AI 技術大幅進步,企業開發與維護文件擷取解決方案的方式也產生變革。過去十二個月以來,生成式 AI 興起和大型語言模型 (LLM) 整合,為市場帶來前所未有的變化。這些創新技術不僅徹底改變市場,也開創嶄新可能,將先前無法自動化的文件自動化。

Deep Analysis 資深分析師兼著名 IDP 市場專家 Dan Lucarini 表示:「在長久的 IDP 發展史中,生成式 AI 是最重要的一大變革。這是有史以來,電腦首次能夠自行分類文件並擷取資料,完全不需要人工介入、訓練範例或先備知識。這在 AI 領域中稱為零樣本學習,也就是未經過事先接觸或訓練,就能識別文件。」

OpenAI GPT 系列和 Google Vertex AI 等 LLM 問世,為文件資料輸入自動化開創了全新可能。這些模型都經過大量資料的訓練,能掌握資料的個別元素和相關內容細節,因此擅長處理複雜的非結構化文件。此外,這些模型也能從廣泛的文件中擷取資訊,完全不需要事先訓練或定義規則。

運用傳統方法

雖然 LLM 革新了企業的文件處理自動化做法,但區塊 OCR、鍵/值組合擷取及機器學習等傳統方法,仍是從結構化和半結構化文件中擷取資料的最佳工具。LLM 可讓這些經實證有效的擷取技術更臻完善,進而輔助半結構化文件擷取方法。如此一來就不必建構非結構化文件模型。

Lucarini 表示:「我們經常遇到的疑問,是 GPT-4 等基礎 LLM 是否會取代根據資料集微調的機器學習模型。答案是『否』,短期內不會發生這種情況。基礎 LLM 很容易產生幻覺問題,對於必須完全準確擷取資料的傳統 IDP 應用程式而言並不可靠。此外,將基礎 LLM 用於讀取大量文件的成本太高。目前判別式機器學習模型仍是提高準確性和成本效益的最佳選擇。」

運用生成式 AI 充分提高效率

生成式 AI 仍可做為提高 IDP 產品效率的幫手。例如,使用者沒有規則運算式或程式碼編寫相關知識,也可以使用生成式 AI 提示來建立並微調新的文件模型。這項技術還能透過在文件中加上建議標籤,加快訓練階段速度。透過深入探究,使用者將能不斷發掘生成式 AI 在 IDP 中的創新應用層面,持續擴展其用途和影響。

生成式 AI 和 LLM 的最新進展,可說是掀起了一場巨大革命。這些技術不但滿足市場需求,也同時顛覆了市場態勢,為需要自動化處理大量文件的業務流程開創嶄新機會。只要融合這些創新技術與傳統擷取方法,企業就能簡化文件工作流程,將效率與生產力提升到更高境界。

Michael Guidry 簡介

user image

Michael 是 Automation Anywhere 智慧文件處理策略與營運部門總經理。

透過電子郵件訂閱 檢視所有貼文 LinkedIn
試用 Automation Anywhere
Close

業務專用

報名以快速存取完整、個人化的產品示範

學生和開發人員專用

利用雲端式 Community Edition 免費存取自動化的所有功能,立即開始自動化。