企業客製化 AI 模型常陷入「不可能三角」困境。AWS Nova Forge 以「開放訓練」破解僵局,讓企業能在多階段注入專有知識,同時避免災難性遺忘,打造兼具深度與通用能力的專屬模型,將數據轉化為獨特競爭優勢。企業客製化 AI 模型常陷入「不可能三角」困境。AWS Nova Forge 以「開放訓練」破解僵局,讓企業能在多階段注入專有知識,同時避免災難性遺忘,打造兼具深度與通用能力的專屬模型,將數據轉化為獨特競爭優勢。

從「災難性遺忘」到「深度整合專有知識」:Reddit、Sony 用 Nova Forge 開放訓練解決 AI 客製化三難困境

2025/12/14 09:57

當企業試圖將通用 AI 模型客製化以融入專有知識時,往往面臨一個「不可能三角」:選擇透過提示工程 (Prompt Engineering) 或檢索增強生成 (Retrieval Augmented Generation, RAG) 進行淺層客製化,但無法將知識真正嵌入模型核心;或是持續訓練開源模型,卻面臨「災難性遺忘」 (Catastrophic Forgetting) 的風險,讓模型在學習新知識的同時失去原有的基礎能力;又或是從零開始建構模型,但成本高昂且耗時數年,只有少數頂尖企業負擔得起。

這個困境讓許多擁有大量專有數據的企業陷入兩難:通用模型無法理解自己的業務,但客製化模型的技術與成本門檻又過高。AWS 在 re:Invent 2025 大會上發布的 Amazon Nova Forge 服務,正是為了打破這個僵局。透過業界首創的「開放訓練」 (Open Training) 方法,Nova Forge 讓企業能在預訓練、中期訓練、後期訓練三個階段都注入專有知識,同時避免災難性遺忘的風險。

Reddit、Sony、Booking.com 等國際企業已經透過 Nova Forge 建立專屬的「Novellas」 (Nova 變體模型),不僅解決了 AI 客製化的技術難題,更獲得了獨特的競爭優勢。這些成功案例證明,擁有深度客製化的前沿 AI 模型,不再是只有科技巨頭才能實現的夢想。

AI 客製化的三難困境:為什麼傳統方法都有致命缺陷?

在深入了解 Nova Forge 的解決方案之前,我們需要先理解企業在 AI 客製化時面臨的三個主要困境,以及每個方法的限制。

困境一:淺層客製化無法真正嵌入專有知識

提示工程和 RAG 是目前最常見的客製化方法。提示工程透過精心設計的指令來引導模型行為,RAG 則在推理時從外部知識庫檢索相關資訊。這些方法的優點是快速且成本低,但致命缺陷是知識僅停留在模型的「表層」,並未真正成為模型理解的一部分。

舉例來說,一家製藥公司想讓 AI 模型理解其專有的化合物命名系統和實驗流程。透過 RAG 方法,模型能在推理時檢索相關文件,但它無法像人類化學家那樣「內化」這些知識,建立深層的概念連結。當面對複雜的跨領域推理任務時,這種淺層客製化就會顯得力不從心。

困境二:持續訓練開源模型會導致災難性遺忘

有些企業選擇下載開源模型 (如 Llama、Mistral) 並用自己的專有數據持續訓練。理論上,這能讓模型學習企業特定的知識。但實際上,當模型在新數據上訓練時,原本在大規模預訓練階段學到的基礎能力 (如指令遵循、常識推理、多語言理解) 會逐漸退化,這就是「災難性遺忘」現象。

想像一位學生在準備專業考試時過度專注於特定領域,結果忘記了基礎數學和語言能力。AI 模型的災難性遺忘就是類似情況:在學習企業專有知識的過程中,模型可能失去對基本語法的理解、無法正確遵循指令格式,甚至在回答簡單問題時也會出錯。這讓企業必須在「專業深度」與「通用能力」之間做出妥協。

困境三:從零建構模型成本高昂且風險極大

理想的解決方案似乎是從零開始訓練一個完全客製化的模型。但現實是,訓練一個前沿大型語言模型需要數千萬美元的運算成本、數百位專家的多年努力,以及龐大的高品質訓練數據。即使是資源充足的大型企業,也必須評估這樣的投資是否值得,因為失敗的風險極高,而且技術快速演進意味著模型可能在完成前就已過時。

這三難困境讓企業陷入兩難:要麼接受通用模型無法深度理解業務的現實,要麼承擔技術風險與高昂成本。Nova Forge 的出現,正是為了提供第四條路徑。

Nova Forge 的開放訓練:三階段注入專有知識的革命性方法

Amazon Nova Forge 的核心創新是「開放訓練」方法,這在業界尚屬首創。與傳統的客製化服務不同,Nova Forge 不僅提供訓練工具,更提供 Nova 模型在預訓練 (Pre-training)、中期訓練 (Mid-training)、後期訓練 (Post-training) 三個關鍵階段的檢查點 (Checkpoints),讓企業能在每個階段混合自己的專有數據與 Amazon Nova 精選的訓練數據集。

預訓練階段:建立領域專屬的基礎理解

預訓練是模型學習語言和世界知識的基礎階段。在此階段注入專有數據,能讓模型從根本上理解企業特定的術語、概念和領域知識。例如,一家金融機構可以在此階段注入大量的交易數據、法規文件、市場報告,讓模型建立對金融領域的深層理解,而非僅僅記住一些關鍵字。

中期訓練階段:強化任務特定能力

中期訓練專注於讓模型學習特定任務的執行方式。企業可以在此階段注入工作流程數據、標準作業程序、歷史決策記錄等,讓模型理解「如何」執行企業特定的任務。這個階段的客製化讓模型不僅知道「是什麼」,更知道「怎麼做」。

後期訓練階段:調整輸出風格與行為

後期訓練階段透過監督式微調 (Supervised Fine-Tuning) 和強化學習 (Reinforcement Learning) 來調整模型的輸出風格、語氣和行為模式。企業可以確保模型的回應符合品牌語調、遵循特定的格式要求,並展現符合企業文化的互動方式。

混合訓練數據:避免災難性遺忘的關鍵

Nova Forge 最關鍵的設計是在每個階段都將企業專有數據與 Amazon Nova 精選的訓練數據集混合。這些 Amazon 精選數據集按領域分類,涵蓋模型需要保持的通用能力。透過這種數據混合策略,模型在學習企業專有知識的同時,能持續接觸到維持基礎能力所需的通用數據,大幅降低災難性遺忘的風險。

這種方法的效果遠優於單純用專有數據訓練模型。實驗顯示,混合訓練能讓模型在學習專業知識的同時,保持核心智慧、通用指令遵循能力和安全防護機制。企業獲得的是一個既深度理解自身業務,又保有完整通用能力的前沿模型。

Reddit 案例:用單一統一系統取代多個專門模型

Reddit 是全球最大的社群討論平台之一,每天有數億則貼文和留言需要進行內容審核。在使用 Nova Forge 之前,Reddit 依賴多個不同的專門模型來處理各類審核任務:有的模型專門識別仇恨言論、有的處理垃圾訊息、有的偵測不當圖片。這種多模型架構不僅增加營運複雜度,各模型之間的判斷標準也可能不一致,導致審核品質難以控制。

Reddit 的技術長 Chris Slowe 表示:「與 Nova Forge 合作讓我們能用更統一的系統改善 Reddit 的內容審核,已經展現出色成果。我們正在用單一、更準確的解決方案取代多個不同模型,讓審核更有效率。用一個整合方法取代多個專門的機器學習工作流程,標誌著我們在 Reddit 實施和擴展 AI 方式的轉變。在安全工作上看到這些早期成功後,我們渴望探索 Nova Forge 如何幫助我們業務的其他領域。」

Reddit 透過 Nova Forge 建立的 Novella 模型,在預訓練階段注入了 Reddit 社群的語言特性和文化脈絡、在中期訓練階段學習 Reddit 的審核標準和政策、在後期訓練階段調整為符合 Reddit 價值觀的判斷方式。這個統一模型不僅簡化了技術架構,更重要的是確保了審核標準的一致性,並且隨著持續訓練能越來越理解 Reddit 社群的細微差異。

Sony 案例:100 倍效率提升的企業審查流程

Sony 集團旗下涵蓋電子產品、遊戲、音樂、電影、動漫等多元業務,內部有大量的審查和評估流程需要處理。這些流程過去高度依賴人工,不僅耗時且成本高昂。Sony 透過 Nova Forge 建立的 AI 模型,根據早期測試結果,最有前景的影響之一是能驅動一個 AI 代理,將公司審查和評估流程的效率提升 100 倍。

這種驚人的效率提升來自於模型對 Sony 內部流程、標準、術語的深度理解。一般通用模型即使透過 RAG 方法提供相關文件,也無法像人類審查員那樣理解 Sony 各業務單位的特定要求、歷史決策脈絡、跨部門協作慣例。而透過開放訓練建立的 Novella 模型,這些知識已經內化為模型理解的一部分,能像資深員工一樣進行判斷。

Sony 也透過 Amazon Bedrock 的企業級安全性、可觀測性和可擴展性,將內部企業 AI 平台部署到整個集團。目前該平台每天處理 15 萬次推理請求,預計未來幾年將成長 300 倍,協助員工起草內容、回應查詢、預測、偵測詐欺、腦力激盪和開發新想法。

Booking.com、Cosine AI、其他企業的客製化實踐

Booking.com 作為全球領先的線上旅遊平台,每天處理數百萬筆訂房、機票、租車查詢。該公司正在使用 Nova Forge 建立深度理解旅遊產業知識的 AI 模型,包括全球各地的住宿特性、旅客行為模式、季節性需求變化、區域性偏好差異等。這些知識讓 Booking.com 能提供更精準的推薦、更智慧的動態定價、更個人化的旅遊規劃建議。

Cosine AI 是一家專注於程式碼理解和自動化的新創公司。透過 Nova Forge Cosine AI 在預訓練階段注入大量的程式碼庫、技術文件、軟體工程最佳實踐,讓模型建立對軟體開發的深層理解。這個客製化模型能理解複雜的程式碼邏輯、識別潛在的技術債、建議架構改進方案,而不僅僅是生成程式碼片段。

Nimbus Therapeutics 是一家生物製藥公司,正在使用 Nova Forge 建立理解分子結構、藥物作用機制、臨床試驗數據的專門模型。Nomura Research Institute (野村綜合研究所) 則在建立深度理解金融市場、經濟指標、投資策略的模型。OpenBabylon 專注於多語言 AI,透過 Nova Forge 建立能保持多語言能力同時深度理解特定領域的模型。

這些企業的共同特點是擁有大量高價值的專有數據和領域知識,而 Nova Forge 讓他們能將這些資產轉化為獨特的 AI 競爭優勢。

三大額外功能:讓客製化更深入、更高效、更負責任

除了三階段開放訓練的核心能力外,Nova Forge 還提供三項強大的額外功能,讓企業能進一步深化 AI 客製化。

強化學習環境 (Reinforcement Learning Gyms):讓 AI 在模擬環境中學習

Nova Forge 允許企業建立自己的強化學習環境,這些環境是反映真實應用場景的合成環境。例如,一家化學公司可以建立分子設計環境,讓模型在模擬的化學反應中學習,透過獎勵機制強化能產生理想特性分子的設計決策。一家機器人公司可以建立工廠環境模擬器,讓模型學習在獎勵高效任務完成同時懲罰碰撞的情況下進行決策。

這種方法的優勢是讓模型能在安全的模擬環境中進行大量嘗試和學習,而不需要在真實世界中承擔風險或成本。模型能透過數千次模擬快速累積經驗,學會在特定環境中做出最佳決策。

合成數據蒸餾 (Synthetic Data-based Distillation):建立更小更快的專門模型

有時企業需要的不是最大最強的模型,而是能在特定任務上快速運作的小型模型。Nova Forge 支援合成數據蒸餾技術,讓企業能用較大的「教師」模型生成 AI 範例數據,然後用這些數據訓練更小、更快、但在特定任務上保持智慧的「學生」模型。

這種方法讓企業能針對不同應用場景建立模型組合:用大型 Novella 處理複雜決策,用蒸餾出的小型模型處理需要低延遲的即時任務。這種彈性讓企業能在效能、成本、速度之間取得最佳平衡。

負責任 AI 工具包:實施安全控制與內容審核

企業在客製化模型時,必須確保模型的輸出符合安全、道德、法規要求。Nova Forge 提供負責任 AI 工具包,讓企業能配置安全控制、內容審核設定、偏見偵測機制。企業可以根據特定業務需求調整設定,例如醫療產業可能需要更嚴格的隱私保護、金融產業需要確保符合監管要求、教育產業需要過濾不當內容。
這個工具包不僅提供技術控制機制,也提供測試和驗證工具,讓企業能在部署前確認模型行為符合預期標準。

從建立到部署:完整的企業級解決方案

Nova Forge 不僅是訓練工具,而是完整的端到端解決方案。當企業透過 Nova Forge 建立專屬的 Novella 模型後,可以直接將模型部署到 Amazon Bedrock,享有與所有其他 Bedrock 模型相同的企業級安全性、可擴展性和數據隱私保護。

這個整合的優勢在於企業無需管理複雜的模型部署基礎設施。Bedrock 提供完全託管的 API 端點、自動擴展能力、監控和日誌功能、版本控制機制。企業的 Novella 模型是專屬且安全地託管在 AWS 上,確保專有知識不會外洩,同時享有 AWS 全球基礎設施的可靠性和效能。

Nova Forge 也與 Amazon SageMaker AI 深度整合。企業可以在 SageMaker Studio 中建立 Novella 模型,使用熟悉的機器學習開發工具和工作流程。訓練完成後,只需幾個點擊就能將模型匯入 Bedrock 並開始在應用程式中使用。

對於需要專家協助的企業,AWS 生成式 AI 創新中心 (Generative AI Innovation Center) 提供額外的支援。該中心的專家能協助企業規劃客製化策略、優化訓練數據、調整模型架構、評估模型效能,確保企業能充分發揮 Nova Forge 的潛力。

從「租用通用模型」到「擁有專屬前沿模型」的轉變

Nova Forge 代表的不僅是技術創新,更是企業 AI 策略的典範轉移。在 Nova Forge 之前,企業只能在「租用通用模型」與「自建專屬模型」之間選擇。租用通用模型成本低但無法深度客製化,自建模型能完全客製但成本高昂且風險極大。

Nova Forge 開闢了第三條路:企業能以合理成本「擁有」深度客製化的前沿模型。這個模型結合了 Amazon Nova 的完整知識和推理能力,同時深度理解企業的特定業務。更重要的是,這個模型是企業的專屬資產,專有知識已經內化為模型理解的一部分,成為企業獨特的競爭優勢。

當 Reddit 用單一統一系統取代多個專門模型、當 Sony 實現 100 倍的審查效率提升、當 Booking.com 建立深度理解旅遊產業的 AI 能力,我們看到的不僅是技術成功,更是企業 AI 戰略的成功轉型。這些企業不再受限於通用模型的能力邊界,而是能建立真正屬於自己的 AI 智慧。

災難性遺忘、淺層客製化、高昂成本的三難困境已經有了解答。透過 Nova Forge 的開放訓練,任何擁有專有知識和數據的企業,都能將這些資產轉化為獨特的 AI 競爭力。

進一步了解或尋求專業建議

若您想深入了解如何將 Amazon Nova Forge 整合到您的 AI 策略中,或評估其如何滿足您的需求,歡迎聯絡 AWS 台灣團隊,我們的解決方案架構師將協助您設計最適合的客製化策略。

參考資料

•    Amazon Nova Forge 產品頁面
•    Amazon Nova Forge 技術部落格
•    Amazon Bedrock
•    Amazon SageMaker AI
•    AWS 生成式 AI 創新中心
•    AWS re:Invent 2025 新聞

無法去拉斯維加斯親自體驗?歡迎報名參與 Best of AWS re:Invent (AWS 雲端科技發表會) 線上參與,一樣精彩!

本文章內容由「Amazon Web Services (AWS)」提供。

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

桃園交通「主動脈塞、微血管也不通」 何志偉盼改善桃園交通環境

桃園交通「主動脈塞、微血管也不通」 何志偉盼改善桃園交通環境

CNEWS匯流新聞網記者王佐銘/桃園報導 總統府副秘書長何志偉昨(13)日赴桃園市參加親子活動時指出,長期存在的交通壅塞問題已不只是通勤不便,更牽動都市安全,影響層面涵蓋學童上下學、在地經濟發展與城市觀光等。他形容桃園交通現況「塞塞塞、累累累」,宛如「主動脈堵塞,連微血管也不通」,直言這樣的城市狀態令人憂心。他強調,桃
分享
Cnews2025/12/14 15:00
靖平專案執行 查獲191名被告羈押22人

靖平專案執行 查獲191名被告羈押22人

CNEWS匯流新聞網記者張孝義/台北報導 最高檢察署統合各級檢察機關、法務部調查局、廉政署,自113年6月至114年8月底,發動三波「靖平專案」執行綠能掃黑肅貪行動,共查獲鄉長3人、民意代表8人、公務員17人,共191名被告,羈押22人,查扣現金4308萬3000元、日幣4萬元、高級轎車3輛、名牌包及名錶等不法所得。
分享
Cnews2025/12/14 15:01