AI由馬斯克創立的人工智慧公司Grok宣布推出“Grok Voice Think Fast 1.0”,這是一款全新的尖端語音助手,據稱在多項語音和推理基準測試中均取得了領先性能。該系統已部署在包括Starlink電話支援服務在內的實際運作環境中。
根據公告,該模型旨在處理客戶支援、銷售和企業營運等領域中複雜、模糊且多步驟的工作流程。它適用於需要結構化資料收集、頻繁使用工具以及精確執行使用者請求的高風險場景。
該公司表示,該模型是與包括 Starlink 在內的合作夥伴共同開發的,重點在於平衡低響應延遲、對話流暢性和運行可靠性。該系統旨在支援即時語音交互,同時保持任務執行的準確性,特別適用於需要重複使用工具和進行結構化決策的環境。
據稱,該語音代理優先考慮快速回應時間和成本效益,同時保持對話任務的效能。它旨在部署於各種應用場景,包括客戶服務營運、外撥銷售、預約安排和預訂系統。
據報道,在基準評估中,Grok Voice Think Fast 1.0 在 τ-voice Bench 排行榜上名列前茅。 τ-voice Bench 是一個評估全雙工語音系統在真實條件下(例如背景噪音、中斷、各種口音和自然的輪流說話行為)表現的框架。
該系統據稱已在涉及電話音訊、語音重疊和多語言通訊的實際操作環境中進行了測試。它支援超過25種語言,並著重強調其在全球面向客戶的環境中的適應性。
該模型的一項關鍵功能是結構化資料處理,包括收集和確認使用者提供的信息,例如姓名、地址、電話號碼、電子郵件地址和帳戶識別碼。該模型旨在處理快速語音和帶有口音的輸入,並允許在互動過程中進行糾錯。
從架構上看,該系統能夠在進行即時對話的同時並行執行後台推理,從而能夠處理複雜的查詢而不會增加回應延遲。這種設計旨在支援持續交互,同時保持對話的流暢性。
該模型還包含旨在減少錯誤但自信的反應的機制,即在極端情況下產生輸出之前引入額外的內部驗證步驟。
該系統的主要實際應用之一是將其整合到 Starlink 的客戶支援和銷售熱線中。在此環境中,該系統支援多種語言,並可處理技術支援和新用戶註冊流程。據報告,其績效指標包括:銷售相關電話的轉換率達 20%,客戶支援諮詢的自主解決率達 70%,無需人工幹預。
該系統利用大量內部工具,涵蓋硬體故障排除、服務調整、更換處理和帳戶管理等多種工作流程。此設計旨在支援透過單一語音介面即時處理端到端的客戶互動。
Source link


