Tether Data 標誌著人工智能演進的新篇章,推出了 QVAC Genesis I,這是有史以來為訓練專注於 STEM 學科的語言模型而創建的最大且最先進的合成數據集。
這項由 Tether 的人工智能研究部門 QVAC 提出的倡議,旨在民主化高質量數據的獲取,用於人工智能模型訓練,挑戰大型科技公司的集中化。
此公告的核心是 QVAC Genesis I,一個包含410億個文本標記的宏偉集合。每個標記代表語言的一個片段,是人工智能模型學習理解和生成文本的原材料。
這個數據集在教育和科學基準上經過嚴格驗證,在數學、物理、生物和醫學等領域的推理和解決問題方面表現卓越。
與現有的公共數據集不同,後者往往缺乏 STEM 內容,QVAC Genesis I 為科學教育提供了全面且經過驗證的覆蓋。
這是首個公開可用的此類合成數據集,旨在支持構建更智能、更精確且具有批判性思維的語言模型。
除了技術價值外,QVAC Genesis I 的發布代表了對誰應該控制智能未來的立場。
在由少數巨頭主導的人工智能模型訓練和管理的環境中,Tether Data 旨在將權力和自主權歸還給用戶和研究人員。
目標是促進開放和社區驅動的智能,為超越大型平台範圍的科學研究和創新提供高質量數據。
根據 Tether 的執行長 Paolo Ardoino 所言,
與數據集同時,Tether Data 還推出了 QVAC Workbench,這是第一個將人工智能直接帶到用戶設備上的消費者應用程式。
它是一個完整的本地人工智能工作空間,為愛好者、進階用戶和研究人員設計。該應用支持廣泛的語言和人工智能模型,包括 Llama、Medgemma、Qwen、SmolVLM、Whisper 等。
QVAC Workbench 已經可用於智能手機(最初在 Android 上,不久後也將在 iOS 上提供)和桌面(Windows、macOS、Linux),與當前解決方案相比,提供了最廣泛的設備兼容性。
與人工智能模型的所有互動和聊天都保持本地和私密,數據仍然是用戶的專屬財產。一項名為「委託推理」的創新功能還允許移動應用與桌面應用之間的點對點連接,利用家庭或商業工作站的計算能力。
Tether Data 和 QVAC 的方法基於去中心化和適應性人工智能的願景,它在任何設備上生存和學習,將控制權和自主權歸還給個人和社區。
QVAC 的使命很明確:「本地人工智能。無限智能。不妥協。」智能不應該是機構的特權,而應該回到人民手中,確保建設、學習和分享的自由。
QVAC Genesis I 數據集是通過多階段生成和驗證過程創建的。具體來說,通過將高質量的科學和教育材料轉化為結構化學習數據。
結果是一種訓練資源,幫助模型推理、解決問題和批判性思考,超越了單純的語言模仿。
通過公開 QVAC Genesis I,Tether Data 邀請研究人員和開發者社區建立和使用能夠與專有系統競爭甚至超越它們的模型。
數據集的完整技術文檔可在專門的研究博客上獲取,為任何想要為人工智能演進做出貢獻的人提供透明度和工具。
QVAC Workbench 應用可從官方網站下載,準備好被任何希望體驗本地人工智能力量的人測試和採用。
Tether Data 符合 Tether 更廣泛的願景,旨在通過技術促進自由、透明和創新。
公司的使命是使個人和組織能夠直接連接和分享信息,無需不必要的中介。
得益於安全和點對點系統,Tether Data 為用戶提供了對數據、通信和數字互動的更大控制權。從而重新定義信息流,使用為隱私、效率和彈性設計的去中心化基礎設施。
QVAC 代表了 Tether Data 人工智能研究的前沿,致力於建立開放、去中心化和適應性智能系統。
目標是一個人工智能在每個設備上生存和學習的世界,賦予個人和社區權力,而不是將權力集中在企業數據中心。
隨著 QVAC Genesis I 和 QVAC Workbench 的發布,Tether Data 為自由、可訪問且真正掌握在每個人手中的人工智能新時代鋪平了道路。這場革命有望重新定義技術、知識和社會之間的關係。


