買幣行情現貨交易合約理財

SkyRL 引入視覺語言強化學習，實現多模態任務的可擴展訓練。了解這對 AI 發展的影響。（閱讀更多）SkyRL 引入視覺語言強化學習，實現多模態任務的可擴展訓練。了解這對 AI 發展的影響。（閱讀更多）

SkyRL 新增對多模態模型的視覺語言強化學習支援

來源：BlockChain News

2026/04/25 00:33

閱讀時長 5 分鐘

分享

如需對本內容提供反饋或相關疑問，請通過郵箱 crypto.news@mexc.com 聯絡我們。

SkyRL 新增視覺語言強化學習支援，適用於多模態模型

Joerg Hiller 2026年4月24日 16:33（UTC +8）

SkyRL 引入視覺語言強化學習，為多模態任務提供可擴展的訓練能力。了解這對 AI 開發的影響。

SkyRL 新增視覺語言強化學習支援，適用於多模態模型

SkyRL 是由加州大學柏克萊分校 Sky Computing Lab 與 Anyscale 共同開發的強化學習（RL）函式庫，近日宣布支援視覺語言模型（VLM）的後訓練。此次更新讓團隊能夠使用監督式微調（SFT）與 RL 工作流程訓練多模態模型，滿足市場對能夠同時處理視覺與文字資料之模型日益增長的需求。

電腦視覺任務、機器人技術及智能推理等多模態工作負載，要求模型處理視覺輸入、採取行動並根據回饋進行調整。SkyRL 的新功能將 VLM 提升為其訓練堆疊中的一等公民，提供可在本地 GPU 或多節點叢集上擴展訓練的工具。這建立在 SkyRL 現有基礎架構之上，該架構已支援複雜的智能任務，例如軟體工程基準測試與 Text-to-SQL 生成。

此次更新的主要功能

視覺語言任務中 RL 的核心挑戰之一，是維持訓練與推理之間的一致性。SkyRL 透過引入分離式管線來解決對數機率漂移問題——此問題在處理視覺輸入時十分常見。平台以 vLLM 推理堆疊作為唯一可信來源，確保分詞與輸入準備在各工作流程中保持一致。

此方法不僅穩定了訓練過程，還允許獨立擴展用於輸入處理的 CPU 工作執行緒，確保 GPU 吞吐量不受瓶頸限制。此次更新還支援現成的任務配方，例如 Maze2D 導航和需要視覺幾何推理的資料集 Geometry-3k。早期結果顯示，即使在較大的模型規模下（例如 Qwen3-VL 8B Instruct），訓練穩定性也有所提升。

對 AI 開發的影響

SkyRL 正將自身定位為多模態模型訓練中可擴展 RL 與 SFT 的首選平台。透過與 Tinker API 等工具整合，使用者可以在自己的基礎架構上部署 RL 工作流程，降低對外部供應商的依賴。鑑於訓練大型模型的運算需求持續增加，這一點尤為重要。

這些進展恰逢多模態 AI 系統在實際應用中需求旺盛之際。需要循序決策、視覺推理及適應能力的任務——例如自主導航和與工具的動態互動——將從中獲得顯著效益。SkyRL 的模組化設計亦支援快速原型開發，讓研究人員與開發者能夠嘗試新演算法與訓練範式。

展望未來

SkyRL 的路線圖包含序列打包、Megatron 後端支援及具備上下文並行的長上下文訓練等功能。這些升級預計將進一步增強其處理複雜智能工作負載的能力。對於渴望深入 VLM 訓練的開發者，SkyRL 提供教學課程與文件說明以協助他們快速上手。

隨著 AI 產業日益將多模態系統融入實際應用場景，高效訓練和微調此類模型的能力將成為關鍵的差異化優勢。SkyRL 的最新更新體現了其在這一演進浪潮中保持領先的承諾，為前沿 RL 研究與部署提供可擴展且模組化的框架。

圖片來源：Shutterstock

skyrl
強化學習
視覺語言模型
AI 訓練

$200,000 U 狂歡獎池不容錯過

$200,000 U 狂歡獎池不容錯過

$200,000 U 狂歡獎池不容錯過

解鎖驚喜盲盒、12% 加息券及 $200 新用戶好禮！

免責聲明: 本網站轉載的文章均來源於公開平台，僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利，請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證，並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考，不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

美國提供1000萬美元獎勵，司法部從針對美國人的詐騙中心凍結逾7億美元加密貨幣

美國提供1000萬美元獎勵，司法部從針對美國人的詐騙中心凍結逾7億美元加密貨幣

美國提供1000萬美元懸賞，司法部從針對美國人的詐騙中心凍結逾7億美元加密貨幣一文刊登於BitcoinEthereumNews.com。重點摘要：$

BitcoinEthereumNews2026/04/25 14:17

美國轟炸伊朗核設施，鈾儲量命運未明

美國轟炸伊朗核設施，鈾儲量命運未明

該文章《美國轟炸伊朗核設施，鈾儲備命運不明》發表於 BitcoinEthereumNews.com。美國已轟炸伊朗核設施，留下

BitcoinEthereumNews2026/04/25 14:33

巴西禁止非金融預測市場合約

巴西禁止非金融預測市場合約

巴西禁止非金融預測市場合約一文刊登於 BitcoinEthereumNews.com。重點摘要：巴西國家貨幣委員會禁止

BitcoinEthereumNews2026/04/25 13:56

邀請好友，雙方各得 $60

$100,000 靜待領取，先到先得！

熱門新聞

川普「金卡簽證」至今只有 1 人通過！美國政府去年喊 1 兆美元目標落漆

巨鯨兩週狂掃 4 萬顆 BTC！Santiment：牛市最強訊號正在成形

Google推出Deep Research Agent》快速上手自動跑160次搜尋產圖表，標榜研究協作級AI

伊朗否認與美國直接會談，令伊斯蘭堡和平努力陷入僵局

XRP 外流激增，多年底部形態發出可能突破的訊號

實時快訊

BNB Chain 推出非託管借貸協議「你我借」，結合 DeFi 與迷因創新，並搭載自動化 BNB 回購機制。

作者：Beauty 💢16:19

BSB 暴漲超過 70%，回調至 0.5，展現出多頭趨勢，盤面走勢可控，期間伴隨多次洗盤。

作者：Seven.七七15:55

BTC 對比 1972 年黃金。槓桿升高，預期可能出現市場洗牌。市場波動性凸顯。

作者：無名先生15:34

CoinGecko 的工具支援多資產圖表對比，提升散戶用戶對 $XLM 的分析效率。

作者：Celes 🦋15:30

資金正轉向新的敘事。BLEND 主網上線、空投與交易所活動推動了集中的買盤興趣。

作者：奶牛叔15:18

快速閱讀

BEEG 2026年價格預測：已經見頂了嗎？還是行情沒來？

BEEG 2026深度解析：巨鯨正在悄悄建倉？

XRP ETF創2026年最長連漲紀錄，機構資金強勢迴流

DOGE 多頭蓄勢待發！$0.1028 能否一舉突破？

什麼是 Peace Frog (PEACE)？加密貨幣介紹

加密貨幣價格

比特幣圖標

比特幣

BTC

$77,648.56$77,648.56

-0.49%

以太幣圖標

以太幣

ETH

$2,320.26$2,320.26

-0.14%

Tradoor 圖標

Tradoor

TRADOOR

-87.24%

Solana 圖標

Solana

SOL

+0.23%

USDCoin 圖標

USDCoin

USDC

0.00%

Roll the Dice & Win Up to 1 BTC

Roll the Dice & Win Up to 1 BTC

Roll the Dice & Win Up to 1 BTC

Invite friends & share 500,000 USDT!