SkyRL แนะนำการเรียนรู้แบบเสริมแรงด้วยภาษาและภาพ ช่วยให้การฝึกอบรมสำหรับงานมัลติโมดัลขยายขนาดได้ เรียนรู้ว่าสิ่งนี้ส่งผลต่อการพัฒนา AI อย่างไร (อ่านเพิ่มเติม)SkyRL แนะนำการเรียนรู้แบบเสริมแรงด้วยภาษาและภาพ ช่วยให้การฝึกอบรมสำหรับงานมัลติโมดัลขยายขนาดได้ เรียนรู้ว่าสิ่งนี้ส่งผลต่อการพัฒนา AI อย่างไร (อ่านเพิ่มเติม)

SkyRL เพิ่มการรองรับ Vision-Language RL สำหรับโมเดลมัลติโมดัล

2026/04/25 00:33
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com

SkyRL เพิ่มการรองรับ Vision-Language RL สำหรับโมเดลมัลติโมดัล

Joerg Hiller 24 เม.ย. 2026 23:33

SkyRL แนะนำการเรียนรู้เสริมแบบ vision-language ที่ช่วยให้การฝึกสำหรับงานมัลติโมดัลสามารถขยายขนาดได้ เรียนรู้ว่าสิ่งนี้ส่งผลต่อการพัฒนา AI อย่างไร

SkyRL Adds Vision-Language RL Support for Multimodal Models

SkyRL ซึ่งเป็นไลบรารีการเรียนรู้เสริม (RL) ที่พัฒนาโดย Sky Computing Lab ของ UC Berkeley และ Anyscale ได้ประกาศรองรับการฝึกหลังการเทรนสำหรับโมเดล vision-language (VLM) การอัปเดตนี้ช่วยให้ทีมงานสามารถฝึกโมเดลมัลติโมดัลโดยใช้เวิร์กโฟลว์การปรับแต่งแบบมีผู้ดูแล (SFT) และ RL ตอบสนองต่อความต้องการที่เพิ่มขึ้นสำหรับโมเดลที่สามารถจัดการข้อมูลภาพและข้อความได้พร้อมกัน

ภาระงานมัลติโมดัล เช่น งาน computer vision, หุ่นยนต์ และการใช้เหตุผลแบบ agentic ต้องการให้โมเดลประมวลผลข้อมูลภาพ ดำเนินการ และปรับตัวตามข้อเสนอแนะ ฟังก์ชันใหม่ของ SkyRL ทำให้ VLMs เป็นพลเมืองชั้นหนึ่งในชุดการฝึก พร้อมมอบเครื่องมือในการขยายการฝึกข้ามกลุ่ม GPU ในเครื่องหรือคลัสเตอร์หลายโหนด สิ่งนี้ต่อยอดจากโครงสร้างพื้นฐานที่มีอยู่ของ SkyRL ซึ่งรองรับงาน agentic ที่ซับซ้อนอยู่แล้ว เช่น เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์และการสร้าง Text-to-SQL

คุณสมบัติหลักของการอัปเดต

หนึ่งในความท้าทายหลักของ RL สำหรับงาน vision-language คือการรักษาความสอดคล้องระหว่างการฝึกและการอนุมาน SkyRL แก้ปัญหาการเลื่อนของค่าความน่าจะเป็นของบันทึก ซึ่งพบได้บ่อยเมื่อประมวลผลข้อมูลภาพ ด้วยการแนะนำไปป์ไลน์แบบแยกส่วน โดยใช้ชุดการอนุมาน vLLM เป็นแหล่งข้อมูลที่ถูกต้อง แพลตฟอร์มนี้ช่วยให้การสร้าง token และการเตรียมข้อมูลนำเข้ายังคงสอดคล้องกันตลอดเวิร์กโฟลว์

แนวทางนี้ไม่เพียงช่วยให้การฝึกมีเสถียรภาพ แต่ยังช่วยให้สามารถขยาย CPU worker สำหรับการประมวลผลข้อมูลนำเข้าได้อย่างอิสระ เพื่อให้แน่ใจว่าปริมาณงาน GPU ไม่ถูกคอขวด การอัปเดตนี้ยังรองรับสูตรสำเร็จรูปสำหรับงานเช่น Maze2D navigation และ Geometry-3k ซึ่งเป็นชุดข้อมูลที่ต้องใช้การใช้เหตุผลทางเรขาคณิตด้วยภาพ ผลลัพธ์เบื้องต้นแสดงให้เห็นถึงเสถียรภาพในการฝึกที่ดีขึ้นแม้ในขนาดโมเดลที่ใหญ่ขึ้น เช่น Qwen3-VL 8B Instruct

ผลกระทบต่อการพัฒนา AI

SkyRL กำลังวางตำแหน่งตัวเองเป็นแพลตฟอร์มหลักสำหรับ RL และ SFT ที่ขยายขนาดได้ในการฝึกโมเดลมัลติโมดัล ด้วยการผสานรวมกับเครื่องมืออย่าง Tinker API ผู้ใช้สามารถปรับใช้เวิร์กโฟลว์ RL บนโครงสร้างพื้นฐานของตนเอง ลดการพึ่งพาผู้ให้บริการภายนอก สิ่งนี้มีความสำคัญเป็นพิเศษเมื่อพิจารณาถึงความต้องการการคำนวณที่เพิ่มขึ้นสำหรับการฝึกโมเดลขนาดใหญ่

ความก้าวหน้าเหล่านี้เกิดขึ้นในช่วงเวลาที่ระบบ AI มัลติโมดัลเป็นที่ต้องการอย่างสูงสำหรับการใช้งานในโลกแห่งความเป็นจริง งานที่ต้องการการตัดสินใจแบบต่อเนื่อง การใช้เหตุผลด้วยภาพ และความสามารถในการปรับตัว เช่น การนำทางแบบอัตโนมัติและการโต้ตอบแบบไดนามิกกับเครื่องมือ จะได้รับประโยชน์อย่างมาก การออกแบบแบบโมดูลาร์ของ SkyRL ยังรองรับการสร้างต้นแบบอย่างรวดเร็ว ช่วยให้นักวิจัยและนักพัฒนาสามารถทดลองใช้อัลกอริทึมใหม่และรูปแบบการฝึกได้

มองไปข้างหน้า

แผนงานของ SkyRL ประกอบด้วยฟีเจอร์ต่างๆ เช่น sequence packing, การรองรับ Megatron backend และการฝึก long-context ด้วย context parallelism การอัปเกรดเหล่านี้คาดว่าจะช่วยเพิ่มขีดความสามารถในการจัดการภาระงาน agentic ที่ซับซ้อนยิ่งขึ้น สำหรับนักพัฒนาที่กระตือรือร้นที่จะเริ่มต้นการฝึก VLM SkyRL มีบทเรียนและเอกสารประกอบเพื่อช่วยให้เริ่มต้นได้

เมื่ออุตสาหกรรม AI ผสานรวมระบบมัลติโมดัลเข้าสู่กรณีการใช้งานจริงมากขึ้น ความสามารถในการฝึกและปรับแต่งโมเดลดังกล่าวอย่างมีประสิทธิภาพจะเป็นปัจจัยสำคัญที่สร้างความแตกต่าง การอัปเดตล่าสุดของ SkyRL สะท้อนถึงความมุ่งมั่นที่จะอยู่แนวหน้าของวิวัฒนาการนี้ โดยมอบเฟรมเวิร์กที่ขยายขนาดได้และเป็นโมดูลาร์สำหรับการวิจัย RL ล้ำสมัยและการปรับใช้งาน

แหล่งที่มาของภาพ: Shutterstock
  • skyrl
  • การเรียนรู้เสริม
  • โมเดล vision-language
  • การฝึก ai
ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

สหรัฐฯ เสนอรางวัล 10 ล้านดอลลาร์ ขณะที่ DOJ อายัดคริปโตกว่า 700 ล้านดอลลาร์ จากศูนย์หลอกลวงที่มุ่งเป้าชาวอเมริกัน

สหรัฐฯ เสนอรางวัล 10 ล้านดอลลาร์ ขณะที่ DOJ อายัดคริปโตกว่า 700 ล้านดอลลาร์ จากศูนย์หลอกลวงที่มุ่งเป้าชาวอเมริกัน

โพสต์ สหรัฐฯ เสนอรางวัล 10 ล้านดอลลาร์ ขณะที่ DOJ อายัดคริปโตมูลค่ากว่า 700 ล้านดอลลาร์ จากศูนย์หลอกลวงที่มุ่งเป้าชาวอเมริกัน ปรากฏบน BitcoinEthereumNews.com ประเด็นสำคัญ: $
แชร์
BitcoinEthereumNews2026/04/25 14:17
สหรัฐฯ ทิ้งระเบิดสถานที่นิวเคลียร์ของอิหร่าน ชะตากรรมของคลังยูเรเนียมยังไม่แน่นอน

สหรัฐฯ ทิ้งระเบิดสถานที่นิวเคลียร์ของอิหร่าน ชะตากรรมของคลังยูเรเนียมยังไม่แน่นอน

โพสต์ สหรัฐฯ ทิ้งระเบิดสถานที่นิวเคลียร์ของอิหร่าน ชะตากรรมของสต็อกยูเรเนียมยังไม่แน่นอน ปรากฏบน BitcoinEthereumNews.com สหรัฐฯ ได้ทิ้งระเบิดสถานที่นิวเคลียร์ของอิหร่าน โดยทิ้งไว้
แชร์
BitcoinEthereumNews2026/04/25 14:33
บราซิลออกคำสั่งห้ามสัญญาตลาดการทำนายที่ไม่ใช่ทางการเงิน

บราซิลออกคำสั่งห้ามสัญญาตลาดการทำนายที่ไม่ใช่ทางการเงิน

โพสต์ Brazil Issues Ban on Non-Financial Prediction Market Contracts ปรากฏบน BitcoinEthereumNews.com สาระสำคัญ: สภาการเงินแห่งชาติของบราซิลได้สั่งห้าม
แชร์
BitcoinEthereumNews2026/04/25 13:56

ข่าวสดตลอด 24/7

มากกว่า

ทอยลูกเต๋า & ลุ้นรับสูงสุด 1 BTC

ทอยลูกเต๋า & ลุ้นรับสูงสุด 1 BTCทอยลูกเต๋า & ลุ้นรับสูงสุด 1 BTC

ชวนเพื่อน & รับส่วนแบ่ง 500,000 USDT!