TLDRs;DeepSeek推出了V3.2-exp,这是一个实验性AI模型,将长上下文任务的推理成本降低了近一半。该模型使用"稀疏注意力"和"闪电索引器"来更高效地处理长输入。作为开放权重模型在Hugging Face上发布,它允许第三方测试和基准测试。DeepSeek面临着来自资金雄厚的中国科技公司的日益增长的竞争[...]这篇文章《新DeepSeek模型将扩展上下文的API成本减半》首次发表在CoinCentral上。TLDRs;DeepSeek推出了V3.2-exp,这是一个实验性AI模型,将长上下文任务的推理成本降低了近一半。该模型使用"稀疏注意力"和"闪电索引器"来更高效地处理长输入。作为开放权重模型在Hugging Face上发布,它允许第三方测试和基准测试。DeepSeek面临着来自资金雄厚的中国科技公司的日益增长的竞争[...]这篇文章《新DeepSeek模型将扩展上下文的API成本减半》首次发表在CoinCentral上。

新的 DeepSeek 模型将扩展上下文的 API 成本减半

2025/09/30 21:59

摘要;

  • DeepSeek推出了V3.2-exp,这是一个实验性AI模型,能将长上下文任务的推理成本降低近一半。
  • 该模型使用"稀疏注意力"和"闪电索引器"来更高效地处理长输入。
  • 作为开放权重模型在Hugging Face上发布,允许第三方测试和基准评估。
  • DeepSeek面临来自资金雄厚的中国科技巨头扩大AI投资组合的日益激烈的竞争。

中国AI初创公司DeepSeek推出了其最新的实验性语言模型V3.2-exp,旨在将长上下文任务的推理成本降低近一半。

该模型于周一宣布,旨在解决大规模AI应用中最紧迫的挑战之一:处理扩展输入的高昂成本。

V3.2-exp利用一个名为DeepSeek稀疏注意力的新系统,该系统将"闪电索引器"与用于精细token选择的辅助模块配对。

这些创新共同使模型能够专注于最相关的内容片段,同时精确管理token级别的细节。早期内部测试表明,该系统可以显著减少服务器负载,长上下文操作的API成本可能降低50%。

开放权重模型现已可用

与许多保持封闭的商业AI发布不同,V3.2-exp已作为开放权重模型推出。它现在可在Hugging Face上访问,为研究人员、开发者和企业提供了进行独立评估的机会。

这一决定凸显了DeepSeek持续推动透明度和协作的努力,尤其是在公司越来越仔细审查效率和性能声明的情况下。

该模型的开放发布也与DeepSeek今年早些时候对其R1模型采取的策略一致,当时开放基准测试允许社区验证其推理能力。通过对V3.2-exp采用相同的方法,DeepSeek表明了对其效率突破的信心。

基于过去发布的基础

V3.2-exp的推出是在DeepSeek近几个月进行的一系列更新和实验之后。今年9月初,该公司推出了DeepSeek-V3.1-Terminus,这是一项旨在提高代理性能并解决报告的问题(如难以辨认的符号和不一致的语言切换)的改进。

虽然该更新在人类最后考试和编码任务等基准测试中带来了小幅改进,但一些挑战仍然存在,特别是在中文性能方面。

同时,行业报告显示,DeepSeek正在开发一个下一代以代理为中心的模型,计划在2025年第四季度揭晓。该项目反映了行业向自主AI系统的更广泛转变,这些系统能够在最少人工监督的情况下执行多步骤任务。V3.2-exp的发布似乎通过在推出更高级的代理功能之前加强公司在效率方面的技术基础来补充这一轨迹。

竞争格局升温

DeepSeek的创新出现在中国AI领域竞争日益激烈的时期。阿里巴巴和腾讯等竞争对手正在大幅扩大其AI投资,阿里巴巴承诺投入超过3800亿人民币(529亿美元)用于云计算和AI基础设施。

虽然DeepSeek因以相对有限的资源实现成本效益的结果而受到赞誉,但分析师警告说,该公司必须保持发展势头,以避免被资金充裕的竞争对手所掩盖。

这篇文章《新DeepSeek模型将扩展上下文的API成本减半》首次发表于CoinCentral。

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 service@support.mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

您可能也会喜欢

以太坊下跌6.6%,因14亿美元ETF资金流出与鲸鱼买入相撞

以太坊下跌6.6%,因14亿美元ETF资金流出与鲸鱼买入相撞

现在以太坊面临今年最艰难的时期之一,因为ETF资金外流、长期持有者抛售和图表突破同时发生。与此同时,鲸鱼、流动性区域和即将到来的Fusaka升级将市场焦点转向ETH的未来走向。 以太坊下滑,ETF资金外流和长期抛售冲击市场 以太坊交易价格低于其7天和30天移动平均线,显示出看跌趋势,该代币一周内损失约6.6%。这一突破发生在从近期高点急剧回落之后,使ETH在美元和比特币两方面都承受压力。 以太坊看跌突破。来源:10x Research 同时,现货以太坊ETF已记录超过14亿美元的净资金外流,将机构资金从该资产中撤出。这些赎回与持有币三到十年的长期持有者加速抛售相结合,为市场增加了稳定的供应。链上数据显示,这一较老群体的抛售速度是自2021年以来最快的,该时期曾与较大波动性相吻合。 然而,大型"鲸鱼"地址正利用这一弱势进行积累。根据10x Research的数据,在最近的下跌中,他们购买了价值超过10亿美元的数十万ETH。这种积累为抛售压力提供了平衡,但在价格恢复其短期和中期移动平均线之前,整体设置对以太坊仍然偏向看跌。 以太坊测试周度流动性水平,图表显示关键结构区域 同时,根据CapoLittle的最新图表分析,以太坊正接近主要周度流动性区域。该结构突出了一系列强劲的高点和低点、流动性扫荡和趋势线反应,这些因素塑造了ETH的长期市场行为。 以太坊周度流动性区域。来源:CapoLittle 在图表上,ETH显示出几次在更高时间框架支撑位下方的流动性抓取,随后向中间范围阻力区恢复。这些扫荡通常与趋势线触及点一致,表明在价格反转之前杠杆头寸被迫平仓的位置。最新走势将ETH推回由先前扫荡和上升长期趋势线形成的支撑汇合区。 同时,图表标记了在上部阻力带附近的结构最近突破,这之前曾触发急剧上涨。如果ETH保持在其突出的流动性区域之上,该模式表明可能会反弹至上边界。然而,如果明确突破趋势线流动性区域下方,焦点将转向早期周期的更深支撑位。 以太坊正悄然为其多年来最重要的里程碑之一做准备,因为该网络正朝着定于2025年12月3日的Fusaka升级迈进。图表显示ETH从2025年5月Pectra升级后的最近回调中恢复,该升级之前曾出现53%的涨幅。以太坊Pectra到Fusaka升级图表。来源:X 分析师现在关注即将到来的升级如何塑造以太坊价格趋势的下一阶段,市场正接近网络变更和投资者预期的关键时期。
分享
Coinstats2025/11/16 22:07