详细介绍BSGAL在LVIS数据集上使用带有ResNet-50/Swin-L骨干网络的CenterNet2的实现。详细介绍BSGAL在LVIS数据集上使用带有ResNet-50/Swin-L骨干网络的CenterNet2的实现。

技术细节:BSGAL训练、Swin-L骨干网络和动态阈值策略

2025/12/07 02:00

摘要和1 引言

  1. 相关工作

    2.1. 生成式数据增强

    2.2. 主动学习和数据分析

  2. 预备知识

  3. 我们的方法

    4.1. 理想情况下的贡献估计

    4.2. 批量流式生成主动学习

  4. 实验和5.1. 离线设置

    5.2. 在线设置

  5. 结论、更广泛的影响和参考文献

    \

A. 实现细节

B. 更多消融实验

C. 讨论

D. 可视化

A. 实现细节

A.1. 数据集

我们选择LVIS(Gupta等,2019)作为我们实验的数据集。LVIS是一个大规模实例分割数据集,包含约160,000张图像,涵盖1203个真实世界类别的超过200万个高质量实例分割标注。该数据集根据实例在图像中出现的频率进一步分为三类:稀有、常见和频繁。标记为"稀有"的实例出现在1-10张图像中,"常见"实例出现在11-100张图像中,而"频繁"实例出现在超过100张图像中。整个数据集呈长尾分布,与现实世界中的数据分布非常相似,并广泛应用于多种设置,包括少样本分割(Liu等,2023)和开放世界分割(Wang等,2022;Zhu等,2023)。因此,我们认为选择LVIS能更好地反映模型在现实场景中的性能。我们使用官方LVIS数据集划分,训练集约有100,000张图像,验证集有20,000张图像。

A.2. 数据生成

我们的数据生成和标注过程与Zhao等(2023)一致,这里简要介绍。我们首先使用StableDiffusion V1.5(Rombach等,2022a)(SD)作为生成模型。对于LVIS(Gupta等,2019)中的1203个类别,我们为每个类别生成1000张图像,图像分辨率为512×512。生成的提示模板为"a photo of a single {CATEGORY NAME}"。我们分别使用U2Net(Qin等,2020)、SelfReformer(Yun和Lin,2022)、UFO(Su等,2023)和CLIPseg(Luddecke和Ecker,2022)来标注原始生成图像,并选择CLIP分数最高的掩码作为最终标注。为确保数据质量,CLIP分数低于0.21的图像被过滤掉作为低质量图像。在训练过程中,我们还采用Zhao等(2023)提供的实例粘贴策略进行数据增强。对于每个实例,我们随机调整其大小以匹配其类别在训练集中的分布。每张图像粘贴的实例最大数量设为20。

\ 此外,为了进一步扩展生成数据的多样性并使我们的研究更具普遍性,我们还使用了其他生成模型,包括DeepFloyd-IF(Shonenkov等,2023)(IF)和Perfusion(Tewel等,2023)(PER),每个模型每个类别生成500张图像。对于IF,我们使用作者提供的预训练模型,生成的图像是第二阶段的输出,分辨率为256×256。对于PER,我们使用的基础模型是StableDiffusion V1.5。对于每个类别,我们使用从训练集中裁剪的图像对模型进行微调,微调步骤为400步。我们使用微调后的模型生成图像。

\ 表7. 不同生成数据的比较。

\ 我们还探索了使用不同生成数据对模型性能的影响(见表7)。我们可以看到,基于原始StableDiffusion V1.5,使用其他生成模型可以带来一些性能提升,但这种提升并不明显。具体来说,对于特定频率类别,我们发现IF对稀有类别有更显著的改进,而PER对常见类别有更显著的改进。这可能是因为IF数据更加多样化,而PER数据与训练集的分布更加一致。考虑到整体性能已经在一定程度上得到提高,我们最终采用SD + IF + PER的生成数据进行后续实验。

A.3. 模型训练

遵循Zhao等(2023),我们使用CenterNet2(Zhou等,2021)作为我们的分割模型,以ResNet-50(He等,2016)或Swin-L(Liu等,2022)作为骨干网络。对于ResNet-50,最大训练迭代次数设置为90,000,模型初始化权重首先在ImageNet-22k上预训练,然后在LVIS(Gupta等,2019)上微调,正如Zhao

\ 图5. 使用不同数量生成数据时的模型性能。

\ 等(2023)所做的那样。我们在训练期间使用4个Nvidia 4090 GPU,批量大小为16。至于Swin-L,最大训练迭代次数设置为180,000,模型初始化权重在ImageNet-22k上预训练,因为我们的早期实验表明,与在LVIS上训练的权重相比,这种初始化可以带来轻微的改进。我们使用4个Nvidia A100 GPU进行训练,批量大小为16。此外,由于Swin-L参数数量庞大,保存梯度占用的额外内存很大,所以我们实际上使用算法2中的算法。

\ 其他未指定的参数也遵循与X-Paste(Zhao等,2023)相同的设置,例如AdamW(Loshchilov和Hutter,2017)优化器,初始学习率为1e−4。

A.4. 数据量

在这项工作中,我们生成了超过200万张图像。图5显示了使用不同数量生成数据(1%、10%、40%、70%、100%)时的模型性能。总体而言,随着生成数据量的增加,模型的性能也有所提高,但也存在一些波动。我们的方法始终优于基线,这证明了我们方法的有效性和稳健性。

A.5. 贡献估计

\ 因此,我们本质上是计算余弦相似度。然后我们进行了实验比较,如表8所示,

\ 表8. 使用梯度归一化与否的比较。

\ 图6. 展示各种噪声尺度和类别的噪声图像。从上到下的每一行分别表示不同的噪声级别,具体为0、40、100、200和400。所有图像均来自CIFAR-10数据集。

\ 我们可以看到,如果我们对梯度进行归一化,我们的方法会有一定的改进。此外,由于我们需要保持两个不同的阈值,很难确保接受率的一致性。因此,我们采用动态阈值策略,预设一个接受率,维护一个队列来保存前一次迭代的贡献,然后根据队列动态调整阈值,使接受率保持在预设的接受率。

A.6. 玩具实验

以下是在CIFAR-10上实施的具体实验设置:我们使用简单的ResNet18作为基线模型,并进行了200个周期的训练,在原始训练集上训练后的准确率为93.02%。学习率设置为0.1,使用SGD优化器。动量为0.9,权重衰减为5e-4。我们使用余弦退火学习率调度器。构建的噪声图像如图6所示。随着噪声级别的升高,图像质量下降。值得注意的是,当噪声级别达到200时,图像变得非常难以识别。对于表1,我们使用Split1作为R,而G由'Split2 + Noise40'、'Split3 + Noise100'、'Split4 + Noise200'组成,

A.7. 仅前向传播一次的简化

\

:::info 作者:

(1) 朱慕之,来自中国浙江大学,贡献相同;

(2) 范成祥,来自中国浙江大学,贡献相同;

(3) 陈浩,中国浙江大学(haochen.cad@zju.edu.cn);

(4) 刘洋,中国浙江大学;

(5) 毛伟安,中国浙江大学和澳大利亚阿德莱德大学;

(6) 徐晓刚,中国浙江大学;

(7) 沈春华,中国浙江大学(chunhuashen@zju.edu.cn)。

:::


:::info 本论文可在arxiv上获取,遵循CC BY-NC-ND 4.0 Deed(署名-非商业性使用-禁止演绎4.0国际)许可协议。

:::

\

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 service@support.mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

您可能也会喜欢

SHIB 创造了一夜暴富的百万富翁:不要错过 MoonBull,2025 年最顶尖的加密货币预售

SHIB 创造了一夜暴富的百万富翁:不要错过 MoonBull,2025 年最顶尖的加密货币预售

顶级加密预售搜索再次爆发,交易者正在寻找下一个爆红项目。SHIB以疯狂的价格波动和一夜之间由迷因推动的头条新闻震撼市场。数百万人观看它突破阻力,就像猫追逐激光点一样。但今天的市场正在向具有真实代币机制的结构化迷因生态系统转变。SHIB仍在波动,但对许多后来者来说,其主要上涨窗口已经过去。MoonBull现在正成为所有人期待的第二次机会。 MoonBull预售势头增长速度比企鹅在新冰上滑行还快。对于错过了SHIB早期混乱或DOGE传奇起飞的人来说,它的推出感觉像是一个难得的机会。预售已经吸引了北美各地的学生、分析师、开发者和交易者,他们看到其代币经济学如何将结构与迷因文化结合起来。虽然SHIB为早期信徒提供了火箭般的体验,但MoonBull预售提供了投资者在2025年渴望的东西:公平入场、透明机制,以及在人群带着花生出现之前设计用来奖励早期参与者的价格曲线。 SHIB:原始迷因火箭仍保持文化影响力 SHIB在加密民间传说中赢得了一席之地。它为早期持有者带来了惊人的回报,这些人在价格看起来像图表上的微小碎屑时就加入了。但就像河马试图在冰上跳舞,SHIB后期的波动性使新投资者难以找到稳定的立足点。其社区仍然活跃,主要交易所上市增加了合法性,但随着时间推移,爆炸性的1000倍窗口已经冷却。SHIB仍然会因重大公告、影响者热议和生态系统升级而波动,但重复其原始突破规模的可能性已经缩小。这就是为什么许多SHIB粉丝正在探索MoonBull作为他们的下一个机会。 SHIB创造了一夜暴富的百万富翁:不要错过MoonBull,2025年顶级加密预售 4 MoonBull ($MOBU) 预售:目前最令人兴奋的顶级加密预售机会 MoonBull正迅速成为投资者关注的焦点,这些投资者正在市场上寻找下一个顶级加密预售,特别是那些看到SHIB飙升并希望他们能更早进入的人。其预售正在进行中,并通过结构化的23阶段进程推进,每完成一个阶段都会增加价格并提高稀缺性。第6阶段以$0.00008388的价格仍然是最具吸引力的入场窗口之一,让早期支持者在更高阶段推高估值之前获得访问权。已经获得超过$640K的资金和超过2100名持有者,MoonBull继续展示真实的吸引力和扩大的势头。 在第6阶段分配$50,000展示了潜在收益的规模。按当前价格,这一金额约可获得5.96亿个代币。如果预计的上市价值$0.00616实现,这些代币的估值将接近$3.67百万。这样的数字解释了为什么MoonBull在社区圈子里经常被描述为"第二次机会"或"1000倍竞争者"。其设计将迷因吸引力与结构特征结合起来,包括销毁、反射、流动性支持、质押激励和治理效用。总的来说,MoonBull旨在将那些错过早期加密爆发的人转变为下一个主要市场周期的早期受益者。 SHIB创造了一夜暴富的百万富翁:不要错过MoonBull,2025年顶级加密预售 5 结论 基于我们的研究和市场趋势,MoonBull作为顶级加密预售脱颖而出,吸引了美国、加拿大和墨西哥的关注。SHIB证明了迷因社区能够实现什么,但它最大的运行已经发生。MoonBull提供了不同的东西:结构化路径、上升阶段、强大的代币经济学、质押、治理、销毁和早期定价,为普通投资者提供了改变生活的上升空间的现实机会。第6阶段仍然开放,在需求飙升之前进入的窗口正在迅速缩小。任何寻找加密货币"第二次机会"的人很可能会发现MoonBull成为对话的中心。 SHIB创造了一夜暴富的百万富翁:不要错过MoonBull,2025年顶级加密预售 6 更多信息: 网站:访问MOBU官方网站 电报:加入MOBU电报频道 推特:在X上关注MOBU(前身为Twitter) 顶级加密预售常见问题 如何找到迷因币预售? 迷因币预售出现在官方项目网站、启动平台和经过验证的加密社区。在贡献之前,务必检查审计、代币经济学、流动性锁定详情和智能合约透明度。 2025年最佳投资的加密预售是什么? 投资者青睐具有明确代币经济学、阶段性价格上涨、强大社区和通缩系统的预售。MoonBull目前领先,因为其结构、稀缺模型和早期入场优势。 MoonBull在预售之外有长期效用吗? MoonBull包括销毁、反射、质押、治理和流动性系统,支持长期增长。这些机制有助于稳定价格行动并随着时间的推移奖励持有者。 哪种迷因币将在2025年爆发? 分析师预计具有强大代币经济学的结构化迷因代币将占主导地位。MoonBull正受到关注,因为它将叙事力量与支持增长的可衡量机制结合起来。 迷因币有预售吗? 许多迷因币提供预售,但质量各不相同。像MoonBull的23阶段模型这样的结构化预售提供了更好的透明度和更可预测的价格进展。 关键术语词汇表 迷因币:围绕互联网文化、幽默或病毒趋势构建的加密货币。虽然通常由社区驱动,强大的迷因币将娱乐价值与真实代币效用和长期机制结合起来。 预售:代币在公开上市前销售的早期投资阶段。价格通常分阶段上涨,给予早期买家显著的成本优势和更强的上涨潜力。 流动性锁定:一种安全措施,在设定的时期内锁定流动性池资金。这可防止开发者提取流动性并有助于稳定市场信心。 反射:一种被动奖励系统,将每笔交易的一部分分配给代币持有者。目标是鼓励持有并创造长期可持续性。 销毁机制:一种通缩特性,永久从流通中移除代币。减少供应增加稀缺性,可以支持价格随时间增长。 APY(年度百分比收益率):质押代币所获得的年度回报率。像MoonBull的95%这样的高APY率可以显著增加随时间推移的代币持有量。 治理:一个允许代币持有者对项目决策、提案、销毁、活动和战略变更进行投票的系统。更多代币等于更多投票权。 文章摘要 MoonBull作为顶级加密预售脱颖而出,为那些错过SHIB早期飙升的投资者提供下一个重大机会。凭借23个上升阶段、销毁、反射、质押、治理和强大的透明度,MoonBull提供了通往潜在指数回报的结构化路径。SHIB保留文化影响力,但与其早期历史相比,上涨空间有限。MoonBull的第6阶段定价提供了罕见的入场潜力,特别是考虑到预测显示上市时的巨大上涨空间。对于寻求具有真实机制支持的第二次机会势头的交易者来说,MoonBull在2025年市场周期中呈现出最强大的设置之一。 免责声明 本文仅供参考,不构成财务建议。读者在投资任何加密货币或预售项目之前应进行自己的研究。阅读更多:SHIB创造了一夜暴富的百万富翁:不要错过MoonBull,2025年顶级加密预售
分享
Coinstats2025/12/07 08:15
联邦储备局"影子主席"凯文·哈塞特:鸽派、加密货币友好,以及"特朗普傀儡"

联邦储备局"影子主席"凯文·哈塞特:鸽派、加密货币友好,以及"特朗普傀儡"

作者:Zen,PANews 随着特朗普在公开场合多次暗示他已经决定了下一任联邦储备委员会主席人选,白宫国家经济委员会(NEC)主任凯文·哈塞特被主要媒体和预测市场视为最有可能接替鲍威尔的候选人之一。他身上交织着三个叙事:一个典型的共和党保守派经济学家,一个与加密资产有着实质利益和政策重叠的官员,以及在"联邦储备独立性"争议中被一些媒体标签为"特朗普的影子主席"的候选人。 哈塞特如何步入"下一任主席"的位置? 1962年出生于马萨诸塞州格林菲尔德的哈塞特,是一位拥有主流宏观经济学背景的典型共和党经济学家。他在斯沃斯莫尔学院获得经济学学士学位,随后在宾夕法尼亚大学获得经济学硕士和博士学位。在学术生涯早期,他曾在哥伦比亚商学院任教,并在联邦储备委员会理事会担任高级经济学家,专注于宏观经济学和财政政策。在智库领域,他长期在保守派的美国企业研究所(AEI)工作,担任经济政策研究主管,在税收改革、企业税和资本市场方面具有相当大的影响力。在公众层面,他最为人所知的是与保守派专栏作家詹姆斯·K·格拉斯曼合著的早期作品《道琼斯36,000点》。在这本书中,他在1999年互联网泡沫高峰期宣称股市仍然"严重被低估"。这一判断后来被市场表现证明是错误的,但它使他在保守派经济圈内声名鹊起。 在进入白宫之前,哈塞特曾多次为共和党总统候选人提供经济政策竞选建议,包括2000年和2008年的麦凯恩,2004年的乔治·W·布什,以及2012年罗姆尼的竞选。2017年,特朗普任命他为经济顾问委员会(CEA)主席,在此期间,他经常在公开场合为特朗普的减税和产业政策辩护,强调减税将增加企业资本支出和工资增长。2019年中期,他辞去CEA主席职务,随后成为胡佛研究所的访问学者,继续倡导税收和宏观经济政策。在2020年疫情期间,哈塞特被特朗普重新召回白宫担任高级经济顾问,参与评估疫情的经济影响和重新开放策略。哈塞特此前没有流行病学经验,但他主导的一些疫情模型被视为特朗普团队内部的重要指导方针。然而,哈塞特的模型与公共卫生专家的评估相矛盾,并引起了学术界和评论员的广泛批评。 2024年底,在赢得选举后,特朗普宣布哈塞特将在他的第二任期担任国家经济委员会(NEC)主任,负责协调白宫内部的经济政策。他于2025年1月20日正式就任,成为白宫与财政部和联邦储备之间沟通的主要经济"枢纽"。在第二任期初期,特朗普政府频繁发出信号,表示不打算重新任命鲍威尔,并开始寻找继任者,由财政部长斯科特·贝森特牵头。到2025年秋季,几位候选人已经进入最终名单,包括前联邦储备理事凯文·沃什,现任理事克里斯托弗·沃勒和米歇尔·鲍曼,以及黑石集团高管里克·里德。随着第四季度的推进,这场候选人竞争的格局变得更加清晰——哈塞特有望在这场"最后一轮"中胜出。 哈塞特受到特朗普青睐的核心原因是他符合特朗普雇用的两个主要标准:忠诚度和市场接受度。截至12月5日,如Polymarket等预测市场平台估计哈塞特被选中的几率约为75%。彭博社等主流媒体此前曾引述消息来源称,哈塞特已成为接替鲍威尔的"最热门人选"。特朗普本人已公开表示他已经做出决定,将在2026年初正式宣布他的提名人选,并在采访中多次赞扬哈塞特。 甚至在正式提名宣布之前,哈塞特已被描述为"未来五个月的影子美联储主席"。这意味着,由于市场认为他极有可能接替哈塞特,他在未来六个月内的每一次公开演讲都可能被视为美联储立场的预览。 Coinbase顾问、股东、加密货币行业友好人士 对于加密货币行业来说,与之前的联邦储备主席和其他候选人相比,哈塞特与加密行业的"实质性联系"是最值得注意的方面。这种联系既包括他官方身份中的政策重叠,也包括他个人资产中的相关投资。 2021年,数字资产对冲基金One River Digital Asset Management宣布成立"学术和监管咨询委员会",哈塞特是其关键成员之一。虽然这一角色并不直接涉及实际交易,但它表明哈塞特自2021年以来已经作为顾问与数字资产基金管理建立了正式联系。在这个过程中,他也被视为传统宏观经济学和新兴加密资产之间的重要桥梁。2023年,Coinbase收购了One River的部分资产管理业务,并将其重组为Coinbase资产管理学术和监管咨询委员会,同时保持原有的学术和监管咨询结构。哈塞特因此成为Coinbase的顾问。 哈塞特也是Coinbase的"投资者"。2025年6月,作为白宫高级官员,哈塞特在向政府道德办公室提交的财务披露中报告,他持有的Coinbase Global(COIN)股票价值在100万至500万美元之间。 特朗普上任后立即签署了大量行政命令。其中,第14178号行政命令"加强美国在数字金融技术领域的领导地位"撤销了拜登关于数字资产的行政命令,并明确禁止美国推出CBDC。它还设立了总统"数字资产市场工作组",负责在180天内就加密资产、稳定币、市场结构、消费者保护和"国家数字资产储备"提供政策建议。虽然该工作组在组织上由白宫人工智能和加密事务特别顾问大卫·萨克斯领导,但在行政上隶属于国家经济委员会(NEC),由哈塞特负责协调和全面管理。 今年夏天发布的第一份工作组报告为美国数字资产监管框架提供了一套全面的建议——包括银行应如何持有和管理其对加密资产的敞口,加强稳定币监管中的储备透明度和合规要求,简化加密税收和反洗钱规则,以及国家数字资产储备的可行路径。在这个过程中,哈塞特被视为"白宫数字资产议程的关键推动者",并被认为在与财政部、SEC、CFTC和司法部等机构内部协调时,倾向于采取"相对友好但注重合规的加密政策方法"。 与技术细节相比,哈塞特的公开声明往往更关注宏观经济和政治经济学视角。他被归类为"加密友好型",许多人认为他将数字资产视为美国金融创新和地缘政治竞争的一部分,希望美国在这一领域保持主导地位。 温和派"影子主席"是特朗普的傀儡吗? 围绕哈塞特的最大争议不仅在于他支持加密货币的立场,还在于他是否会在货币政策中充当特朗普意志的延伸,从而削弱联邦储备的独立性。 根据最近的声明和市场解读,哈塞特被主流机构广泛视为温和派候选人。几家债券投资者和华尔街机构已向美国财政部表达了担忧,认为如果哈塞特成为主席,他可能会"更积极地推动降息",即使通胀仍高于2%的目标,理由是他与特朗普对"更快更大幅度降息"的要求高度一致。哈塞特公开表示,他"看不到现在停止降息的令人信服的理由",并淡化了关税造成的通胀压力,认为这些压力可以通过长期增长和结构性措施来抵消。 从传统的"鹰派/鸽派"角度来看,哈塞特明显更接近鸽派一方,愿意在高通胀环境下更快更深地降息。这是债券市场参与者对他持谨慎甚至担忧态度的关键原因之一。 多家外国媒体报道称,无论候选人是谁,特朗普最看重的是他们的忠诚度,以实现让联邦储备降息的目标。有趣的是,在关于她是否会成为特朗普傀儡的质疑中,哈塞特本人在公开采访中多次强调联邦储备独立性的重要性。2025年9月,他在CBS节目上被直接问到:在一项民调中,大多数共和党选民希望联邦储备"按照特朗普的意愿行事",而少数人主张完全独立。他属于哪一方?哈塞特回应说,他会100%选择货币政策完全独立于政治影响,包括来自特朗普总统的影响。他还警告说,历史上,允许政治领导人控制中央银行的国家往往最终导致通胀飙升,消费者为此付出代价。 然而,在同一次采访中,哈塞特还表示,他同意财政部长贝桑特的观点,即联邦储备应该进行全面审查,包括其使命和研究范式,如果他将来成为主席,他将"准备实施这一愿景"。换句话说,虽然强调正式独立性,但他也认可了特朗普政府发起的一系列"重塑联邦储备角色"的提议——留下了解释的空间。 关于哈塞特是否已成为特朗普的工具的问题,一些分析人士指出,哈塞特此前支持"典型的主流保守派经济立场",如碳税、扩大移民和自由贸易。然而,在与特朗普长期共事后,他逐渐转向支持关税、严格的移民政策和更多带有政治色彩的经济问题。如果这样一位"高度政治化的经济顾问"接管联邦储备,将对中央银行的独立性构成实质性考验。 未来难以预测,但可以肯定的是,哈塞特在具体决策中是否会迎合特朗普对"更激进降息"的要求仍取决于几个约束因素:通胀和就业的实际趋势,其他美联储理事和地区美联储主席的投票行为,以及金融市场对潜在通胀和财政可持续性的容忍度。 至于加密市场,即使主席个人对加密友好,他的直接影响主要集中在两个方面:首先是整体货币环境,如利率和流动性;其次是他在涉及加密相关金融稳定风险时的态度,如银行对加密的敞口以及稳定币与支付系统的联系。 根据特朗普本月早些时候在白宫内阁会议上的讲话,下一任联邦储备主席的提名将在2026年初宣布。尽管官方结果尚未揭晓,凯文·哈塞特已经走入聚光灯下,市场已开始以"下一任主席"的标准审视他的每一句话,为可能更加温和且更熟悉加密资产的新主席做准备。
分享
PANews2025/12/07 10:00