我们使用最初来自OpenML的表格数据集,这些数据集被编译成HuggingFace上Inria-Soda团队的一组基准数据集。我们在28,855个训练样本上进行训练,并在剩余的9,619个样本上进行测试。所有MLP都使用批量大小为64、64和0.0005进行训练,我们研究了每层有100个神经元的3层结构。我们在此定义了我们工作中使用的六个主要指标。我们使用最初来自OpenML的表格数据集,这些数据集被编译成HuggingFace上Inria-Soda团队的一组基准数据集。我们在28,855个训练样本上进行训练,并在剩余的9,619个样本上进行测试。所有MLP都使用批量大小为64、64和0.0005进行训练,我们研究了每层有100个神经元的3层结构。我们在此定义了我们工作中使用的六个主要指标。

极客的机器学习实验指南

摘要和1. 引言

1.1 事后解释

1.2 分歧问题

1.3 鼓励解释共识

  1. 相关工作

  2. Pear: 事后解释器一致性正则化器

  3. 共识训练的有效性

    4.1 一致性指标

    4.2 改进共识指标

    [4.3 一致性的代价是什么?]()

    4.4 解释是否仍然有价值?

    4.5 共识和线性

    4.6 两个损失项

  4. 讨论

    5.1 未来工作

    5.2 结论、致谢和参考文献

附录

A 附录

A.1 数据集

在我们的实验中,我们使用了最初来自OpenML的表格数据集,这些数据集由Inria-Soda团队编译成一组基准数据集并发布在HuggingFace上[11]。我们提供每个数据集的一些详细信息:

\ 银行营销 这是一个二元分类数据集,具有六个输入特征,类别大致平衡。我们在7,933个训练样本上进行训练,并在剩余的2,645个样本上进行测试。

\ 加州房价 这是一个二元分类数据集,具有七个输入特征,类别大致平衡。我们在15,475个训练样本上进行训练,并在剩余的5,159个样本上进行测试。

\ 电力 这是一个二元分类数据集,具有七个输入特征,类别大致平衡。我们在28,855个训练样本上进行训练,并在剩余的9,619个样本上进行测试。

A.2 超参数

我们的许多超参数在所有实验中都是恒定的。例如,所有MLP都使用64的批量大小和0.0005的初始学习率进行训练。此外,我们研究的所有MLP都有3个隐藏层,每层100个神经元。我们始终使用AdamW优化器[19]。训练轮数因情况而异。对于所有三个数据集,当𝜆∈{0.0, 0.25}时,我们训练30轮,否则训练50轮。在训练线性模型时,我们使用10轮训练和0.1的初始学习率。

A.3 分歧指标

我们在此定义我们工作中使用的六个一致性指标。

\ 前四个指标取决于每个解释中最重要的前k个特征。让𝑡𝑜𝑝_𝑓𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘)表示解释𝐸中最重要的前k个特征,让𝑟𝑎𝑛𝑘(𝐸, 𝑠)表示特征𝑠在解释𝐸中的重要性排名,让𝑠𝑖𝑔𝑛(𝐸, 𝑠)表示特征𝑠在解释𝐸中重要性分数的符号(正、负或零)。

\

\ 接下来的两个一致性指标取决于每个解释中的所有特征,而不仅仅是前k个。让𝑅是一个函数,用于计算解释中按重要性排序的特征排名。

\

\ (注:Krishna等人[15]在他们的论文中指出,𝐹应该是由最终用户指定的一组特征,但在我们的实验中,我们使用此指标时包含所有特征)。

A.4 无用特征实验结果

当我们为第4.4节的实验添加随机特征时,我们将特征数量翻倍。我们这样做是为了检查我们的共识损失是否会通过比自然训练的模型更频繁地将不相关特征放在前K位而损害解释质量。在表1中,我们报告了每个解释器将随机特征之一包含在前5个最重要特征中的百分比。我们观察到,总体而言,我们没有看到在𝜆=0.0(没有我们的共识损失的基准MLP)和𝜆=0.5(使用我们的共识损失训练的MLP)之间这些百分比的系统性增加

\ 表1:无用特征获得前5名排名的频率,以百分比计。

A.5 更多分歧矩阵

图9:本文考虑的所有指标在银行营销数据上的分歧矩阵。

\ 图10:本文考虑的所有指标在加州房价数据上的分歧矩阵。

\ 图11:本文考虑的所有指标在电力数据上的分歧矩阵。

A.6 扩展结果

表2:我们训练的模型的平均测试准确率。该表按数据集、模型、损失中的超参数和权重衰减系数(WD)组织。平均值是通过多次试验得出的,我们报告平均值±一个标准误差。

A.7 额外图表

图12:使用不同lambda值训练的MLP在银行营销数据集中随机构建的10个三点平面上的logit曲面。

\ 图13:使用不同lambda值训练的MLP在加州房价数据集中随机构建的10个三点平面上的logit曲面。

\ 图14:使用不同lambda值训练的MLP在电力数据集中随机构建的10个三点平面上的logit曲面。

\ 图15:所有数据集和指标的额外权衡曲线图。

\

:::info 作者:

(1) Avi Schwarzschild,马里兰大学帕克分校,马里兰州,美国,以及在Arthur工作期间完成的工作(avi1umd.edu);

(2) Max Cembalest,Arthur,纽约市,纽约州,美国;

(3) Karthik Rao,Arthur,纽约市,纽约州,美国;

(4) Keegan Hines,Arthur,纽约市,纽约州,美国;

(5) John Dickerson†,Arthur,纽约市,纽约州,美国(john@arthur.ai)。

:::


:::info 本论文可在arxiv上获取,采用CC BY 4.0 DEED许可证。

:::

\

市场机遇
SIX 图标
SIX实时价格 (SIX)
$0,01277
$0,01277$0,01277
+%0,63
USD
SIX (SIX) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 service@support.mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

您可能也会喜欢

Solana Treasury Stocks: 为什么这些公司正在大量购买SOL?

Solana Treasury Stocks: 为什么这些公司正在大量购买SOL?

这篇文章《Solana 国库股票:为什么这些公司大量购买 SOL?》发表在 BitcoinEthereumNews.com。在 2020 年,大家都看到 Strategy(当时称为 Microstrategy)大量购入比特币,使企业加密货币国库成为主流话题。现在,一股新浪潮正在形成。而它以 Solana 为中心。数十家公司持有 SOL 作为对价格的押注。但他们不仅仅是持有。他们正在建立所谓的 Solana 国库或数字资产国库(DATs)。这些不是被动的金库。它们是积极的策略,进行质押、赚取收益,并与快速增长的 Solana 生态系统相连。在纳斯达克上市的公司 Forward Industries 最近购买了超过 680 万枚 SOL,使其成为全球最大的 Solana 国库公司。其他如 Helius Medical、Upexi 和 DeFi Development 也在遵循类似的策略,将 SOL 变成其资产负债表的核心。趋势很明显:Solana 国库股票正在成为一类新的加密货币相关股票。对投资者来说,问题不仅是谁在买入,还有为什么这种策略传播得如此之快。主要亮点:Solana 国库(DATs)是企业 SOL 储备,旨在通过质押和 DeFi 赚取收益。Forward Industries、Helius Medical、Upexi 和 DeFi Development Corp 等公司现在持有数百万枚 SOL。上市公司共持有 1710 万枚 SOL(约 40 亿美元),这使 Solana 成为最被采用的国库之一。与比特币国库不同,Solana 持有量每年产生 6-8% 的回报。它使储备变成了生产性资产。Solana 国库股票正在成为投资者间接接触 SOL 的新方式。风险依然存在:波动性、监管和集中持有。但企业采用正在迅速增长。什么是 Solana 国库(DAT)?Solana 国库,有时称为数字资产国库(DAT),是指公司在其资产负债表中持有 SOL。但与比特币国库不同,这些通常不仅仅是存放在冷存储中的静态储备。关键区别在于生产力。SOL 可以直接质押...
分享
BitcoinEthereumNews2025/09/21 06:09
日本加密资产分离课税或将于2028年1月实施

日本加密资产分离课税或将于2028年1月实施

深潮 TechFlow 消息,12 月 17 日,据CoinDesk JAPAN报道,日本政府计划将加密资产(虚拟货币)的申报分离课税政策推迟至2028年1月1日实施。政界相关人士透露,尽管市场预期随着金融商品交易法修订案在明年通常国会通过后,新税制可能于2027年内实施,但政府更倾向于在确认金商法下的市场状况后再推行
分享
Tech Flow2025/12/17 14:30
日本央行加息前夜,为何比特币先跌为敬?

日本央行加息前夜,为何比特币先跌为敬?

撰文:David,深潮 TechFlow 12月15日,比特币从90,000美元跌到85,616美元,单日跌幅超过5%。 这一天没有什么暴雷和负面事件,链上数据也看不出异常抛压。如果只看币圈的新闻,你很难找到一个「说得过去」的理由。 但同一天,黄金报价4,323美元/盎司,较前一日只跌了1美元。 一个跌5%
分享
Tech Flow2025/12/17 14:24