基于大规模智能体模型的经验验证协议

Sylvain Barde博士

Sylvain Barde和Sander van der Hoog,讨论文件KDPE 1712, 2017年7月。

非技术总结

尽管最近在将基于主体的模型(ABMs)引入数据方面取得了进展,但模型参数的估计或校准仍然是一个挑战,特别是当涉及到大规模基于主体的宏观经济模型时。大多数方法,如模拟矩法(MSM),都需要对新数据进行环内模拟,这对于计算量大的模型来说可能是不可行的。然而,由于ABMs正在成为政策制定的重要工具,因此能够正确地验证它们是一个相关的问题,以便可以将它们与其他与政策相关的模型进行比较。

基于Salle & Yildizoglu(2014)之前的工作,我们的工作提出了一个新的3阶段协议,用于验证计算要求高的仿真模型。该协议的主要优点是它依赖于一组度量,这些度量都是“现成的”软件,只需要协调它们的实现:

1.高效采样和数据生成:该协议首先使用Cioppa和Lucas(2007)的近正交拉丁超立方(NOLH)设计对ABM的参数空间进行有效采样。随后使用ABM在NOLH提供的样本点上生成模拟数据。这是计算量很大的一步,只需要执行一次。

2.使用MIC评分和经验数据进行概率建模:首先使用模拟数据对每个样本点训练Barde (2016a,2016b)的马尔可夫信息准则(MIC)算法,然后对经验数据进行评分。它通过将预先确定的NOLH参数校准点集映射到使用MIC分数作为适应度度量的适应度景观,从而提供了一个“响应面”。

3.使用kriging对MIC响应面进行代理建模:在最后阶段,我们使用kriging (Krige, 1951)来生成MIC响应集的代理模型,并获得插值的“MIC响应面”。通过对这个更简单的模型进行优化,可以相对快速地找到可能具有更好性能的新候选样本点。

三阶段协议应用于Dawid等人(2016,2017)的Eurace@Unibi模型。这种宏观ABM表现出强烈的突发性行为,能够产生各种各样的非线性经济动态,包括内生的商业和金融周期。此外,它是一个计算量很大的模拟模型,因此它适合我们的目标用例。用于分析的实证数据包括来自30个OECD国家和欧元区的3个宏观经济数据(工业生产、CPI和失业率)的月度数据。

根据协议的第一步,使用NOLH设计对模型的8个核心参数生成513个不同的样本点。第一阶段生成的模拟数据由每个样本点1000个时间段的1000个模拟序列组成。由于单个系列需要运行13分20秒,因此生成完整的系列需要114,000 CPU小时。虽然使用高性能计算(HPC)集群加快了这一过程,但Eurace@unibi仍然是一个需要模拟的沉重模型。相比之下,在第二阶段使用MIC对数据进行评分只需要513个CPU小时。

将该协议应用于Eurace@unibi模型得到了很好的结果,对Eurace@unibi的几个参数进行了严密的估计。通过在通过优化响应面获得的新点样本上重新运行协议,并验证克里格模型提供的预测MIC值是否与通过验证练习获得的实际MIC分数相匹配,来测试克里格模型的质量。kriging模型预测的MIC分数与重新运行整个协议得到的MIC分数之间的相关性非常高(0.926),证实了kriging模型提供了准确的MIC响应面插值。

虽然这个练习为协议提供了一个成功的概念验证,特别是在克里格阶段,但也发现了几个弱点。首先,如果需要进一步的样品,NOLH设计不能轻易扩展。这可以通过使用另一种设计来弥补,例如sobol序列,它可以更容易地扩展。另一个缺点是MIC测量依赖于单变量条件,这可能会在多变量设置中引入测量误差,并降低响应面的准确性。解决这个问题需要使用多变量版本的MIC,这是正在进行的研究的重点。

你可以下载完整的论文在这里