本研究基于多元化数据挖掘和机器学习集成方法改进两个方面,对于如何识别财务舞弊并提高识别效率问题提供了系统性预测方法.在多元化数据方面,不仅对传统财务因子进行了重构,而且引入公司治理层面因子并利用文本分析构建了语言类因子.在机器学习集成方法改进方面,以9种不同特质的机器学习算法作为基学习器,套用元学习框架对上市公司财务舞弊进行系统性识别.研究发现:1)元学习框架能够显著提升舞弊样本召回率和预测精确度,提高整体学习器预测性能,并且对于大部分行业都有效果;2)接近真实场景的滚动预测方法下,元学习框架依然能显著提高基学习器的财务舞弊识别能力;3)公司治理因子、语言类因子对于财务舞弊识别有一定的帮助.
张学勇,施懿.基于元学习的财务舞弊识别研究[J].管理科学学报,2023,(10):95~113