企业财务方面毕业论文开题报告范文 跟基于贝叶斯网络的企业财务报告舞弊识别有关论文如何写

该文是关于企业财务论文范文,为你的论文写作提供相关论文资料参考。

基于贝叶斯网络的企业财务报告舞弊识别

南京/高宇

摘 要:选取2007-2016年上市公司财务报告数据,利用朴素贝叶斯模型进行企业财务报表舞弊行为识别.研究结果表明,数据挖掘技术可以帮助政府监管部门、投资者、审计部门有效识别企业财务报告舞弊行为.贝叶斯网络模型在识别财务报告舞弊方面,有很好的适用性.

关键词:财务报告舞弊;数据挖掘;朴素贝叶斯模型

一、引言

目前,上市公司财务报表舞弊问题严重干扰我国证券市场的健康发展,成为证券监管部门、广大投资者等利益相关者关注的焦点问题.曾经的安然、世界通信算得上是世纪丑闻,朗讯、法尔奠、豢科等不同行业的公司相继被查出财务报告舞弊行为,然后走向衰败.2014年,注册舞弊审计师联合协会(ACFE)做的一项调查结果惊人,操作者实现财务人为控制和舞弊需要花费大量的成本,报告说美国的企业由于舞弊的损失占据每年营业收入的5%,而由此CDP每年损失了3.7万亿美元.因此,建立一套精确的财务报表舞弊识别模型,具有重要的研究意义.

传统的财务舞弊识别是通过注册会计师对企业公开发表的财务报表进行审计,发表意见.这种识别方法在很大程度上需要依赖注册会计师个人的职业判断.机器学习、人工智能已被证明是有效的检测欺诈行为的新方法.数据挖掘是指从大量残缺、模糊、有干扰的数据中发现隐藏在数据中的那些潜在有用信息的过程,这些信息通常是以规则、定义、准则、范式等方式表现出来.它既有助于当前数据的分析,又能对历史数据的分析提供便利,可以帮助决策者通过分析发现内在的联系及范式,有助于对未来情况的预测.

本研究使用数据挖掘的相关模型,基于上市公司的财务报表数据,对审计人员识别企业财务舞弊行为有参考作用,对新型审计方法的研究和应用有重要的意义.

二、文献概述

(一)国外舞弊识别模型研究现状

Fanning和Cogger( 1998)利用神经网络模型,构造了财务报表舞弊识别模型,他们从管理层的角度出发,模型中包括了财务指标和非财务指标,具有较高的识别能力.他们认为,财务报表的预期使用者、利益相关者或内部和外部审计部门可以利用该模型对公司财务状况进行初步的判断,根据初步判断的结果对公司分情况做出审计程序的调整.但由于数据样本量小,且当时没有提高算法效率的软件,模型进行训练时间较长等原因,适用度较低.

Lin等(2003)选取的财务指标都是应收账款相关指标,包括财务报表相关科目数字和财务分析比率指标,分别建立了回归模型、一般的神经网络模型、改进的模糊神经网络模型.模糊数学神经网络模型是将模糊数学理论与一般的神经网络模型相结合的改进算法.并对这三个模型进行了对比,结果表明,模糊数学神经网络模型的识别效果最好.

Kiros等(2007)探讨了数据挖掘分类技术在财务欺诈问题上的有效性,并探讨与财务欺诈发生因素的有效性.以希腊76家公司的财务报告数据为研究样本,输入向量是组成的从财务报告中提取的比率.使用了神经网络、贝叶斯信念网络及决策树三种模型,判别结果显示贝叶斯信念网络的性能最好,正确率高达90.3%.神经网络、决策树模型的准确率分别为80%、73.6%.

Chi-Chen Lin等(2015)采用数据挖掘方法,包括逻辑回归、决策树( CART)、人T神经网络(ANN).从实验结果看出,人工神经网络、决策树方法与正确的训练和测试样本分类率为91.2% (ANN)、90.4%( CART)、92.8%( CART)、90.3%( CART),比逻辑回归更加精确(只达到83.7%、83.7%).

(二)国内舞弊识别模型研究现状

梅国平等( 2006)首先根据公开审计意见确定研究样本:其次,根据会计和审计专业知识选取47个财务指标进行T检验:然后,选取了sPss软件进行主成分法对88家企业进行主成分分析.并用80家企业样本进行预测模型检验,预测准确率达95%.

邓庆山等( 2009)根据传统标准,选取了T类(舞弊)、F类(真实)样本,其中1999-2002年数据作为训练集(各44家),2003-2006年数据作为测试集(73和99家),使用BP神经网络模型进行训练,选择10个变量、6个变量、3个变量进行了三组实验.结果表明,使用6个变量的总体识别率最高达91.86%,说明BP神经网络准确率高、泛化能力强.

于彪等( 2011)考虑到传统数据挖掘方法的局限性、实证效果有所偏差,样本数据分布不平衡,分类技术中两类错误发生的成本有差异等特点,建立了一种成本控制型支持向量机模型,选取260个样本的数据集(117个舞弊样本,143个非舞弊样本).对实验是否进行特征选择,是否引入错分样本惩罚参数做了四组对照实验.实验证明,样本数据中加入特征选择,识别率更高;当两类错误分类成本(即设置惩罚参数)为5:1时,降低了一类错误率(即将舞弊样本分类成非舞弊).

刘澄等( 2013)运用了分类回归树算法,利用相似的思路,对沪深上市公司财务报表数据进行检测,准确率分别为88.32%、88.98%,证明了利用分类回归树进行财务报表舞弊识别也是一种不错的分类方法.

目前,国内外学者对财务报告舞弊的识别方法有多种,但主要集中在经典的数学模型,如逻辑回归模型、主成分分析、多元判别等,而使用数据挖掘方法、识别方法研究较少,而且在指标的选择上,数量较少,存在一定的主观缺陷并且未经过统计方法的筛选.

三、理论依据

(一)数据挖掘

数据挖掘技术的基础理论及应用研究已得到很大的发展.在现实中己遍及金融业、交通运输业、医疗保健业、电信业、房地产业等领域.

目前,数据挖掘在财务领域主要运用于财务分析、财务预警、财务管理和决策上.而在审计方面运用相对较少.因此,将数据挖掘等新的方法和技术运用于财务报表舞弊中以帮助审计人员的预诊断和评估风险是很有必要的,而分类在数据挖掘与机器学习中扮演着一项非常重要的角色,它可以获得先验经验进行未知数据的分类与预测.自上世纪70年代以来,世界各国对财务报告舞弊识别的研究相关模型方法丰富多样.通过总结国内外的研究成果,财务报告舞弊识别的相关方法有:线性概率模型、逻辑回归模型、神经网络模型、贝叶斯分类模型、多元判别分析,决策树、主成分回归模型、支持向量机模型、聚类分析等.

(二)贝叶斯网络

贝叶斯网络是一种概率网络,它是基于概率推理的图形化网络,而贝叶斯公式则是这个概率网络的基础.贝叶斯网络是基于概率推理的数学模型,就是通过一些变量的信息来获取其他概率信息的过程.基于概率推理的贝叶斯网络是为了解决不定性和不完整性问题而提出的,它对解决复杂设备不确定性和关联性引起的故障有很大的优势,在多个领域中获得广泛应用.Duda和Hart于1973年提出了基于贝叶斯公式的朴素贝叶斯分类器NBC(Naive Bayes Classifier).NBC 是一个简单有效而且在实际使用中比较成功的分类器、,其性能可以与神经网络、决策树分类器相当,在某些场合下优于其他分类器.

四、研究设计

(一)数据来源与软件选择

本研究的数据来源于国泰安数据库,数据来源准确、可靠、原始.考虑到我国自2007年1月1日起开始执行新的会计准则,2007年前后上市公司财务指标相关数据存在统计口径不一致的问题,因此样本选择的时间区间为2007-2016年.操作软件使用的是RStu-dio.R语言近年来在数据可视化、数据挖掘中展现了强大的优势.对于一些复杂模型.使用R语言,无需自己编写模型程序,利用R语言内置的包,少量代码即可以分析复杂的问题,十分方便,且可视化效果好.

(二)样本选择

l 财务报告舞弊样本的选择

选取被中国证监会查处的上市公司作为财务报告舞弊即失真样本.全部样本中,选择审计结果为有舞弊嫌疑,且有明确违规处理的样本.共163个样本、80家公司.

2.财务报告真实样本的选择

相对于财务报告舞弊企业的样本,对照样本即财务报表真实样本的选择较为困难,且可信度有待商榷.根据我国审计单位出具的上市公司财务报表审计报告的审计意见的类型,分为5种:标准的无保留意见、带强调事项段的无保留意见、保留意见、否定意见、无法表示意见.为了核定确保真实可信的非舞弊样本,流量>0且利润率>o且审计结果仅为“标准无保留意见”或“无保留意见加事项段”或“无保留意见加说明段”这3种审计意见结果,从无违规记录.共77214个记录、1319家公司.

(三)指标选择与数据预处理

在结合审计专业知识的基础上,按企业的长期偿债能力、短期偿债能力、发展能力、风险水平、经营能力、盈利能力、流量中选取财务分析指标.考虑了数据的可获得性、完整性,并剔除了缺失值过量以及明显重复的变量指标,得到了42个财务指标.在开始进行模型建立前,必须将源数据进行清洗,预处理包括部分指标的计算、均值插值(线性插值法)补齐源数据中空值,或去除NA值,去除重复记录.为了对分类模型进行训练和预测,按照参考文献的思路,分为训练集和测试集.

五、实证结果及分析

(一)皮尔森相关性检验

考虑到6类财务分析指标已是建立在成熟的理论体系上归纳总结出来的,所以判断只需要分列在各自财务方向里做相关检验是合理的.通过进行皮尔森相关检验,筛选出24个指标.相关检验部分结果,如表1所示.

(二)实证结果

第一类错误,是指将财务报告舞弊判定为非财务报告舞弊;第二类错误,是指将非财务报告舞弊判定为财务报告舞弊.实际上,把财务报告舞弊判定为非财务报告舞弊即第一类错误的成本,远远高于将非舞弊公司误判为财务报告舞弊的代价即第二类错误.经统计,两类错误识别率,如表2所示.

六、结论

验证结果表明:贝叶斯网络在识别企业财务报告舞弊行为的一类错误率、二类错误率分别为37.14%,20.99%,综合正确率达70.9%.贝叶斯网络即使在概率分布不完全符合样本真实的情况下,依然得到了较优的分类效果.如果优化模型,相信结果更好.由于舞弊样本数量小,大量样本也可能呈现不同的结果.

数据挖掘在识别财务报告舞弊方面具有独特优点,也是开展大数据审计时代的起点,特别是有监督的数据挖掘技术是进行财务报告舞弊的识别的主要工具.

本研究使用的朴素贝叶斯模型取得了较好的效果.但在数据处理过程中NA值太多,导致舞弊数据测试样本量较少,对最后的准确率可能有一定的影响.实际上,非舞弊样本中可能存在大量的舞弊样本,对舞弊、非舞弊样本的训练有一定的影响.贝叶斯网络中还包括其他多种算法,相应的还有很多改进算法,其适用范围、优缺点各不相同.本研究主要采用的是标准算法,还可以通过改进算法进行实验证明.

企业财务论文范文结:

适合企业财务论文写作的大学硕士及相关本科毕业论文,相关企业财务开题报告范文和学术职称论文参考文献下载。

1、企业财务报表分析论文

2、企业集团财务管理论文

3、企业财务分析论文

4、企业并购财务风险论文

5、企业财务风险的分析和防范论文

6、企业财务风险论文