0


基于DIKW框架下搜索技术在大数据审计中的应用研究

1.引言

    随着国内信息化进程的不断加快,审计作业环境已经发生了巨大变化,如何开展好大数据审计工作是每个审计组织都亟待研究的课题。当前,大数据审计面临**需要采集哪些数据**和**如何开展数据分析两大关键性问题**,为进一步推动大数据审计工作走深走实,本文从DIKW框架的角度出发阐述其在大数据审计中的应用,并基于DIKW框架探索如何用好搜索技术,更好解决大数据审计所面临的关键性问题。

2.大数据和审计的联系

    纵观人类发展的历史长河,我们不难发现,当今世界的数据生成量达到了前所未有的高峰,而且这种数据的涌现已不再受制于时空的束缚。孟小峰、慈祥(2013)指出,从开始采用数据库作为数据管理的主要方式开始,人类社会的数据产生方式大致经历了**运营式系统阶段、用户原创内容阶段、感知式系统阶段三个阶段**。今天的我们正处于感知式系统阶段,该阶段的主要特征是感知式系统的广泛使用,使得极其微小的带有处理功能的传感器不断产生新的数据,而这种数据的产生方式又是自动的,最终**自动式的数据导致了大数据的产生。**

** **大数据时代下,审计作业环境已经发生了巨大变化,传统的审计方法难以满足现代审计的需求,这要求审计人员具有数字化审计的思维,明确大数据如何取和怎么用。

3.DIKW框架在大数据审计中的应用研究

3.1DIKW框架的概述

    董华、隋小宁(2021)指出,Ackoff早在1989年的《从数据到智慧》一书中,便提出“数据—信息—知识—理解力—智慧”的五层级框架,该五层级框架便是DIKW的初始形态。但后期的学者对Ackoff的五层级框架提出质疑,普遍认为智慧来源于理解力,与理解力密不可分,因此可以将理解力归为智慧层级,因而有了信息管理领域专家更多接受的DIKW四层级框架模型。

33eb8c0c31f345539b0c07901f5f905f.jpeg

    在DIKW框架中,数据是最基本的,通常包括数字、文字、图像、符号等。通过对数据进行加工处理,使庞杂且离散的数据变成有意义的信息。将信息与个人经验与能力结合,用于解决实际问题,信息就转化为了知识。当人们真正掌握了某个知识,并懂得如何去理解、解读现实,知识就变成了智慧。DIKW框架较好地展现了数据是如何一步步转化为信息、知识乃至智慧的过程。

3.2 DIKW框架在审计中的应用

3.2.1DIKW框架与审计

    大数据时代,审计所需采集的数据可以按内外部进行划分:一方面包括源自被审计单位内部的财务、业务和管理数据;另一方面,也包括来自被审计单位外部的各种互联网数据,然而,面临如此浩瀚的数据源,想要实现全部采集并不现实的。那么对于数据量庞大、数据结构复杂、价值密度较低的大数据如何快速获取有用信息,将有用信息转化为知识进而提炼为智慧,成为很多审计人的迫切需求。因此,通过引入DIKW框架有利于我们更好地理解大数据审计过程中数据、信息、知识与智慧互相转化的关系。

3.2.2研究分析

    在日常审计工作,审计人员实际上已经有意无意地应用DIKW框架来开展审计工作,即审计期间沿着“数据-信息-知识”的正向传播路径来开展审计业务。首先,通过搜索采集如文字、图像等一大堆零散的、待处理的原始数据。其次,审计人员对这些原始数据进行整理和分析,使之成为有用信息。最后,当这些信息被用作解决审计工作中遇到的问题时,便会逐渐转化为知识。

f723f3c90f44409f9e01fb6030dce0ac.jpeg

    而有些审计人员为了更快寻找到审计重点,明确所需要收集到的信息,则会沿着“知识-信息-数据”的反向传播路径来开展审计工作。首先,通过搜索与审计项目相关的案例,借鉴别人的知识来明确审计思路和审计重点。其次,审计人员对相关的案例进行整理和分析,把案例中所采用的审计方法与所采集的审计数据进行提炼形成信息。最后,根据这些提炼的信息搜集相关数据。

c988bf1ba98d48d9917b781d61870c50.jpeg

    但在当今大数据时代下,各种数据与信息呈爆炸式增长,信息的多样性、新颖性、分散性、无序性等使得我们无法准确快速获取想要的信息,因此,不管是沿着正向传播路径还是反向传播路径,**搜索**是第一步,也是最重要的一步。  

3.3基于DIKW框架下搜索技术在大数据审计中的应用

    在开展大数据审计期间,面对**如何确定审计所要采集的数据**和**如何有效处理所采集到的数据**两大关键性问题,审计人员可以尝试沿着“知识-信息-数据”的DIKW框架反向传播链条,通过有效运用搜索技术打开突破口。

3.3.1 搜索的基本应用流程

    **信息搜索的本质就是找什么、哪里找和怎么找的问题**,可以用“2W1H”来表示,也就是What(找什么)、Where(哪里找)、How(怎么找)。“找什么”需要搜索者准确描述自己想要搜索的目标;“哪里找”需要搜索者找到垂直搜索的网站或渠道;“怎么找”需要搜索者掌握高级搜索指令及其他搜索方法。

    一般而言,搜索过程主要包括**分析搜索问题、明确搜索过程和优化搜索结果三大流程,具体如下:**首先,分析要搜索的问题是搜索过程的第一步,也是最关键的一步。搜索诉求是否明确会直接影响最终的搜索结果,搜索引擎是机器,需要明确表达搜索诉求,精简搜索内容,避免口语化搜索。其次,明确搜索过程。搜索者的搜索需求和对象往往是多样化的,针对不同的搜索需求和对象,要选择合适的搜索渠道,制定明确且合理的搜索过程。最后,优化搜索结果。搜索引擎往往会为我们呈现纷繁复杂且良莠不齐的搜索结果,因此我们需要学会过滤无用信息,快速定位我们真正准确有用的搜索结果。

3.3.2 具体应用研究

3.3.2.1“小切口”,缩小搜索口径

    一个审计项目可以划分为不同的类型,不同类型的审计项目包含了不同的审计内容,不同的审计内容往往包含多个维度多个方面。据《“十四五”国家审计工作发展规划》,我国审计项目可以根据审计目标的不同划分为政策落实跟踪审计、财政审计、国有企业审计、金融审计、农业农村审计、资源环境审计、民生审计和经济责任审计八大类型。

    以财政审计为例,我们可以将其审计内容划分为部门预算执行及决算草案审计、重点专项资金审计、政府债务审计、税收、非税收入和社会保险费征管审计、重大公共工程投资审计和国外贷援款项目审计。黄溶冰、王跃堂(2010)指出,衡量政府审计的质量,在明确审计监督发挥作用的方式(抵御、揭露、预防)基础上,还必须综合考虑效力、效果的综合作用。即,不同的审计内容可按照抵御、揭露、预防、效力和效果五个维度进行划分,其中:抵御维度侧重审查涉及国家经济安全的违法违纪行为、揭露维度侧重审查与被审计单位有关人员的一般过失或重大过失甚至是贪污舞弊有关的行为、预防维度侧重审查被审计单位对内部风险应报未报、应检未检等行为、效力维度侧重审查被审计单位查实违法违纪问题的情况,效果维度侧重审查被审计单位以前年度审计处理落实的情况。

    为进一步明确审计重点,我们可以围绕“政治-政策-项目-资金”主线对被审计单位的资金项目进行合理的细分拆解,再根据不同的维度,对不同的资金项目按维度特征划分成不同方面,如财政审计(类型)-部门预算执行及决算草案审计(内容)-农机购置补贴支出(资金项目)-揭露维度-骗取、虚报等方面。

    我们通过坚持“小切口”的原则,对审计项目**按照“类型-内容-资金项目-维度-方面”进行细分拆解**,**再根据“类型+内容”、“内容+资金项目”、“资金项目+方面”等方式进行组合检索**,这样能够有效缩小搜索口径,更快地找到我们所需要的信息。

表1 常用检索关键词(以部门预算执行及决算草案审计为例)

类型

内容

资金项目

维度

方面(关键词)

财政审计

部门预算执行及决算草案审计

XXX补贴

抵御

应发未发、挪用、截留等

揭露

骗取、虚报、冒领等

预防

应关注风险、程序合规性等

XXX工程

抵御

应缴未缴、挪用、截留等

揭露

套取、多结算、拖欠等

预防

违规建设、未批先行等

……

……

……

关键词来源:根据审计署历年公告、互联网上的公开审计报告词频分析

及知网有关论文整理的结果。

3.3.2.2“强相关”,提高搜索精度

    通过“小切口”的原则,我们能够有效地缩小搜索口径,但为进一步优化搜索的结果,提高搜索的精度,我们需选取合理的检索关键词或者短语作为检索的基础,再结合搜索引擎所提供的高级搜索语法,对纷繁复杂的无用信息进行过滤。

    以财政审计中的部门预算执行及决算草案审计为例,首先,通过“类型+内容”的组合检索方式,我们能够检索出全国各省市县不同地区的财政审计报告,了解不同地区财政审计工作的开展总体情况,为后续审计工作的开展打下基础。其次,通过“内容+资金项目”的组合检索方式,我们能够检索出全国各省市县不同地区的财政审计所发现的审计问题,明确后续审计工作应关注的重点。最后,通过“资金项目+方面”的组合检索方式,我们能够有效挖掘全国财政审计工作开展的具体审计思路,并结合自身审计工作进行迁移学习,明确大数据审计工作开展的思路和所需要采集的数据。

    大数据审计更多是一种思维,而不是某一种技术手段。对于部分审计组织而言,在各方面条件相对不成熟的条件下,通过高效的搜索方式,能够有效避免“从0到1”的艰苦探索过程,借助互联网信息大爆发的“东风”,“多快好省”地学习借鉴全国各地区审计组织开展大数据审计的思路,从而推动大数据工作做实做细。

表2 常用网络搜索引擎的搜索语法

序号

搜索语法

用途

1

关键词+空格+site:(目标网址或网址类型)

在某个指定网站内搜索

2

filestype:(文件格式)+空格+关键词

搜索结果为指定文件格式

3

关键词+空格+intitle:需要限定的关键词

限定搜索标题中包含关键词

4

关键词+空格+半角模式下的减号+想要排除的关键词

限定搜索结果中不包含某些关键词

5

intext:关键词

限定搜索结果的描述里包含关键词

6

inurl:关键词

限定搜索结果的网址中包含的字段

7

关键词+空格+20xx..20xx/ 时间1..时间2

限定搜索结果的时间范围
8"关键词 "确保搜索结果中包含完整的关键词组合。‌
来源:互联网主流搜索引擎整理所得

3.3.2.3 “广撒网”,拓宽搜索渠道

    为进一步拓宽搜索渠道,我们可以在不同的平台进行检索来确保更广泛和深入的检索。**一是以社交媒体为主的自媒体平台。**社交平台作为信息传播的重要渠道,很多重要咨询和消息都在社交媒体上发布,如微信的公众号、政府官网等都可以作为信息检索的来源。**二是以专业知识为主的数据库平台。**如CNKI、万方、PubMed等专业的数据库和学术资源网站,能够提供大量高质量的学术文献和研究成果,我们即学习有关审计项目的审计思路,也可以借鉴他们所提出的建议。三**是以交流分享为主的在线社区和讨论组。**通过加入与搜索主题相关的社区,如微信群、CSDN等能够与其他成员进行充分的交流和分享经验,获得更多有价值的信息和建议。

4.结语

   通过应用DIKW框架,我们既可以沿着“数据-信息-知识”的正向传播链条对所采集到的数据进行分析核查,也可以沿着“知识-信息-数据”的反向传播链条,广泛涉猎审计项目相关案例,借鉴相似的审计思路进行迁移学习,更好地明确需要采集哪些数据和如何开展数据分析,以此进一步推动大数据审计的发展。此外,笔者认为该框架应该不仅仅只能应用于审计领域、应该也能应用于论文写作、信息工程等其他领域,不过其他领域如何“切分”,如何“组合检索”更加有效,这就需要大家的探索了,如果大家探索出来了希望能够不吝分享,不胜感激~~

    当然,笔者还只是审计路上的一名小白,一些看法可能显得过于粗糙,如有不当之处请大家海涵并批评指正~~

5.参考来源

  1. 孟小峰,慈祥.大数据管理:概念、技术与挑战【J】.计算机研究与发展,2013,(01):146-169.
  2. 董华,隋小宁.数字化驱动制造企业服务化转型路径研究——基于DIKW的理论分析【J】.管理现代化,2021,(05):72-76.
  3. 刘星,牛艳芳,唐志豪,.关于推进大数据审计工作的几点思考【J】.审计研究,2016,(05):3-7.
标签: 大数据

本文转载自: https://blog.csdn.net/2301_79824026/article/details/140505714
版权归原作者 审计小白 所有, 如有侵权,请联系我们删除。

“基于DIKW框架下搜索技术在大数据审计中的应用研究”的评论:

还没有评论