6月20日,由上海国家会计学院主办,用友、元年科技、中兴新云、金蝶集团、浪潮集团联合主办的“信息技术赋能会计融合创新”高峰论坛暨2020年影响中国会计人员的十大信息技术评选结果发布会在上海国家会计学院国际会议中心顺利举行,本次论坛揭晓了2020影响中国会计从业人员的十大IT信息技术的评选结果,并邀请各界嘉宾对入选的十项当前影响的信息技术和五项潜在影响的信息技术进行深入解读。

数据挖掘技术在本次评选中排名第九。对此,浪潮集团大数据产品部总经理王相成和首都经济贸易大学教授、博士生导师王海林分别进行了分享解读。

数据挖掘是财务理论研究领域的重大热点。从财务职能的角度,目前学术界以及企业界普遍认同数据挖掘是支持财务会计向管理会计转型、传统财务核算职能向审计、理财、投资、决策支持、参与管理等职能转移的重要支撑。从财务信息化的角度,数据挖掘是目前企业财务云阶段向智能财务转型跃升的阶梯。

财务信息化发展经历四个阶段,分别是:会计电算化阶段、集团财务阶段、财务云阶段、智能财务阶段。会计电算化替代了手工核算,集团财务阶段实现了联网应用集中核算,财务云阶段主聚焦共享业态融合。业态融合形成以财务为核心的企业经营大数据,如何提升数据智能水平成为智能财务阶段的关键问题。实际上,智能财务阶段的实现离不开两项关键技术:RPA技术和数据挖掘技术。随着RPA技术的推进,财务机器人逐渐替代流程化规则化的财务工作。财务人员将精力转移至智能洞察、感知、预测等更多参与企业管理的方面,而这个转变更多依赖数据挖掘技术。

从一个西瓜的故事开始判断一个西瓜是好是坏最简单直接的方法就是将其切开,但从结果而言已经为时已晚。如果在切西瓜之前能知道西瓜是好是坏,这样的信息就能带来价值,实际上就是预测,也是数据挖掘的典型应用。

究竟能否预测西瓜是好是坏?答案是肯定的。但培养挑瓜经验需要进行大量学习和体验,有经验的买瓜人会关注外皮、根茎、花纹、声响等。用数据挖掘的方式挑瓜也需要训练,首先选择样本并记录瓜的特征、色泽、根蒂、纹理、含糖量等,形成标签式的西瓜数据集。之后将数据集分为两类,一是测试集用来训练提炼模型,二是验证集用来验证模型准确率。这是一个典型数据挖掘的过程。

从上述西瓜的案例中可以提炼出数据挖掘的内涵:从西瓜的各项特征信息,记录、存储为西瓜数据集,进行数据清洗、数据转换,然后利用分类、回归等算法进行建模,形成预测知识,并将分析结果进行商业化应用,产生预测价值的过程。实际上,数据挖掘是从大量数据中挖掘有趣模式和知识的过程,数据挖掘是一个跨学科的计算机科学分支,它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。

理想与现实的差距理想的数据挖掘似乎非常容易实现,但实际应用数据挖掘时往往面临很多困难。需求确定后如何进行提取数据、如何进行数据质量清洗、如何处理数据整合、数据缺失值等基础工作是至关重要的,反而数据挖掘训练模型、模型评估相对比较简单。

挖掘的过程。因此企业运用数据挖掘的整个架构不仅仅是数据挖掘工具本身,而应该是比较完整的系统支撑。需要良好的底层数据基础,而数据基础依赖于企业业务、财务系统中积累数据的质量以及各系统之间能否打通、互相整合。数据基础之上是数据治理,通过大数据管理平台管理数据,之后是机器学习平台,典型功能包括特征工程、模型训练、模型发布等最终分析结果的呈现依赖于各种可视化的展示工具。

浪潮云眼机器学习平台在原来传统数据处理ETL,数据管理平台的基础上预置了60多类分类、回归、聚类、时间序列算法组件,用拖拉拽的形式嵌入其中构建模型,提供模型评测组件自动评测,让没有数据挖掘编程技能的人员快速运用数据挖掘,与传统数据挖掘相比开发实践部署更便捷,另外利用数据处理任务调度也可以实现定时模型训练和应用。

应用场景以及对财务人员的影响从长远来看,数据挖掘在企业中有广阔的应用空间,目前财务、生产、供应、销售、人力管理、机械设备、原材料、生产工艺方法等各个领域有适用场景,更多应用场景也将随着实践不断的补充完善。总体而言,数据挖掘能够解决下列问题:第一,从文本中提取信息。比较典型的场景是在凭证摘要中提取关键信息。第二,预测数值。例如通过预置回归算法预测公司未来一年营业收入以及成本。第三,发现异常。寻找经营风险、数据异常现象等等。第四,聚类问题,包括发现盈利较多的产品或是可以长期合作的客户。第五,在多个指标类别中进性预测,例如根据历史经验预测新增的客户是否为优质客户。第六,图像分类,将不同人员、设备、单据和产品质量能通过图像识别技术识别。

数据挖掘技术将从角色定位、所在部门、要素范围、维度模式、分析方式等方面对会计人产生影响。会计人员由会计师向数据分析师和算法工程师转变。未来基础工作未来将逐渐被RPA机器人取代,财务部门变成了数据分析部门,掌握企业质量最高的数据。同时从单一金额数据向时间、地区、渠道、货物等多维度数据延伸。传统财务报表向更复杂标签云、信息流空间等更多可视化方式呈现。“了解原理,掌握工具”是对于财务人员在数据挖掘领域的学习建议。对于会计人员来讲,员需要了解数据挖掘原理并掌握基本的数据挖掘工具相关技能。

在线专家解读

王海林

首都经济贸易大学

教授、博导

专家解读:

数据挖掘是从海量数据中提炼有价值的模式和发现知识的过程。这个过程中需要综合利用数据库和数据仓库、统计分析、信息检索、模式识别、机器学习和神经网络、高性能计算、数据可视化等多方面技术。数据挖掘技术具有处理的数据规模大、数据源结构不同且多样化、挖掘发现的规则动态变化等特点。在财务、会计和审计领域,可以利用数据挖掘技术探查企业存在的问题、预测企业的未来走向,为利益相关者提供更有效的决策支持。全球范围内数据挖掘技术已经成功应用在企业持续经营状况的分析诊断、信用风险的监测评价、财务舞弊的识别预防、财务困境和企业绩效的预测等方面。数据挖掘技术的深度应用将有助于打破会计边界,加速会计与业务的融合。

扫码获取报告电子版

???

统计学习基础:数据挖掘、推理和预测_数据挖掘——智能财务进阶之梯(含视频、PPT)...相关推荐

  1. 统计学习基础:数据挖掘、推理和预测_百度零基础深度学习笔记(三) 波士顿房价预测...

    波士顿房价预测 波士顿房价预测是一个经典的机器学习任务,期待构建一个房价预测模型,其数据中包含13个影响房价的因素和该类型房屋均价. 波士顿房价影响因素 数据预处理 数据预处理包括: 数据导入 数据形 ...

  2. autolisp统计相同元素个数_统计学习基础知识

    统计:广义上讲,统计是一门"收集.整理.分析和解释数据或信息的科学".统计是有关数据的科学,设计数据的收集.分类.汇总.分析以及数字信息的解释. 统计方法是一种用于研究.分析和学习 ...

  3. 统计学习基础——第六章 线性模型选择与正则化

    目录 一.子集选择 1.原理 2.最优子集选择 (1)原理 (2)不足:计算效率不高. (3)改进:分支定界法. 3.逐步选择 (1)作用 (2)向前逐步选择 (3)向后逐步选择 (4)混合方法 4. ...

  4. 贝叶斯线性估计----统计学习基础

    前言 本来是想看模型uncertainty的,也不知怎么就回溯到了这里,建议提前看下极大似然估计,最大后验估计,贝叶斯公式. 线性回归 这里以一个多维的特征向量举例:假设输入样本为x\bm{x}x,模 ...

  5. 【深度学习基础】:线性代数(三)_逆矩阵与伪逆矩阵

    一.矩阵的逆 定义 2.Python 2.1  Numpy import numpy as npA = np.array([[1,2],[3,4]])# 求逆矩阵A_inv = np.linalg.i ...

  6. python数据挖掘算法的书籍_机器学习和数据挖掘推荐书单

    有了这些书,再也不愁下了班没妹纸该咋办了.慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧! <机器学习实战> 本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍 ...

  7. 统计学习/机器学习常用小知识

    文章目录 统计学习的特点 统计学习的方法 机器学习的步骤 统计学习的目的 统计学习的应用领域 机器学习的主要任务 分类与回归的区别 1. 输出不同 1.1分类问题是输出**物体的所属类别**,而回归问 ...

  8. AI之路(二)——关于统计学习(statistical learning)Part 1 概论

    从今日起,正式开启AI之路,在人工智能学习领域,无论机器学习还是深度学习,统计学习是入门的最好参考教材,是不可或缺的.因此,这漫漫求索之路,就从统计学习开始吧. 我所选择的是李航所著的统计学习(第二版 ...

  9. 数据挖掘的好书_数据挖掘经典书籍

    数据挖掘 入门读物: 深入浅出数据分析 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了 R 是大加分.难 易程度:非常易. 啤酒与尿布 通过案例来说事情,而且是最经典的例子.难易程度:非 ...

最新文章

  1. linux kafka进程挂了 自动重启
  2. 《编写可读代码的艺术》读后总结
  3. 正式发布!中国首个LF Edge捐赠项目Baetyl 2.2发布
  4. Gecko浏览器引擎
  5. SYN 攻击原理以及防范技术
  6. 使用独立主机时需要关注的问题
  7. c语言求平衡因子,平衡二叉树(AVL树)的基本操作
  8. 将本地已经存在的代码跟github上新建的仓库建立关联,解决“fatal: 'origin' does not appear to be a git repository...”
  9. (58)FPGA面试题-只使用双输入NAND门,设计了一个四输入NAND门
  10. java写pdf_java写出PDF
  11. java int 详解,int与Integer详解(java基础篇)
  12. [转]把复杂事物简明化
  13. 关于STM32系列单片机中断触发时间问题
  14. vue-cli配置环境:
  15. [MVC学习笔记]4.使用Log4Net来进行错误日志的记录
  16. codeforces Roud499Div2 B和C
  17. 一千行代码铸造Terminal文本编辑器
  18. 【模拟IC】闩锁效应的概念,产生原因,工作过程及解决方案
  19. 视频剪辑计算机配置要求,视频剪辑需要电脑的什么配置
  20. 常用github开源地址

热门文章

  1. python读文件代码-Python遍历文件夹和读写文件的实现代码
  2. python培训比较好的机构-学Python去哪家培训机构比较好?
  3. python填写excel-Python向excel中写入数据的方法
  4. python编程难吗-Python、C+这些编程语言难吗?十岁女孩告诉你答案
  5. python3.6在线编译器-CPython 解释器 与 VC 编译器版本对应关系
  6. 精通python-精通Python设计模式
  7. LeetCode Excel Sheet Column Number(进制转换问题)
  8. 程序员保值的五个关键点
  9. Java中合成与继承的选择
  10. 题目1483:求最大最小数