以下的内容均是摘自2014BDTC【陈继东:解密蚂蚁金服基于大数据的安全和风控体系】
链接如下http://www.csdn.net/article/2014-12-05/2822961?locationNum=12&fps=1
陈继东采访问答整理如下

请首先介绍一下您公司的业务,大数据对公司业务的价值,以及您部门的职责?

陈继东:蚂蚁金服以小微企业和普通消费者为主要用户,建立以数据、技术、服务这三个开放平台为核心的金融生态,支持和帮助合作伙伴,共同为用户创造价值,旗下业务包括支付宝、支付宝钱包、余额宝、招财宝、蚂蚁小贷及筹备中的网商银行等。大数据是蚂蚁金服的核心,从数据化运营到运营数据,建立以数据为核心的信用体系。
安全智能部主要通过对海量的用户行为和关系网络数据进行预测性分析和建模,通过大数据风控体系实现交易和账户风险的实时监控和预先识别。同时通过安全数据产品,实现在DT(Data Technology)时代下金融云平台中安全云服务,帮助商户、银行及其他第三方金融机构解决网络风险和欺诈问题。

您本人曾经在不同的企业担任数据科学家,能否介绍您在项目实施中曾使用过哪些大数据技术?您对这些技术满意的地方和不满意的地方分别有什么?

陈继东:我使用过多种主流的大数据技术,包括:MPP Database如Greenplum;Hadoop生态中的MapReduce,HBase,Hive;Kafka,Storm,Spark等。
使用这些技术的综合体会:
满意:大规模离线数据分析,准实时数据查询和分析,流数据处理的优势很明显。
不满意:
1)缺乏分布式系统架构和海量数据挖掘的融合系统;
2)缺乏海量图数据挖掘所需要的实时分布式图框架和系统。

大数据在您所在的行业落地目前主要遇到哪些困难?

陈继东:这也是我对上述技术存在不满意的原因,金融级的安全和风控系统对海量数据的实时处理能力要求极高:

  • 需要高性能、高可靠性和高可用的大规模实时计算基础架构,例如毫秒级实时数据采集,传输,计算及分析等数据处理闭环;
  • 需要灵活可配置,弹性可扩展的模型和规则平台,支持实时事件处理和变量计算,分布式规则引擎,在线和离线模型开发与部署;
  • 需要海量分布式图框架来支持海量图数据上的实时查询和实时分析挖掘。

根据您的经验,企业容易犯哪些错误导致大数据项目失败?

陈继东:以下几个常见的认识误区,将会让大数据项目付出代价:

  • 盲目追求数据的“大”,而忽略数据的质量,数据的时效性,不同数据的融合;
  • 过分追求单一技术如Hadoop,期望能解决所有大数据处理的问题;
  • 过分追求通过大数据重构原有系统,大而全的大数据体系和战略,不考虑如何从原有数据库架构到新的大数据架构迁移。

人才对大数据项目的成功实施也很重要,您在大数据团队的建设方面有什么经验可以分享?

陈继东大数据人才应当需要分析能力与工程能力相结合、分析能力与业务能力相结合:通过应用驱动的大数据分析实践,来培养大数据人才,数据分析和挖掘需要具备很强的业务理解和商业能力,同时培养一定的工程实现能力。

您认为优秀的数据科学家需要哪些素质?如果有大学毕业生立志成长为数据科学家,您对他有什么建议?

陈继东:我理解的数据科学家是一类集业务和商业理解,数据分析与挖掘,分布式系统于一体的综合性人才。对于毕业生而言,从应用实践出发,从最简单最枯燥的数据清理和业务学习开始,逐步培养分析和挖掘能力,锻炼更敏锐的数据和业务感觉,才能使用数据的思想解决实际问题,创造出价值。

大数据背景下的互联网金融应用领域相关推荐

  1. 【2016年第2期】大数据背景下的治理现代化:何以可能与何以可为(上)

    刘强强,石乾新 贵州大学公共管理学院,贵州 贵阳 550025 摘要:大数据是后工业社会中信息爆炸式增长和网络计算技术迅速发展的结果.大数据时代深刻地改变着现代社会的生活方式和治理理念.分析了公共治理 ...

  2. 大数据背景下的信息资源管理

    摘要:随着网络信息化时代的日益普遍,我们正处在一个数据爆炸性增长的"大数据"时代,在我们的各个方面都产生了深远的影响.大数据是数据分析的前沿技术.简言之,从各种各样类型的数据中,快 ...

  3. 大数据架构详解_【数据如何驱动增长】(3)大数据背景下的数仓建设 amp; 数据分层架构设计...

    背景 了解数据仓库.数据流架构的搭建原理对于合格的数据分析师或者数据科学家来说是一项必不可少的能力.它不仅能够帮助分析人员更高效的开展分析任务,帮助公司或者业务线搭建一套高效的数据处理架构,更是能够从 ...

  4. 学界 | 大数据背景下,景观研究怎么做?

    在这篇文章的开头,在下并不想将很多有关于大数据景观的大概念和大理论摆出来,因为并不直观也很难理解,所以,直接想给大家分享两个案例,之后我们在逐步深入说明: 巴塞罗那大时代--用展现来强化文化遗产和社会 ...

  5. 大数据背景下网络信息安全分析探讨

    大数据背景下网络信息安全分析探讨 刘松溢 (华北理工大学 河北省唐山市曹妃甸区华北理工大学063210) 摘要:在经济快速发展的今天,大数据技术已被广泛地运用于社会生活中,这些技术的应用给人类的生产和 ...

  6. 大数据开发:大数据背景下的数据库选型

    在IT技术领域,数据库技术是重要的支撑性技术,尤其是进入大数据时代以来,海量的数据累积起来,成为庞大的数据集合,更是需要强大的数据库去完成存储支持.今天我们主要来讲讲,大数据背景下的数据库选型. 整体 ...

  7. 浅析大数据背景下电视节目的革新

    摘 要:随着互联网.云计算等相关科技的迅猛发展,大数据的运用已渗透到社会的方方面面.本文通过分析大数据在<女神的新衣>这一综艺节目中的运用,指出了此节目的创新之处,并且引出了在大数据背景下 ...

  8. 大数据产品价值主张_大数据背景下新零售商业模式探究

    摘 要:目前,大数据在生活中的应用愈发广泛,各个方面都被智能设备转化为数字,分析运用起来,大数据对销售领域的影响也特别大,通过大数据及其相关的技术和各种智能采集设备.物联网.人工智能的应用,很好地实现 ...

  9. 大数据背景下的精准广告与隐私保护

    互联网已经进入到大数据时代,"数据为王"的互联网经营模式与传统数据保护的隐私权之间,或多或少存在千丝万缕的联系.大数据商业化使用中,与用户最为密切的当属精准广告的投放,即广告商.广 ...

最新文章

  1. Moment矩计算公式
  2. Eclipse 导入项目有红感叹号的解决方法
  3. OTN交换amp;P-OTN有效减少100G网络成本(一)
  4. jQuery弹出框示例
  5. AI顶会,正在使用AI来审阅AI论文
  6. 各位加了一天班累了吧?那我们来继续未完的表单验证吧
  7. [C# 基础知识系列]专题十五:全面解析扩展方法
  8. Python中Numpy数组的归一化处理
  9. vue用户行为收集_Vue前端数据采集 埋点 追踪用户系列行为
  10. vue 跳转到选项卡_使用 DevTools 新增的 Issues 选项卡发现网页问题
  11. 最新微软Windows Server 2008之一 系统安装
  12. NGINX转发udp、tcp
  13. 谷歌pagerank算法(谷歌搜索引擎的pagerank算法的原理)
  14. 智力题解题报告No.12 倒油 倒酒 倒水问题
  15. Linux基础第一章:基础知识与基础命令
  16. 国际惯例,个人流程分享
  17. 字蛛压缩ttf字体(前端常用)
  18. 黑白lcd段码液晶屏的特点 黑白lcd段码液晶屏的应用领域
  19. vue过渡动画之——过渡类名
  20. PHP 2019年继续笑傲江湖

热门文章

  1. Servlet案例6:显示用户的上次访问时间
  2. 毕业设计,步进电机解魔方机器人
  3. IntelliJ 一键添加双引号
  4. 文件上传漏洞原理与实例测试
  5. 【转载】如何做个好员工?
  6. 一般处理程序页ashx 序列化 Json数组
  7. Driver 初始化顺序
  8. ExtJs之combobox详解
  9. 聊聊基准测试的MVP方案
  10. Android 开发 关于APP无法安装到Android模拟器上的问题