访谈摘要

访谈时间:2019-02-27下午

访谈地点:XX基金

访谈对象:客户IT人员和业务人员

客户现状

客户使用X环的先知平台,客户认为平台提供的notebook使用体验较差,如执行代码依赖的库较多以及一些尚未解决的缺陷。

问题汇总

1、当前X环的notebook有哪些缺点?

使用效率低:X环提供了在notebook中读取DB、hive等数据源中数据的能力,但是需要导入X环特定的库,而且需要写相应的代码,导致编码效率不高。

对中文支持差:输出结果如图中有中文标注或输出的数据中有中文时,呈现为乱码。用户提到在图中标注中文还是普遍的操作。

Pyspark中无法画图:Pyspark内核中对python中的画图lib库不支持,对于Pyspark产生的数据,需要先导出,然后再另起python内核的notebook再画图。

2、客户对notebook的需求?

1)支持中文

2)输出支持交互,特别提到能支持输出图片的下载或导出,能支持输出数据的下载(包括不限于csv、excel格式)

3)用户提到希望能提供类似spyder的界面(能看到代码、运行完的变量、管理工作空间)

4)提供notebook的版本管理能力

5)希望能对整个平台中的notebook提供集中管理的能力,即能有一个中央库能存储所有用户提交的notebook,严格控制该库的删除权限

6)希望支持多人协作的能力

7)支持上传本地数据

8)需要支持分布式内核pyspark3

9)使用python3多于Python2,Pyspark也基于Python3多

3、用户对我司产品notebook的意见?

1)对镜像管理功能比较感兴趣,从交流中可感知其它产品未提供类似的能力

2)对总体功能设计比较认可,希望能进行体验

3)用户对notebook中输出结构的可视化和交互式的功能比较看重

4、用户数据的特点?

1)数据来源有DB以及Hive、HDFS,而且不仅仅是从这些数据源中读取数据,而且会进行数据写回;由于都是内部环境,所以认为是安全性的,因此较少有安全性上的考虑。

2)对于工作流,用户希望算子(分析模块)的数据也可以可选择的写入到DB、文件进行持久化存储

3)数据规模,上千的特征,800多万行

5、用户模型的特点

1)吃内存,算力要求不高(用户提到的实际数据规模:上千的特征,800多万行)

2)模型更新要快

3)用户倾向于选择可解释性强的算法,这样业务人员在向客户推荐基金时可以有针对性,而不仅仅是一个用户名单。

6、用户对算法库等的版本要求

1)一般不会使用最新的版本,但也不会差太多,如在新模型的开发中会使用稳定的次新的版本,

2)对于已发布运行的模型,不会去更新算法版本

3)对于学术界发布的新算法,用户会尝试实验和验证

访谈总结

1、在notebook中必须能很好的支持中文。

2、简化在notebook中引用机器学习平台中数据集、分析模块的步骤或过程。

3、目前看其它平台提供的notebook时,对jupyter的定制不多,因此,增强的notebook输出可视化以及可交互功能会提升产品的竞争力,。

4、考虑提供notebook的全平台的集中管理能力,即用户可以将实现好的notebook提交到集中管理平台,从而实现共享,类似kaggle提供的“Public”功能。

5、考虑提供notebook的版本管理能力。

XX基金 机器学习平台使用情况访谈总结相关推荐

  1. XX银行 机器学习平台使用情况访谈总结

    访谈摘要 访谈地点:XX银行 访谈对象:客户IT部门的负责人 客户现状 客户部署的平台为某友商的XXX Miner,并由某友商对产品功能进行了定制,主要是根据客户具体的数据处理场景需要扩充了算子.平台 ...

  2. XX证券 机器学习平台使用情况访谈总结

    访谈摘要 访谈时间:XX 访谈地点:XX证券 访谈对象:客户IT人员和业务人员 客户现状 客户对X环.X范以及YYY都有使用经验: 使用对象包括客户的IT人员和业务人员:IT人员具有编程.代码开发能力 ...

  3. 机器学习平台跃迁,AI中台才是大势所趋

    本文转载自公众号"宜信技术学院",原标题为<AI中台:一种敏捷的智能业务支持方案>. 随着"数据中台"的提出和成功实践,各企业纷纷在"大中 ...

  4. 【图文】云栖大会深圳峰会:阿里云ET医疗大脑与工业大脑,机器学习平台PAI2.0...

    阿里云新征程:通往智能之路!正式发布ET工业大脑,ET医疗大脑和机器学习平台PAI2.0,阿里云的目标是成为万物智能化的基础设施和智能引擎! 2017年3月27日至29日,云栖大会于深圳举行.29日为 ...

  5. cube一站式云原生机器学习平台-推理服务的工程化加速

    全栈工程师开发手册 (作者:栾鹏) 一站式云原生机器学习平台 前言:cube是tme开源的云原生机器学习平台,目前包含特征平台,支持在/离线特征:数据源管理,支持结构数据和媒体标注数据管理:在线开发, ...

  6. cube云原生机器学习平台-架构(四)

    全栈工程师开发手册 (作者:栾鹏) 一站式云原生机器学习平台 前言:cube是开源的云原生机器学习平台,目前包含特征平台,支持在/离线特征:数据源管理,支持结构数据和媒体标注数据管理:在线开发,在线的 ...

  7. cube云原生机器学习平台-架构(三)

    全栈工程师开发手册 (作者:栾鹏) 一站式云原生机器学习平台 前言:cube是开源的云原生机器学习平台,目前包含特征平台,支持在/离线特征:数据源管理,支持结构数据和媒体标注数据管理:在线开发,在线的 ...

  8. 阿里云机器学习平台的思考

    想不想知道是什么 最近读了阿里的<大数据之路-阿里巴巴大数据实践>,对于其机器学习平台也蛮感兴趣,正好阿里出了本新书<解析阿里云机器学习平台>,顺便读了下,感触也不少,结合最近 ...

  9. 《机器学习在线 解析阿里云机器学习平台》读书笔记

    原文 最近读了阿里的<大数据之路-阿里巴巴大数据实践>,对于其机器学习平台也蛮感兴趣,正好阿里出了本新书<解析阿里云机器学习平台>,顺便读了下,感触也不少,结合最近团队机器学习 ...

最新文章

  1. 【Android】开源图表库MPAndroidChart的学习
  2. 关于PyCharm无法启动的问题
  3. UA MATH563 概率论的数学基础 中心极限定理16 Kolmogorov 3-series定理
  4. cron计划任务书写格式
  5. 专注于网络安全的数据中心在莫斯科开通运营
  6. ITK:从灰度图像计算直方图
  7. 在vue-cli中搭建mock服务器
  8. No-3.Linux 终端命令格式
  9. a标签点击事件_DOM事件机制
  10. Kafka 命令行操作
  11. python 朋友圈自动回复评论_Python自动回复微信好友新年祝福
  12. java 拦截器的作用?
  13. axure手机页面设计说明_Axure中移动端原型设计方法
  14. 怎么把python压缩_python中如何实现图片压缩
  15. 人工智能(7)---一文读懂人脸识别技术:商业应用、产品落地、核心技术、市场规模
  16. 赛门铁克完成收购Blue Coat,任命Greg Clark为CEO
  17. 域名注册流程是什么 注册域名的时候要注意什么
  18. 【翻译】BKZ 2.0: Better Lattice Security Estimates 论文翻译
  19. 实现手机扫描二维码页面登录,类似web微信-第三篇,手机客户端
  20. 泰坦尼克数据分析与预处理

热门文章

  1. adobe blueprint
  2. 会mysql不会sql_不是吧,不会有人还不知道MySQL中具实用的SQL语句
  3. java 通过类名创建类,通过类名动态生成对象
  4. 用python把excel中的数据变成字典(复制代码即可用)
  5. android 暂停音乐播放器,Android仿音乐播放器带进度的播放暂停按钮
  6. Pycharm 和 Vs code 字体大小调整(Ctrl + 鼠标滚轮实现)
  7. 数值积分(辛普森求积、柯特斯求积、龙贝格求积)
  8. 洛谷 P4823 [TJOI2013]拯救小矮人
  9. 实验8 群体类、流类库与输入/输出(4学时)
  10. CNN——学习率LR的参考值范围是符合指数函数的增长规律的