大数据应用在金融行业是老生常谈,最被人们津津乐道的是“海量Twitter信息中的情绪状态指标与道琼斯工业标准指数之间存在联动关系”,这来自于印第安纳大学计算机科学家Johan Bollen的一个报告,尚在学术研究层面。这方面一直缺乏商业化应用,而百度自去年开放大数据引擎,已经在多个领域进行了大数据的应用和尝试,尤其是去年世界杯期间,百度大数据对淘汰赛的比赛结果预测正确率达到94%,领先微软、谷歌和高盛。目前,百度基于大数据应用又发布了一款最新的手机股票软件“百度股市通”,通过其独创的股市知识图谱,可以为股民提供最新股票热点信息帮助用户发现这些信息与股票的关系。

当股市遭遇互联网大数据

百度股市通定位为股民选股的辅助工具,尤其是弥补了市面上股票软件在消息实时性、全面性、关联性和智能性上的不足。它的核心思路是利用大数据,聚合有价值的新闻信息和用户数据、寻找股票与消息、股票与股票之间的关联,并且整合第三方的专业金融数据,给股民最有价值的信息。

百度搜索每天会接到数亿条政经相关的搜索请求,以及百度新闻每天收录的数百万条资讯,这都是百度天然的大数据优势。还有全球股市的交易行情,这部分各家都有,只要做到及时准确就可以了。从产品试用来看,百度应该有从证券机构获取专业的研报、公告等,比如在某个个股信息里,“百度股市通”有专门的“研报”类别,会显示所有机构对该股票的评级。百度股市通把这些数据挖掘后再聚合的方式进行呈现。

当然,百度的大数据显然不止这点作用,百度股市通还将海量数据与2000多只A股股票关联起来,同时将不同股票关联起来,发掘热点信息与个股的关系,某个热点事件可能会影响哪些股票,这就是其产品的核心功能“智能选股”。

距离预测股价还很遥远,做选股助手同样实用

成功预测股价有着巨大的商业价值,但世界上还没有任何个人、机构、技术或者产品可以百分之百地准确预测股价。股票价格受到诸多因素影响,短期主要是消息,消息引发股民决策进而形成一轮博弈,博弈结果是股价;长期则是企业本身价值与投资者期望值之间的契合度。

而股价是“人为因素决定”,传统的金融学是建立在随机行走和有效市场假说的基础之上,在有效市场假说理论中股价的变动很大程度取决于消息(新闻),市场上新信息的出现不可预测。这与天气这类有规律可循的自然现象不同,但在分析原理上也有类似可参考的部分。早期的天气预测主要依靠经验来判断,准确率很低,随着科技发展,人们发明了越来越多的气象仪器,现在的天气预测会根据气象卫星发回的云图和气象站测得温度、气压、风向、风速等数据来列出相应的方程组进行分析判断,这里同样也是大数据的应用,而由于方程组是非线性的,一点点的误差就有可能造成结果的巨大区别。因此理论上来说,任何预测都不可能是100%准确的。百度股市通聪明的地方就是并不预测股票的涨跌(这也是证监会禁止的),只是预测热点事件的发展走势,并将热点事件相关联的股票提供给用户,至于最终的投资决策还是由用户自己决定。

市面上已有大智慧等炒股工具,但它主要是交易和数据系统,顺带提供了少许资讯,没有大数据应用,在实时性、关联性上存在短板。另外雪球财经这类App在个股信息和讨论上做得很好,在热点事件、股票关联上也没有对应的大数据产品。百度股市通是市面上唯一基于大数据提供智能选股服务的股票软件。

股市知识图谱是百度股市通基础,进入门槛高

在百度股市通之前,已经有基于大数据的选股协助工具,不过只停留在“指数”层面,腾讯曾在2013年联合专业金融机构推出“腾安价值100指数”,去年百度也联合中证指数公司和广发基金发布“百发100”互联网金融指数。全球知名指数都是媒体发布的,随着互联网金融发展,互联网媒体在资讯聚合能力和信息发布渠道上的优势都在得到体现。百度是“媒体之上的媒体”,做指数也不足为奇。

但是百度股市通与指数有非常大的不同。指数只是把股票市场整体趋势量化,百度股市通更多体现在“个性化”上,比如根据热点事件命中“事件影响股”,再根据用户订阅推送关联消息。另外百度股市通可以直接呈现热点消息和第三方专业数据,帮助用户在纵横交错的海量信息中找到与股票相关的最新信息。

指数和百度股市通都是基于大数据,但百度股市通还多了一层,即知识图谱。知识图谱的要义就是找到不同信息的关联性,形成一个网状的知识结构,所谓图谱。而股市知识图谱就是建立起各类数据、信息与股票的关系,以及股票与股票之间的关系,所以可以第一时间通过各种信息的热度变化来分析股票未来可能的走势。百度的股市知识图谱在数据上有优势,在技术上也有特长,百度在搜索结果页中早已整合了知识图谱便于用户进行二次搜索。知识图谱技术核心是自然语言处理和深度学习技术的数据挖掘,这是百度擅长的。海量信息关联性靠人工来梳理不现实,耗时耗力无法满足实时性需求,基于深度学习技术,百度股市知识图谱本身可以实时迭代,模型本身也在不断更新。因此,指数产品CCTV、腾讯等媒体都可以做,但股市知识图谱只有搜索引擎公司才可以做,这也是百度股市通实现“智能选股”的关键所在。

百度股市通对于百度的价值在哪里?大数据商业化和互联网金融

百度股市通只是百度众多大数据产品中的一个。2014年开始百度已陆续推出流感预测、景点预测、商圈热力图、世界杯预测等基于大数据的产品。股市通是百度在大数据商业化上的又一个新产品,并且首次涉足证券领域,证券与大数据有天然关联性,结合点正在越来越多。

另外值得注意的是互联网金融已是百度非常重要的新业务方向。百度要做O2O就必须大力发展百度钱包这一互联网金融工具,二是百度本身是一个流量和营销入口,因此与基金合作推出百发、百赚、沃百富以及面向企业的小贷产品,是其这两年重点做的事情。做“百度股市通”在信息数据层面进一步完善了百度互联网金融的版图,这是其所擅长,也有商业价值,比如未来做个性化收费版本、可以成为百度互联网金融产品的销售渠道、甚至百度也有可能自己做一家证券机构,直接为股民提供全方位的服务。

可以看到百度股市通整合了不少传统金融机构的数据和服务,比如合作券商核心操盘内参等等,未来不排除会引入专业的操盘手或者分析师进入给股民做咨询服务。这也迎合了百度要“连接人与服务”的趋势。

小结一下:百度股市通是百度大数据业务进入金融领域的开始,它为百度在互联网金融上补齐了“信息”这一环,百度在自然语言处理、深度学习上的基础技术是这款选股助手的基础。

微博@互联网阿超 微信 罗超(luochaotmt)

百度股市通如何实现智能选股?相关推荐

  1. python爬取股票代码_Python爬取百度股市通股票详细信息

    更多教程请移步至:洛凉博客 最近一直在看北京理工大学嵩教授主讲的:Python网络爬虫与信息提取 课程里面也有很多实例.大家可以去中国MOOC搜索查看下实例. 不过教授的思路挺好的.代码稳定性也没得说 ...

  2. 百度股市通日k数据接口

    1.请求路径 https://gupiao.baidu.com/api/stocks/stockdaybar?from=pc&os_ver=1&cuid=xxx&vv=100& ...

  3. 【Python爬虫学习】八、股票数据定向爬虫(2020年1月31日成功爬取中财网,百度股市通web版404了)

    功能描述: 目标:获取股票的名称和交易信息 输出:保存到文件中 程序结构设计: 步骤1:从中财网http://quote.cfi.cn/stockList.aspx获取股票列表 步骤2:根据股票列表获 ...

  4. 百度与吉利联合制造智能电动汽车;霍尼韦尔2020年度10大创新科技揭晓 | 美通企业日报...

    今日看点:毕马威与香港特许秘书公会携手发布报告<风险管理调查:迈向成功的助力>.百度与吉利联合制造智能电动汽车.包头茂业万豪酒店开业.爱茉莉太平洋展示CES 2021创新奖获奖技术,科勒推 ...

  5. 东方财富代码选股_东方证券APP评测:智能选股方面优秀 投顾服务缺失

    新浪财经讯 布局金融科技,转型财富管理,赋能业务链条,提效用户服务--APP作为券商线上服务重要窗口,将更加智能化.数字化.平台化.未来,券商如何利用金融科技提高投资效率?如何利用线上优势赋能券商业务 ...

  6. 【干货】2021百度营销通案.pdf(附下载链接)

    大家好,我是文文(微信:sscbg2020),今天给大家分享百度营销中心于2021年4月份发布的<2021百度营销通案.pdf>,关注营销的伙伴们别错过啦! 另外,我们也搭建了行业交流社群 ...

  7. 科大讯飞/百度/阿里/腾讯(BAT)智能语音识别(ASR)性能对比选择预计价格分享 - pytorch中文网...

    最近在做智能客服的时候需要使用到语音识别,所以了解和对比了各家平台的语音识别对比和分析! 一.科大讯飞 1.语音听写即在线音识别查看Demo 把语音(≤60秒)转换成对应的文字信息,让机器能够&quo ...

  8. 2021.12.28同花顺--智能--选股平台----技术指标--其它指标--逍遥买卖宝--指标B

    2021.12.28同花顺--智能--选股平台-- --技术指标--其它指标--逍遥买卖宝--指标B

  9. 每日新闻:Win10违背用户选择向微软发送数据;百度将在山西建设智能车联网示范基地;18年第三季度企业存储系统收入增长19.4%...

    关注中国软件网 最新鲜的企业级干货聚集地 趋势洞察 钟志祥博士:企业数字化转型发展战略分析 钟博士表示:从数字化转型的全球发展来看,数字化转型分为单点实验.局部推广.优化创新等阶段,中国的数字化转型正 ...

  10. 基于DNN模型的智能选股策略

    1.DNN原理介绍  1.1 神经元  1.2 DNN  1.3 反向传播 2.实例:DNN模型选股  2.1 策略步骤和模型参数  2.2 回测结果 1. DNN原理介绍 1.1 神经元 神经网络的 ...

最新文章

  1. Java—FileOperator
  2. iOS之UI--转场动画
  3. PostgreSQL 理解 template1 和 template0
  4. android从放弃到精通 第七天 tomorrow
  5. hosts文件中同一个域名两个IP的解析顺序
  6. static、final、static final 用法
  7. JSF:直接从页面将参数传递给JSF操作方法,这是JavaEE 6+的一个不错的功能
  8. HashMap jdk1.7和1.8概述
  9. 网络编程之 进程间的通信之管道的使用
  10. AcWing 852. spfa判断负环(spfa or bellman)
  11. oa系统租用云服务器安全吗,oa系统放在云服务器上安全吗
  12. freemarker加载模板目录的方法
  13. python+opencv修改像素值、创建图像
  14. jpg、png、jpeg区别与压缩等知识总结 —— 性能优化篇
  15. 领导力21法则(归纳)
  16. 爬取北京市公交线路信息
  17. LYOI 78 小澳的葫芦
  18. 全文干货:蓝牙耳机哪个品牌最好?平价好用的蓝牙耳机推荐
  19. 高精度地图,从入门到入行
  20. Stata字符型与数值型数据的转换——上市公司证券代码字符型与数值型的互换

热门文章

  1. 聚焦堆栈重建光场-SART实现(附代码)
  2. PID控制器及其参数整定
  3. c语言 步进电机 程序,步进电机加速启动C语言程序
  4. Jmeter使用技巧集锦大全
  5. 快递物流配货发货系统学习--以京东物流为例
  6. 解决MySQL登录1045错误
  7. PHP获取域名及域名IP的方法
  8. 华为:一个中国民族企业的“下半场”在哪里?
  9. AgentWeb嵌套h5 上传图片文件
  10. 查看电脑ip地址的命令Linux,怎么用ipconfig命令查看自己电脑的IP地址