谷歌AI版“你画我猜”背后是什么样的原理?
我们先看看这个小程序是什么,打开微信小程序搜索页面,搜索“猜画小歌”,打开这个小程序,点击开始作画。小程序会先出题,告诉你画什么,20秒倒计时,你画完内容,然后谷歌AI去猜,如果猜的答案和题目匹配,则通过,进入下一题,否则失败。乍一看,怎么像是在考我的绘画能力呢,哈哈。
第一道题,让我画帆船,惜败...
再来一遍,钻戒,惨败...
Google AI
谷歌总是善于用人民群众喜闻乐见的方式“秀晒炫”自己的AI能力,这是来自 Google AI 的一款有趣的社交微信小程序,用户可以在有限的时间内进行速写涂鸦,在每一轮体验中,用户需要在规定时间内勾勒出一幅日常用品的图画(比如狗、钟表或鞋子),人工智能则需要在时间结束前猜出图画中的物体。
如果你画的东西在20秒内被谷歌人工智能猜中,则过关,反之游戏结束,还有排行榜来统计你的闯关数在好友中的排名,这也是微信小游戏一贯的社交板块。
如上图,游戏操作简单,接下来就是和AI达成默契进行“你画我猜”,如果多轮猜中,你就会进行连续的游戏解锁,然后登上朋友圈排行榜巅峰,考验各位“灵魂画手”的时候到了。
当然,也有哭着喊着让大家给评评理的,人工智能没有猜出来的这些画作,到底是谁的错?
“猜画小歌”的背后是超5000万个手绘素描数据群
猜画小歌由来自 Google AI 的神经网络驱动,该网络源自超过5000万个手绘素描的数据群,在此前谷歌推出的类似游戏《Quick, Draw!》之中,对于这个神经网络有着较多的介绍,如果你对猜画小歌很感兴趣,也可以谷歌搜索Quick, Draw!在PC端进行游戏。
如下图,谷歌所有出的猜画题,其实已经有着大量的手绘素描的数据群,你这边一边画,另一边神经网络进行快速比对。
我们点击香蕉,可以看到无数各式各样的手绘香蕉出现在你面前。
下面是关于脸的数据,看着各式各样的脸还挺有趣,值得一提的是,在谷歌的手绘素描的数据群之中,笔画的前后顺序都是纪录在内的,鼠标移动到任意一个脸上面,就会自动出现画图过程。
看到这里你是不是想说,看来人工智能也不过如此,只是在数据的基础上进行比对就好了,并不是神奇到不借助外力直接猜中我画的是什么。
在某种程度上,可以这么说,但又不准确,其实AI还进行了大量复杂的工作,谷歌对于“猜画小歌”的解释当中这样说道:计算机一直以来都是聪明的,现在有了AI以后,计算机可以用一种自然的,更接近人类的方式去理解这个世界,其中一个令人兴奋的新进展就是计算机视觉技术,它能让计算机直接理解输入的视觉信息,并由此“看到”这个世界。
谷歌说,这一技术既能在视频通话中识别出你的朋友以便加上对应的标签,也能帮助识别人类眼底诊断图像上的早期糖尿病症状。而且,得益于“神经网络”技术,一些看起来极其困难的事情,计算机也能处理得非常好:比如,通过粗糙的草图就能识别出是什么物体。现在,计算机已经能“看到”你随意涂鸦出的一团长着耳朵的墨迹可能是一只熊猫。
玩“猜画小歌”有什么技巧?
不要拖泥带水,简洁最重要。因为程序只能接受大约200个左右的输入点,如果画很多细节,反而认不出来。
如果第一次画的没有识别出来,迅速擦掉重画,不要希望AI会后期力挽狂澜。从sketch-rnn模型可以看出,画画的路径转换为latent vector,前期的数据比重很重要。
最后一招:谷歌公开了所有类别的训练样本,大家可能上这个网站(https://github.com/googlecreativelab/quickdraw-dataset)下载,看看每个类别“正确”的画法。
为什么要在中国推小程序?
因为谷歌的网页版猜画小歌,由于大家都知道的原因,没有中国的数据。这次利用微信小程序刚好收集一下中国的数据。有人还做了不同国家画画的差别,比如日本人画圆是顺时针的,而绝大多数国家是逆时针的,原因是日文中的圆的顺时针写的。韩国和俄罗斯用户脑中,最直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。后续基于这个大样本,还能分析出很多好玩的东西。
什么是“神经网络”技术?
神经网络(Neural Network,NN)或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。
神经网络由大量的人工神经元联结进行计算,大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统,通俗的讲就是具备学习功能。典型的神经网络具有以下三个部分:结构(Architecture);激励函数(Activity Rule);学习规则(Learning Rule)。
不知道如何学习AI,关注公众号回复“深度学习”获取视频教学内容
推荐阅读
技术:jenkins和docker实现自动化构建部署
技术:设计图都不会画,还想做”架构师“?
技术:玩转linux 这些命令就够了
技术:Kafka、RabbitMQ、RocketMQ等消息中间件的对比
技术:玩转linux 这些命令就够了
技术:30分钟如何学会使用Shiro
工具:如何通过技术手段 “干掉” 视频APP里讨厌广告?
工具:通过技术手段 “干掉” 视频APP里讨厌的广告之(腾讯视频)
博主11年java开发经验,现从事智能语音工作的研发,关注微信公众号与博主进行技术交流!更过干货资源等你来拿!
谷歌AI版“你画我猜”背后是什么样的原理?相关推荐
- 与谷歌AI玩你画我猜,根本停不下来!
谷歌今日推出了一款名为猜画小歌的微信小程序,瞬间就占领了朋友圈. 猜画小歌由来自 Google AI 的神经网络驱动.该网络源自全世界最大的.囊括超过 5000 万个手绘素描的数据群. 用户需要在规定 ...
- 现场|除了谷歌AI中国中心成立的重磅消息,谷歌开发者大会现场还有这些
Google AI在中国的又一次加码. 整场演讲气氛最热烈的时刻就是Google Cloud首席科学家李飞飞出现的时候.她带来了全场最重磅的一个消息:谷歌AI中国中心12日正式在北京成立,由她和Goo ...
- 要和文心一言来一把你画我猜吗?
想和文心一言来一把你画我猜吗? ChatGPT的爆火,让AI对话模型再次走入大众视野.大家在感叹ChatGPT的智能程度时,总会忍不住想:如果我们也有自己的AI对话模型就好了.在社会的压力下,国内的厂 ...
- 谷歌AI的七个“不正经”玩法,个个能玩一整天
郭一璞 问耕 发自 凹非寺 量子位 报道 | 公众号 QbitAI 谁说AI只能搞一些一本正经的工作? 谷歌最近就放出了几只比较搞笑的AI,可以完成一些不走寻常路的工作,比如:帮你实现靠脸吃饭,让你 ...
- 谷歌AI“你画我猜”强推“狗年版本”,腾讯AI要帮你修老照片 | 竹货新春
夏乙 发自 都顺路 量子位 报道 | 公众号 QbitAI 今天大年初一.为了庆贺中国农历狗年的到来,谷歌刚刚在自己的AI"你画我猜"游戏中更新了狗狗版本. (你画我猜,介系里没 ...
- 还没通关“猜画小歌”?击败谷歌AI的秘籍在此
这两天,Google又刷屏了. 不是因为这家公司要被欧盟罚款50亿美元,而是因为Google首款微信小程序"猜画小歌":跟AI玩我画你猜的小游戏. 有很多人赞美. " ...
- AI版「按图索骥」,比猜画小歌更复杂的的AI交互游戏
郑集杨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你能在时间结束前根据Emoji找到你身边的物品吗?大概,像这样: 跟我玩?不不不,是你自己跟这个AI玩,找出东西然后让AI辨认它. 这并 ...
- 写Rap,编菜谱,你画我猜……这些 AI demo 我可以玩一天!
文 | ZenMoore 编 | 小轶 上次写的那篇 <Prompt 综述+15篇最新论文梳理]> 有亿点点肝.这次给大家整点轻松好玩的(顺便给这篇推文打个广告,快去看!). 不知道读者朋 ...
- 你画我猜微擎版小程序源码
介绍: 你画我猜微擎版小程序源码,外面卖2000,搭建比较简单,UI非常美,可完美运营,里面功能挺多. 需要一个备案域名一台服务器和机灵的小脑袋瓜.教程就不讲了,微擎后台!我有发过,可以直接找一下 微 ...
最新文章
- 【c语言】蓝桥杯算法提高 3-2求存款
- struts2中struts.xml和web.xml文件解析及工作原理
- 详解JavaScript数组(一)
- 新视角来了:《用户体验四维度》
- 《SAP HANA平台应用开发》—第2章2.3节熟悉SAP HANA工作台
- ssl2342-打击犯罪【并查集】
- 头部ct能检查出什么_【安全用药】做CT检查时应注意什么?
- MachineLearning(8)-PCA,LDA基础+sklearn 简单实践
- vue中使用导出表格功能
- 华为手机上的网上邻居怎么用_华为手机网络邻居功能
- 转载-一种基于陀螺仪传感器的准确计步器算法
- 三轴加速度传感器 角度值 转换原理
- Kubernetes Downward API 基本用法
- 【龙芯1c库】封装gpio接口和使用示例
- Windows Kits(Windows 工具包)
- linux 获取当前工作路径
- PayPal 注册和使用详解
- windows无法连接到打印机?三个方法连接打印机(Win10系统)
- 详细介绍 GPL 协议
- .o0博客导读0o. 12/13/2010最后更新
热门文章
- arXiv每日推荐-5.5:语音/音频每日论文速递
- Flink+HBase场景化解决方案
- iMeta | 第1卷第4期来自8个国家的20篇文章正式发布(2022.12)
- 法发〔2016〕22号《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》
- mPEG-Epoxide MPEG-EP 甲氧基PEG环氧乙烷
- Verilog 6位数码管LG3661BH 的动态显示
- 终于明白了,一文彻底理解I/O多路复用
- Chrome浏览器插件Postman用法简介-Http请求模拟工具
- 关于贵旅、酒店、机场、小农等算法分析
- PTA数据结构-07-图6 旅游规划