1.【专利解密】华为如何实现物体检测在大规模场景中的应用 助力智慧安防;2.苹果卷入其中?三星显示被要求赔偿前副总裁专利侵权费;3.苹果重申AR具有巨大潜力并且暗示未来可能出现的设备

1.【专利解密】华为如何实现物体检测在大规模场景中的应用 助力智慧安防;

【嘉德点评】华为发明的物体检测方法,通过构建跨域知识图谱,可以捕捉到不同待检测物体间的内在关系,从而更加精确的进行物体识别,在智能安防等复杂场景中有着极其重要的应用。

集微网消息,2020年10月,由华为技术有限公司主办、成都优普诚科技有限公司协办的“普惠AI,破浪前行”2020华为好望秋季品鉴会在成都首座万豪酒店成功举办,该会就机器视觉、智慧安防等领域展开了交流讨论。

其中华为的机器视觉技术尤其适合应用在智慧安防等领域,尤其是在AI技术的加持下,可以让安防变得更加的省心且智能。例如,物体检测就是一项基本的计算机视觉任务,它可以识别图像中物体的位置和类别。在实际应用中,研究员和工程师们会根据应用场景与实际任务需求的不同创建针对不同具体问题的数据集,用于训练高度定制化和独特的自动物体检测器。

而在智慧安防领域,物体检测也是非常重要的一个环节,在进行很多任务之前,首要的就是将待检测物体定位并进行类别识别。为此,华为在20年1月21日申请了一项名为“一种物体检测方法、装置以及存储介质”的发明专利(申请号:202010072238.0),申请人为华为技术有限公司。

该专利中发明的系统可以应用在大规模物体检测场景中,例如手机人脸识别、手机识别万物、无人车的感知系统、安防摄像头、社交网站照片物体识别、智能机器人等等。同时,由于这种物体检测方法在对物体进行检测时结合了跨域知识图谱,因此其物体检测效果会更好。

根据该专利目前公开的资料,让我们一起来看看这项物体检测方法吧。

如上图,为该专利中发明的系统架构的结构示意图,该架构中包括执行设备110、训练设备12、数据库130、客户设备140、数据存储系统150以及数据采集设备160。数据采集设备可以采集训练数据,并将数据存入数据库中,但是这种用于人工智能训练的数据需要进行人工标注。

训练设备可以根据训练数据训练出目标检测模型,当其他未知的图片由用户传递到计算模块时,就可以由目标模型来进行识别,从而得到物体的类别信息,并将物体的检测结果通过I/O接口呈现给客户设备。

如上图,为这种芯片的硬件结构图解,该芯片主要包括神经网络处理器,主CPU和外部存储器分别用于提供控制指令以及数据。配合系统架构图可知,这种芯片就是训练设备120中所使用的,可以完成训练设备的训练任务并输出物体的类型信息。

神经网络处理器NPU作为协处理器挂载到主中央处理器上,由主CPU分配任务,NPU的核心部分为运算电路303,控制器304控制运算电路提取存储器中的数据并进行运算。

我们知道在神经网络的计算中是需要大量的矩阵乘加运算的。举例来说,假设有输入矩阵A,权重矩阵B,输出矩阵C,运算电路从权重存储器中取矩阵B相应的数据,并缓存在运算电路中每一个PE上。运算电路从输入存储器中取矩阵A数据与矩阵B进行矩阵运算,得到的矩阵的部分结果或最终结果,保存在累加器中。

向量计算单元可以对运算电路的输出做进一步处理,如:向量乘、加、指数运算、对数运算以及大小比较等等,例如向量计算单元可以用于神经网络中非卷积的网络计算(池化、批归一化),这些结构则正是进行AI运算的基础。

如上图,为该专利中申请的物体检测方法的识别步骤的流程图,首先系统会获取待检测的图像,图像可以通过摄像头拍摄从街景等场合提取。接着确定待检测图像中的待检测物体的初始图像特征,这个步骤中,可以对整个图像进行卷积运算以得到整个图像的图像特征,然后再从整个图像的特征图中获取物体的初始图像特征。

接着根据跨域知识图谱信息来确定待检测物体的增强图像特征,这个跨域知识图谱信息包括不同域中待检测物体对应的物体类别之间的关联关系,增强图像特征指示不同域中与待检测物体相关联的其他物体对应的物体类别的语义信息,这种对应关系如下图所示。

从上图可以看到,这种对应关系即:两个类别在同一个图像中同时出现的概率越大,则认为两个类别之间有关联关系。上图的第一个域中的物体类别包括男人、女人、男孩、女孩和马路;街道第二个域中的物体类别包括人、手提包、书包、汽车和卡车。

我们认为第一个域中的男人、女人、男孩以及女孩与第二个域中的人之间具有关联关系,第一个域中的女人和女孩与第二个域中的手提包具有关联关系。这些关联信息是通过常识来推理出来的,这样的语义信息可以辅助进行图像检测的高级别信息。例如,待检测物体为女人,待检测图像中与女人相关联的其他物体包括手提包,那么,待检测物体的增强图像特征指示的可以是手提包的语义信息。

最后,我们再来看看这种物体检测方法的整体流程图,待检测图像可以先通过传统的物体检测器进行处理(例如Faster-RCNN网络结构),再提取初始候选区域的初始图像特征以及分类层的参数,并构建域内的区域图。

通过构建域内的区域图,利用域间图卷积网络传播节点上不同域下待检测物体的高级语义表示,得到经过推理推断后的融合了不同域下待检测物体高级语义表示的特征。最后将域内图卷积、域间图卷积经过推理推断后得到的特征投影到相应的待检测物体的高级语义表示中,并进行分类和回归,由此来得到待检测物体的位置信息以及类别信息。

以上就是华为发明的物体检测方法,通过构建跨域知识图谱,可以捕捉到不同待检测物体间的内在关系,由此来提高物体检测方法的效果。这种方法可以应用在复杂场景下,例如在商场以及商业街等区域,可以辅助安保人员对该区域的行人、物体进行检测,例如可以帮助寻找遗失物品以及进行可以物体检测等,有效提高城市安防能力!

关于嘉德

深圳市嘉德知识产权服务有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成,熟悉中欧美知识产权法律理论和实务,在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。

(校对/holly)

2.苹果卷入其中?三星显示被要求赔偿前副总裁专利侵权费;

集微网消息,据THE ELEC报道,首尔中央地方法院周五要求Samsung Display赔偿其前任副总裁Donggun Park的专利侵权费用。

2012年,三星电子分拆液晶显示器业务,并成立三星显示器 (Samsung Display)。时任三星液晶业务主管 Donggun Park出任了三星显示器的CEO。

据悉,三星应用于第六代液晶显示器面板的TFT制造技术就是由Donggun Park发明。三星此后也向苹果提供了采用该项技术的面板。

Donggun Park与“老东家”的专利纠纷报道未作详述。但Donggun Park三年前曾声称,三星未对他的发明进行适当的赔偿。他要求三星赔偿1500亿韩元(约合人民币8.8亿元)的专利侵权费。

(图源:网络)

据Donggun Park说,三星显示器从这些专利中获利1.9万亿韩元。不过,经首尔中央地方法院判决,三星显示器需支付5717万韩元,并赔偿专利相关的利息费用。

韩媒指出,法院责令的金额只是Donggun Park要求的0.04%。或许这场已经持续多年的专利侵权纠纷还没有结束。(校对/隐德莱希)

3.苹果重申AR具有巨大潜力并且暗示未来可能出现的设备

在最近接受CNET的斯科特-斯坦恩(Scott Stein)采访时,苹果的增强现实和虚拟现实计划负责人迈克-罗克韦尔(Mike Rockwell)表示,AR在今天存在的设备和明天可能存在的设备中都有巨大的潜力。

他表示:“AR具有巨大的潜力,可以在今天存在的设备和明天可能存在的设备上对人们的生活有所帮助,但我们必须确保它是成功的,对我们来说,最好的方法就是让我们的设备生态系统得以实现,让它成为人们投入时间和精力的一个健康而有利可图的地方。“

之前外界广泛传闻苹果同时开发AR/VR头显和眼镜,但这两款产品预计最早也要到2022年才会发布,苹果继续以较为模糊的词汇来宣传AR/VR技术。多年来,苹果及其CEO蒂姆-库克(Tim Cook)多次将AR称为具有远大深刻意义的技术。

苹果AR高级产品经理Allessandra McGinnis表示,苹果将与盲人和部分失明社区合作,特别是在人员检测方面进行改进。几年以后,AR就像互联网一样会融入我们的生活。今年5月,知名分析师郭明錤预测,苹果眼镜最早将于2022年推出,并提供创新的用户体验。cnbeta

更多新闻请点击进入爱集微小程序 阅读

1.集微访谈第7期:华为出售荣耀后,真正的“生存”挑战刚刚开始?

2.从“传统”到“赋能”,联通如何打造工业互联网的核心能力?;

3.谷歌正在测试一个人工智能系统,帮助视障人士参加跑步比赛 ;

4.GitHub终于修复了Google Project Zero 报告的高危安全漏洞

5.微软Edge附加组件商店将很快获得安装主题的支持 ;

6.小鹏汽车CEO何小鹏疑似隔空回应偷窃技术传闻 ;

7. 微软开发人员已为Chromium项目贡献至少1835项变更

8.苹果开售适用于iPhone 12系列机型的MagSafe皮革保护套 ;

9.Windows 10或于明年迎来新款录屏工具和更丰富的PowerToys功能 ;

10.特斯拉+SpaceX总价值超过5000亿美元 马斯克:狂野的时代!;

球分享

球点赞

球在看

开发物体识别桌、_【专利解密】华为如何实现物体检测在大规模场景中的应用;苹果卷入其中?三星显示被要求赔偿前副总裁专利侵权费...相关推荐

  1. 物体识别桌 开发系列之一

    物体识别桌 开发系列之一 本系列将会制作一个多点屏的 物体识别桌,从多点屏的usb(hid)touchscreen抓取数据分析识别标签(主动或被动)的特征,从而识别不同的标签的位置和旋转角度,从而做一 ...

  2. 开发物体识别桌、_【课程总结】AR系统开发“秘籍”大揭秘!

    导读:AR技术飞速发展,被广泛应用于游戏.医疗.旅游.电商等行业.那么对于AR系统的整体设计和应用是如何操作的呢?商汤泰坦公开课第006期联合"SLAM技术及应用"暑期学校与研讨会 ...

  3. 开发物体识别桌、_科研人员开发突破性的技术,允许盲人识别形状和物体

    一项令人难以置信的新技术正在让失明人士有能力识别形状和物体,而这些形状和物体都是在他们的大脑上"画出来"的.一篇描述该技术的研究论文刚刚发表在<细胞>杂志上,正如Sci ...

  4. 开发物体识别桌、_Tofu3 热红外可见光双光AI目标识别跟踪

    1. 概述 1.1 简介 Littro瞳赋Tofu3是多波段视频物体识别跟踪模块,支持可见光视频与红外视频下的物体检测.识别.跟踪.产品支持H.264/H.265视频编码.智能设备管理.目标检测.识别 ...

  5. android ar物体识别_拍照救命稻草 AR物体识别崛起_手机生活新闻-中关村在线

    拍照救命稻草 AR物体识别崛起 InfoEye是索尼Xperia Z1中一项非常实用的功能,它脱开简单的拍照功能,将手机当做一双眼睛让智能手机来识别现实中的万物.例如我们在拍摄一张地标性建筑物时,In ...

  6. 华为商城抢手机脚本_抢在华为鸿蒙之前,国产手机上线新系统,界面比苹果iOS更美观...

    最近两年,国产手机厂商纷纷对系统进行改造,EMUI去掉了古板标签,小米MIUI不再追求功能上的丰富,就连OPPO也在半个Flyme团队帮助下,走到时尚前沿.而在11月18日,又一国产手机上线新系统,成 ...

  7. 华为前副总裁李玉琢:华为无法培养出企业家

    1995年我刚进入华为不久,有人问我四通与华为的区别时,我脱口而出:四通能培养企业家而华为不能.这一点从任正非迟迟无法找到自己的"替手"就可见一斑.曾国藩说:做大事者,以寻找替手为 ...

  8. 三维匹配_基于三维模型的目标识别和分割在杂乱的场景中的应用

    作者:仲夏夜之星 来源:3D视觉工坊公众号 链接: 基于三维模型的目标识别和分割在杂乱的场景中的应用 在杂波和遮挡情况下,对自由形式物体的识别及分割是一项具有挑战性的任务.本文提出了一种新的基于三维模 ...

  9. 华为前副总裁李一男正式出任百度CTO

    回归华为两年多后,李一男最终还是选择离开华为. 昨日,百度公司(BIDU.NASDAQ)宣布任命李一男为公司首席技术官(CTO),任命从即日开始生效.百度创始人李彦宏昨日下午还特意向公司全体员工发送华 ...

最新文章

  1. mysql hadoop架构,Debezium实现Mysql到Elasticsearch高效实时同步
  2. 浅谈对5G核心网演进方向的几点展望
  3. 书评:Mockito Essentials
  4. 计算机网络 第六章 链路层与局域网
  5. html中表格内容居右的写法
  6. 【Programming Clip】点分十进制IP和长整型转换
  7. vs2015+opencv+dilb+于仕琪人类识别算法对人脸特征点进行检测
  8. jquery日历插件 途牛_为开发者准备的10款最好的jQuery日历插件
  9. PL/SQL中导出整个表、表结构、部分数据、以及导入整个表
  10. 电脑右键打印不见了_win7右键没有打印选项怎么办|右键菜单没有压缩选项怎么解决|右键没有图形选项解决方法-系统城...
  11. 圣经经文搜索定位功能的考虑
  12. Java实现短链接URL生成
  13. 解决Vuser停在Gradual Exiting状态不动的问题
  14. html ui组件,UI组件
  15. 存在心里的人,走进生命的魂
  16. 为什么论文中有的空格特别大
  17. 春招面试(1)- 中科院软件中心/中科院自动化研究所
  18. 2021年广东专插本计算机专业学校,2021年广东省专插本学校名单和专业,广东专插本有哪些学校和那些专业...
  19. eagle的原理图和pcb转换成Altium Designer格式
  20. 什么性格的人适合做好的程序员?

热门文章

  1. 所有问题计算机解决,为什么重新启动计算机可以解决许多问题? | MOS86
  2. 四年云战争,华为打出了什么结果?
  3. rn android mac打包,React-Native之MAC平台Android apk打包流程
  4. O2O与B2B、B2C、C2C之间的区别
  5. Python内循环语句的语法及其使用方法等...【详细】
  6. multisimu仿真用电阻模拟继电器线圈,因为电阻功率太小,电流正常显示一会会变为0,是电阻烧坏的缘故
  7. 最大股票收益问题(数组最大差问题)
  8. Android必学最实用快捷键
  9. StramApi常用操作
  10. 物联网LPWA通信技术(1):NB-IOT通信特点及主要场景应用