点击上方“蓝色字体”,选择 “设为星标”

关键讯息,D1时间送达!

随着企业开始使用可将其数据投入使用的深度学习(DL)项目,他们必须保护这些数据,而数字孪生是成功的关键。

在当今世界,数据为王。无论是亚马逊、苹果、Facebook、谷歌、沃尔玛还是Netflix,世界上最有价值的公司都有一个共同点:数据是他们最有价值的资产。所有这些公司都使用深度学习(DL)将这些数据投入使用。

无论您从事什么业务,数据都是您最宝贵的资产。您需要通过执行自己的DL保护这些资产。深度学习成功的最重要因素是拥有足够的正确种类的数据。那就是数字孪生的由来。

数字孪生是实际物理过程、系统或设备的数字副本。简单说,数字孪生就是在虚拟世界中再造一个现实世界。最重要的是,数字孪生可能是深度学习项目成功的关键,尤其是涉及危险、昂贵或耗时的过程的深度学习项目。

●深度学习的希望●

到目前为止,包括半导体制造在内的几乎每个行业都已经意识到DL创造战略优势的潜力。深度学习使用神经网络来执行高级模式匹配。深度学习已应用于面部和语音识别、医学图像分析、生物信息学和材料检查等各种领域。

在半导体制造中,深度学习已经应用于产品缺陷分类等领域。大多数领先的公司都争先恐后地在这个充满希望的新竞争环境中获得优势。

随着企业开始探索深度学习及其如何为他们提供帮助,许多企业发现了两点:第一,获得深度学习原型很容易;其次,从“好的原型”到“生产质量”的结果很难。

如今,有了所有从低成本到免费的深度学习平台、工具和套件,与常规应用程序开发相比,深度学习应用的初始开发非常快速且相对容易。但是,产品化深度学习应用并不比产品化传统应用更容易,甚至更难。

原因在于数据。在没有提供生产质量结果的深度学习应用和彻底改变您解决特定问题方式的深度学习应用之间,通常有足够的数据以及足够的正确类型的数据。

●深度学习的数据缺口●

深度学习基于模式匹配,它是通过向神经网络呈现表示要匹配的目标的数据来进行“编程”的。大量数据训练网络以识别目标(并知道何时不是目标)。

深度学习具有强大的功能,可快速生成原型并提供概念验证。但是深度学习的真正优势不是开发速度。这是事实,它释放了数据的力量来做其他任何方式都做不到的事情。

任何深度学习应用的成功都取决于训练中使用的数据集的深度和广度。如果训练数据集太小、太狭窄或太“正常”,那么深度学习方法将不会比标准技术做得更好。实际上,它可能会做得更差。重要的是,用足够多的数据来训练网络,以表示所有重要状态或演示的数据,以使网络学会掌握当前问题的正确本质。

对于某些领域(例如自动驾驶或半导体制造)而言,困难之处在于(非常幸运地)很少发生某些最严重的异常情况。但是,如果您想让深度学习应用识别出在汽车前面跑来跑去的孩子(或致命的光罩错误),则必须使用大量这些情况来训练网络,而在实际情况是现实世界中并没有太多这些数据。而数字孪生是创建足够的异常数据以正确训练网络识别这些条件的唯一方法。

上图为带有标准偏差的正态分布曲线图。在半导体制造中,与驾驶一样,“异常”事件非常少见,但是必须对神经网络进行尽可能多的训练,因为最坏的事件会导致芯片故障。使得整体平均效果还不够好。

●数字孪生缩小了差距●

数字孪生,也就是实际过程、系统和设备的虚拟表示,是用于创建正确数量以及正确类型的数据以成功训练深度学习网络的关键工具。

使用数字双胞胎创建DL训练数据有以下几个原因:

  • 您所处的数据可能属于您的客户,因此您不能将其用于深度学习训练。

  • 您可能需要将创建深度学习所需数据的资源完全投入到客户项目中。

  • 您已经开发了深度学习应用,但是发现您需要特定的数据来调整和训练您的神经网络以达到所需的准确性,但是使用晶圆厂资源创建数据的成本高得令人望而却步。

  • 您知道您将无法找到足够的异常数据来适当地训练深度学习网络。最后一种情况几乎是普遍存在的。

理想情况下,要保持对数据的完全控制,您需要三个数字孪生:生产流程中先于您的过程/设备的数字孪生子,以提供用于模拟您自己的过程的输入数据;您自己的过程/设备的数字孪生;以及在生产流程中跟随您的过程/设备的数字孪生,以便您可以将输出馈送到下游进行验证。

在2019年SPIE光罩技术会议上,D2S展示了一篇论文,展示了使用深度学习技术创建的两个数字孪生,即扫描电子显微镜(SEM)数字孪生子和曲线反光刻技术(ILT)数字孪生(图2显示了SEM数字孪生的输出)。虽然数字孪生的输出通常不足以用于制造,但这些数字孪生已被用于训练深度学习神经网络和验证。重要的是,这些数字孪生是由深度学习而不是通过仿真生成的。

这是一个使用深度学习作为生成其他DL所需数据的工具的示例,它展示了投资深度学习的复合收益。

上图由SEM数字孪生生成的掩模SEM图像和真实SEM图像的两个示例。还显示了在同一位置的水平切割线上的图像强度。不仅图像看起来非常相似,而且边缘的信号响应也相似。

●深度学习成功的路线图●

所有这些听起来都像是有很多工作要做。为什么不使用咨询公司为您做深度学习?因为,记住,数据为王!保护数据并自己执行深度学习。值得庆幸的是,我们可以遵循一条成功的既定道路。

首先,您需要确定将对深度学习产生影响的项目。您确实需要谨慎选择,深度学习是模式匹配,因此您需要选择属于该领域的内容。基于图像的应用,例如缺陷分类是比较匹配的。晶圆厂中的所有设备都会创建大量的运行数据,除非出现问题,否则很少引用这些数据。

您不仅可以事后将这些宝贵的数据仅用作诊断工具,还可以持续监控整个Fab上的数据,并训练深度学习应用程序以标记出问题之前的模式,这样您就可以在问题产生影响之前识别和纠正问题,节省停机时间。

例如,Mycronic在2020 SPIE Advanced Lithography Conference上的eBeam Initiative午餐时间演讲中披露,该公司如何利用其机器日志文件中的数据来使深度学习正常工作,以预测像“mura”之类的异常(不均匀的亮度影响,使人烦恼),但是众所周知,这对于图像处理算法来说很难在平板显示器(FPD)掩模上检测到。

通常,操作员执行的是非常乏味且容易出错的过程,但是很难使用传统算法实现自动化,因此这是深度学习的不错选择。无论是通过目视检查还是其他方式,检查特定情况的专业人员都会非常有可能正确执行任务。但是面对许多类似情况的例子,人类会犯错并变得越来越不可靠。

在特定情况下,深度学习可能不如人类所能做的那样好。但是它在一些情况下却做得比人类要好。随着执行任务时间的增加,人类会犯更多的错误;而深度学习的成功概率不会随着数量或时间的增加而降低。

●帮助缩小与深度学习成功之间的差距●

一旦确定了深度学习项目,就会有多种可用资源,可带您迈向成功之路,同时仍然使您能够严格控制自己的数据。如果您是深度学习的新手,并希望为深度学习试点项目提供全面支持,则可以加入电子制造深度学习中心(CDLe),这是一个旨在联合起来的行业领导者联盟人才和资源来提升深度学习在我们独特的问题空间中的先进水平,并加快深度学习在我们企业的每种产品中的采用,从而改善我们为客户提供的产品。

如果您已经开始进行深度学习项目,但是由于深度学习数据缺口而遇到了问题,那么D2S可以帮助您构建数字双胞胎,您需要对它们进行扩充和调整才能使DL成功。

(来源:千家网)

如果您在企业IT、网络、通信行业的某一领域工作,并希望分享观点,欢迎给企业网D1Net投稿 投稿邮箱:editor@d1net.com

点击蓝色字体关注

企业网D1net旗下信众智是CIO(首席信息官)的智力、资源分享平台,也是国内最大的CIO社交平台。

信众智让CIO为CIO服务,提供产品点评、咨询、培训、猎头、需求对接等服务。也是国内最早的toB共享经济平台。

同时,企业网D1net和超过一半的央企信息部门主管联合成立了中国企业数字化联盟,主要面向各地大型企业,提供数字化转型方面的技术、政策、战略、战术方面的帮助和支撑。

扫描下方“二维”或点击“可以查看更多详情

仿真的数据能否用来深度学习_数字孪生弥合了深度学习的数据鸿沟相关推荐

  1. 机器学习和深度学习_算法测评 | 机器学习VS深度学习

    OLDER BROTHER 大家好,我是你们的机房老哥! "机器学习进阶" 「前言」 " 机器学习和深度学习是很早前就埋下的坑,最近决定整合写一篇,利用机器学习的经典算法 ...

  2. kafka学习_《从0到1学习Flink》—— Flink 读取 Kafka 数据写入到 RabbitMQ

    前言 之前有文章 <从0到1学习Flink>-- Flink 写入数据到 Kafka 写过 Flink 将处理后的数据后发到 Kafka 消息队列中去,当然我们常用的消息队列可不止这一种, ...

  3. 多智能体强化学习_基于多智能体强化学习主宰星际争霸游戏

    大家好,今天我们来介绍基于多智能体强化学习主宰星际争霸游戏这篇论文 Grandmaster level in StarCraft II using multi-agent reinforcement ...

  4. 什么是数字孪生?【深度解析】

    Digital Twin数字孪生:是充分利用物理模型.传感器更新.运行历史等数据,集成多学科.多物理量.多尺度.多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程. Di ...

  5. 人工智能 java 坦克机器人系列: 强化学习_人工智能 Java 坦克机器人系列: 强化学习 | 学步园...

    本文中,我们将使用强化学习来实现一个机器人.使用强化学习能创建一个自适应的战斗机器人.这个机器人能在战斗中根据环境取得最好的策略,并尽力使战斗行为最佳.并在此过程中不断学习以完善自身不足. Roboc ...

  6. 人工智能 java 坦克机器人系列: 强化学习_人工智能 Java 坦克机器人系列: 强化学习...

    人工智能 Java 坦克机器人系列: 强化学习 发表于:2007-05-24来源:作者:点击数: 本文中,我们将使用强化学习来实现一个机器人.使用强化学习能创建一个自适应的战斗机器人.这个机器人能在战 ...

  7. 数据中心可视化合集 | 图扑数字孪生机房,解锁运维新境界

    IDC(Internet Data Center)数据中心可视化是指通过可视化的方式对数据中心的运行状态.资源使用情况.安全监控等进行展示和管理.可以帮助管理员更好地了解数据中心的运行情况和趋势,及时 ...

  8. mock模拟的数据能增删改查吗_如何在Vue中使用Mockjs模拟数据的增删查改

    之前一直使用json-server在前端开发时,搭建本地数据接口测试,但有时又需要将做好的项目放于 github page上做项目演示.在本地时,json server很好使用,但一旦放在github ...

  9. 大数据基石python学习_资源 | 177G Python/机器学习/深度学习/算法/TensorFlow等视频,涵盖入门/中级/项目各阶段!...

    原标题:资源 | 177G Python/机器学习/深度学习/算法/TensorFlow等视频,涵盖入门/中级/项目各阶段! 这是一份比较全面的视频教程,基本上包括了市面上所有关于机器学习,统计学习, ...

最新文章

  1. python 学习笔记 5 -- 文件输入输出
  2. hdu4277 暴力
  3. 学术顶会再突破!计算平台MaxCompute论文入选国际顶会VLDB 2021
  4. 十四、Python第十四课——文件和异常
  5. mysql info commit_mysql show processlist 发现大量的commit
  6. 两个网段在同一个交换机_告诉你PC不能通过二层交换机实现跨网段通信的小秘密:你很难想到...
  7. 【近万字】分数傅里叶变换课程学习笔记
  8. 手机网站的图片轮换教程
  9. 4.5 Spark SQL 处理JSON数据
  10. mapreduce多路输出实例
  11. 如何查看CSDN发布的博客和上传的资源?
  12. Ubuntu下截图贴图软件——flameshot
  13. Excel插件:方方格子
  14. python实现文本翻译
  15. switch错误码2016-0247 无法识别SD卡解决方案(猴子也能看懂的简单命令行操作,无需格式化!)
  16. 高等数学---第八章多元函数微分学---多元函数的极值与最值
  17. 巨杉数据库sequoiadb助理工程师(SCDA)初级考试笔记(二)
  18. 计算机换色带技巧,平乐园电脑维修店教你爱普生针式打印机更换色带基本办法...
  19. 什么是软件即服务(SaaS) ? SaaS新手入门指南
  20. 02读书笔记:《编码》-隐匿在计算机软硬件背后的语言(12-14章)

热门文章

  1. Hadoop--ip和主机名配置
  2. 诞生至今,大数据的真正含义到底是什么?
  3. 教你如何在项目中集成推送功能
  4. C#:解决WCF中服务引用 自动生成代码不全的问题。
  5. hdu1251(统计难题)
  6. route 更改网络设置
  7. SQLSERVER存储过程列名无效的解决方法
  8. 为项目选择合适的语言
  9. Dos命令使用Latex编写“Hello Latex.”
  10. 信息学奥赛一本通(1060:均值)