视觉生产技术探究和应用

概念理解

定义

通过一个或一系列视觉过程,产出新的视觉表达,是人或机器能够感知的图像视频,而不是标签或特征。

分类

  • 生成:从0到1

  • 拓展:从1到N

  • 摘要:从N到1

  • 升维:从An到An+ 1

  • 增强/变换:从A到B

  • 插入/合成:A+B=C

  • 擦除:A-B=C

通用基础框架

五个关键维度

1.可看(满足视觉/美学表现)

2.合理(合乎语义/内容逻辑)

3.多样(保证结果的丰富性)

4.可控(提供用户预期的抓手)

5.可用(带来用户/商业价值)

精细理解

分割抠图

  1. 识别:能知道图片中物体,知道物体是什么。
  2. 检测:能识别,还要能知道在哪个区域。
  3. 分割:识别、检测、并知道每一个像素是什么,能将区域完整切割分离。

难点

  1. 复杂背景

  2. 遮挡

  3. 发丝精抠(图像中毛发等细微处

  4. 边缘反色

  5. 透明材质(图像中玻璃等

  6. 多尺度/目标

  7. 数据严重不足,标注成本高

解题思路
Semantic Segmentation(语义分割)

Instance Segmentation(实例分割)

Image Matting(抠图)

思路:1.复杂问题拆解:粗mask估计+精准matting
2.丰富数据样本:设计图像mask统一模型

模型框架

Step1:mask粗分割

Step2:mask质量统一

Step3:估计精确alpha

视觉生成

框架流程

1.理需求

2.定草图

3.选状态

4.调细节

5.生成图

6.评好坏

视觉编辑

视频植入作用

  • 挖掘视频核心价值

  • 扩大植入覆盖范围

  • 提升植入效果效率

关键点

(广告等)植入位检测与定位

动态检测分割

视频内容擦除

文字擦除

Logo擦除

画幅变化(缩放

图像尺寸变化

视觉增强

  • 视频增强

  • 人脸修复增强

  • 渲染图超分

  • 视频插帧

  • HDR色彩扩展

  • 风格迁移

  • 颜色拓展

视觉制造

实体设计制造

缺点

  • 效率低:多次打样,多次沟通(服装设计平均30天)

  • 协同差:设计、营销、生成脱节、倒置

  • 定制难:无法实现柔性生产

核心逻辑


包装几何生成

服装几何生成

材质工艺


多样性拓展

2D3D融合

应用平台

鹿班

鹿班是视觉生成领域在业界落地的先行者,对外提供大规模在线的AI设计服务

AlibabaWood

AI生成商品短视频,能做到剧本生成、智能文案生成、自动剪辑、智能音乐推荐。

阿里云视觉开放平台

提供高易用、普惠的视觉API服务

AI5天训练-视觉生产技术探究和应用相关推荐

  1. 【阿里云高校计划】阿里云视觉AI训练营 DAY1 AI视觉生产技术简述

    目录 写在前面 定义和分类 定义 分类 通用基础框架 五个关键维度 分割抠图 分割抠图 难点 解题思路 模型框架 部分扩展 视觉生成 以平面设计图像生成平台--<鹿班>为例 框架流程 鹿班 ...

  2. 【阿里云高校计划】导论-视觉AI技术应用探索 day1 【一见钟情】

    导论-视觉AI技术应用探索 视觉生产技术--探索与应用 定义和分类 视觉生产定义 视觉生产分类 视觉生产通用框架 视觉生产五个关键维度 精细理解--寻微入里 分割抠图理解 分割抠图难点 分割抠图思路 ...

  3. 达摩院视觉AI训练营-视觉AI技术应用探索-学习笔记

    视觉生产技术目录 一.视觉生产定义 定义: 分类: 通用基础框架 五个关键维度 二.精细理解-寻微入里 分割抠图-难点: 分割抠图-解题思路: 分割抠图-模型框架: 分割抠图-人像抠图拓展: 分割抠图 ...

  4. 【视觉AI训练营】day1导论-视觉AI技术应用探索

    非常高兴能够成功报名参加这期AI训练营,希望能有一份不一样的体验. 视觉生产技术 1.定义和分类 2.精细理解-寻微入里 3.视觉生成 4.视觉编辑 5.视觉增强-修复如新 6.视觉制造-由虚入实 7 ...

  5. 架构师实践日 · 6.30 杭州站 | 视觉 AI 技术如何助力行业提升?来西子湖畔与业内大咖面对面交流!

    伴随内容形式的变迁(文字 → 图片 → 视频),目前视觉 AI 技术不仅被应用到传统领域的升级革新中,还作为最重要的基础人工智能技术渗透到前沿技术的创新研究中. 七牛架构师实践日第二十九期将以视觉 A ...

  6. 计算机图像图形研究目的,计算机图形图像技术探究论文

    随着计算机技术的发展以及在实际中推广应用的越来越多,应用计算机实现图形图像设计与视觉侦查的情况越来越多,成为计算机技术与设计领域研究和关注的重点之一.下面是学习啦小编给大家推荐的计算机图形图像技术探究 ...

  7. 如何打造一流的视觉AI技术

    本次分享主要分以下几个部分:首先简要介绍一下计算机视觉技术的相关背景,然后结合格灵深瞳的实践,从算法研发.训练平台.智能数据处理.异构计算等几个方面着重介绍如何打造一流的视觉AI技术,最后介绍格灵深瞳 ...

  8. 计算机存储技术及其发展了论文,计算机网络存储技术探究-计算机网络论文-计算机论文(13页)-原创力文档...

    计算机网络存储技术探究 摘要:计算机网络的诞生无疑为信息数据的管理带来了"福音",但随着网络化进程的持续,网络信息数据的总量还会不断增大,解决总量庞大的网络信息的存储必然会成为网络 ...

  9. 「实践出真知」如何打造一流的视觉AI技术

    分享嘉宾:邓亚峰 格灵深瞳 CTO 内容来源:AI先行者大会<如何打造一流的视觉AI技术> 出品社区:DataFun 注:我爱计算机视觉获官方授权发布 本次分享主要分以下几个部分:首先简要 ...

最新文章

  1. github组织存储库使用_为什么我不使用您的GitHub存储库
  2. Ubuntu16.04彻底删除旧内核
  3. QT的QScroller类的使用
  4. [Java基础]抽象类基础
  5. 没有日志 mysql 5.6主从同步_mysql之 mysql 5.6不停机主从搭建(一主一从基于日志点复制)...
  6. JDK 1.8新特性
  7. win10专业版开机画面模糊_Win10系统登录背景变模糊的两种恢复方法
  8. Python九九乘法表(作业)
  9. 展锐sc8541E多媒体网络摄像播放-液晶驱动一体板
  10. dnf mysql数据库密码,MYSQL8在CentOS8环境中的安装过程(DNF/YUM)
  11. php gtk 中文手册,PHP-GTK
  12. MIPI DSI-2 协议解析
  13. ThreeJs基础代码段(五)飘扬的旗帜
  14. Python在cmd上打印彩色文字
  15. 信息奥赛一本通1225:金银岛
  16. 关于内部用户通过easy-ip访问外网
  17. 在线运行 Linux,真滴牛逼。
  18. “日志事件详细信息”(Log Event Details) 页面
  19. 关注点云 专栏及博主
  20. 为 repo ‘AppStream‘ 下载元数据失败 错误:为 repo ‘AppStream‘ 下载元数据失败

热门文章

  1. C/C++—— int main(int argc,char* argv[])讲解
  2. 【AI视野·今日Robot 机器人论文速览 第二期】Mon, 7 Jun 2021
  3. 第一条Pulsar消息发送
  4. 字节流复制文件 java
  5. 多重异常处理 java
  6. 代码控制树视图 c# 1614262980
  7. python-字符串的切片操作
  8. linux-修改所有者与所属组
  9. python-turtle库的基本操作
  10. python-copy模块-待优化的功能