ChatGPT自从去年12月火爆以来一直热度不减,最近正好研读了科技之巅,书中详细阐述了人机交互、人工智能、算力算法等技术的发展历史,本文主要围绕ChatGPT引发的人机交互方面的思考。

在讨论人机交互之前,首先需要说明的一点,目前计算机发展的结果已经从原来作为科学计算工具转变为信息处理和信息交互工作,计算机通过软硬件帮助大家做业务研究或管理决策,目前大部分办公室白领、生产平台员工、智能工厂员工等从事的工作不是实际操作机器,而是要依赖一台计算机,甚至是一台能远程控制机器的计算机,计算机已经涉及人们的方方面面。

那么,人机交互是什么呢?人机交互是为了解决人类与机器(作为工具)之间的交流问题。人类和计算机的交流和互动是人机交互技术的核心,所有交互技术的发展都是用来提升人机交互的体验和效率。

人机交互从最初的穿孔卡片--》专用编程语言--》图形界面和鼠标操控--》Apple Siri/Google Assistant自然语言关键词交互--》ChatGPT自然语言理解交互--》Oculus Rift VR沉浸式虚拟现实--》Magic Leap Microsoft Hololens AR/MR增强/混合现实,使得人机交互更加符合人类自然的交互方式,从直观化和便捷化,发展到后来的可穿戴化,最后到达本能化和植入化。

应该说,ChatGPT彻底改变了以往我们使用计算机的应用入口,目前大家上互联网的入口主要还是搜索引擎,也有一些app,比如头条,小红书、b站等,但这些入口都有一个问题,主要还是通过关键词匹配内容,最多加入一些内容相关和个性化特征。但ChatGPT天生就是用大量语料训练的自然语言大模型,他解决了自然语言的分词、实体识别、关系识别、意图识别等等,而且ChatGPT是AIG的,即通用人工智能,解决大众普适的各类自然语言的问题,ChatGPT的受众更广泛,使用更自然,相比较以往的搜索引擎、语音助手、智能助手,ChatGPT更自然,正好是人机交互的发展所需,相当于是一种新的人机交互应用入口,大家称之为LUI(即Language User Interface),未来ChatGPT与各行各业的业务结合,一定会出现各种应用,比如ChatGPT+能源助手等。以下回顾了人机交互的发展历程。

1.结合手机的智能助手Apple Siri界面:Siri是2009年第一次出现在苹果手机,Siri不单单是一个搜索引擎,而是一个处理引擎,集成了AI、语音识别(与Nuance合作)、语音文字聊天服务和资源整合,人类通过与Siri大量的交流,Siri能够从交流中获取用户需求,并结合集成的各项技术和资源提供个性化答案。目前ChatGPT做到了更进一步,不单单是关键词,对整个语句进行了语义上下文理解,集合后端的大语言模型,提供有针对性的中性答案,人类也可以通过与ChatGPT互动,引导其提供某些倾向性的答案,相信后续的各种ChatGPT+业务应用场景会雨后春笋班的涌现出来。

2.手势界面:GUI界面需要键盘鼠标,触摸屏需要占用人类一两根手指,而手势界面是通过3D视觉识别技术实现的,核心是传感器和动作识别,所以,传感线和动作空间确定了手势界面的分层级别,平时玩游戏的游戏手柄相当于二维的触控手柄,而Microsoft Kinect体感游戏模块的动作识别就是三维空间的动作识别,Kinect通过深度摄像头,利用里面的红外线处理场景,获得物体景深信息并编码,再通过图像传感器读取编码后的场景,最后通过算法推算出场景的三维信息,非常复杂,要求高效,Kinect集成了动态捕捉、影像辨识、语音输入识别、多人互动等功能,应该是Kinect开启了人机交互的新纪元,但在三维空间中人机交互的动作识别和处理速度要求更高,XBOX就集成了Kinect,从而催生出手势界面和语音接口。

3.语音接口界面:语音接口其实是在AI、语音识别、自然语言处理和大语言模型技术催生下的产物,语音接口使得人机交互更加自然,计算机更贴心友好和个性化,而且受众用户也比图形用户界面广泛,比如老人、盲人,目前随着微信等即时通讯app的发展,语音接口已经成为人机交互的重要入口,特别是随着最近ChatGPT的火爆,后续一定会忘LUI方向发展,使得人机交互更加自然便捷。

4.智能可穿戴设备界面:目前大家每天用的最多的设备是手机,随着智能化可穿戴设备的出现,有可能有所转变,比如智能手表,智能手环,智能服饰,Google Glass眼镜,头盔等,这些设备或多或少具有语音识别、健康跟踪检测,健康指导指南、信息提醒等功能,我认为这些可穿戴设备都是一些过渡产品,未来可能会出现更加自然的人机融合产品。

5.沉浸式交互界面:VR是结合了众多人机交互接口技术的沉浸式超凡用户体验的核心技术,代表性产品是Oculus Rift VR;AR更进一步,是将虚拟事物加到现实世界中,代表性产品是Magic Leap或Microsoft Hololens,AR技术设计空间感知和光场显示技术,光场显示需要建立起四维的光场空间,使得虚拟物体与自然物体一样,在我们的视觉中有虚实变化,高低远近物体的聚焦变化等。这两项技术目前只在一些固定场景或游戏场景里面使用,针对消费类或工业类应用场景,实现通用的技术难度还是比较大,需要结合数字孪生,渲染引擎来做,目前在硬件、软件、产品定位和实际应用场景方面都存在大量未攻克的瓶颈,目前还做不到人类要求的自然人机交互水平,但后续的发展机会也非常多,现在国内外已经有很多结合头盔方面的产品和应用案例,因为我们实际业务中都得带头盔,相当于头盔是人从事工业工作得必需品,而这种设备相当于在头盔外面加一个附加设备。

因此,过去10年,人机交互技术发生了翻天覆地的变革,从最早的CLI(Command Line Interface)-->GUI(Graphical User Interface)-->VUI(Voice User Interface)-->LUI(Language User Interface),人机交互演进从直观化--》便捷化和集成化--》可穿戴化--》本能化和植入化

目前从人类五官(听觉、视觉、触觉、嗅觉和味觉)来分析,其实除了后面两个外,其他都已被人机交互技术涵盖了,只是精细度、自然性和一致性未达到人类要求,人机交互已经从一维/二维发展到三维或多维立体,也就是说,未来应该从感官层面向着脑意识层面转变,比如通过隐形眼镜、脑机接口真正实现人机融合,未来的人机交互技术或产品更加集成、便捷、可穿戴甚至植入。人机交互的未来发展趋势应该是交互的自然高效,形成高可用的自然交互技术,彻底实现人机融合,使得人类更高效的利用计算机这一集成工具。

未来可期。

ChatGPT引发的人机交互发展历程与升级思考相关推荐

  1. 【原创】软件架构技术发展历程总结及思考 1of2(待续)

    软件架构技术的发展历程总结及思考1of2(待续) 骆金松 1   软件架构技术产生的背景 1.1     软件危机的出现 20 世纪60年代以前,计算机刚刚投入实际使用,软件设计往往只是为了一个特定的 ...

  2. (转载)软件架构技术的发展历程总结及思考(骆金松)

    1   软件架构技术产生的背景 1.1     软件危机的出现 20 世纪60年代以前,计算机刚刚投入实际使用,软件设计往往只是为了一个特定的应用而在指定的计算机上设计和编制,采用密切依赖于计算机的机 ...

  3. 一文读懂!达芬奇手术机器人的发展历程

    雷锋网(公众号:雷锋网)按:本文转自剪刀手雷蒙德(师云雷)的知乎专栏. 一.简介 本文描述了达芬奇手术机器人在直观手术公司早期到2009年发展的历程,也做了一个关于远程手术起源的总结,包括独特的技术趋 ...

  4. AI近十年盘点:纵览AI发展历程,探寻AI未来走向

    编者按:当我们回顾过去十年的人工智能发展历程时,可以看到一场现在还正在进行的变革,对我们的工作方式.商业运营模式和人际交往行为都产生了深远的影响.从2013年的AlexNet到变分自编码器,再到最近的 ...

  5. ChatGPT的历史和发展过程是怎样的?

    ChatGPT的历史和发展过程可以追溯到OpenAI的早期工作和一系列的语言模型项目.下面将对ChatGPT的历史和发展过程进行详细分析: 1. 早期语言模型:早在2015年,OpenAI的研究人员就 ...

  6. 数据仓库技术的发展历程

    定义 数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境.数据仓库研究和解决从数据库中获取信息的问题.数据仓库的特征在于面向主题.集成性.稳定性和时变性. 数据仓库之父Bill In ...

  7. node windows更新_node.js 01 简介 - 产生,发展历程,优势,适用场景,实际应用

    node.js是什么 上面是来自于node.js 官网 (https://nodejs.org)的介绍.翻译过来,意思是node.js 基于JavaScript, 需要运行在Chrome V8 的 J ...

  8. JAVASCRIPT发展历程

    JAVASCRIPT发展历程 诞生 JavaScript 因为互联网而生,紧跟着浏览器的出现而问世.回顾它的历史,就要从浏览器的历史讲起. 1990年底,欧洲核能研究组织(CERN)科学家 Tim B ...

  9. LiveJournal发展历程

    因近期打算对公司应用架构进行调整, 其中的一些思路值得借鉴. 以下为转载内容: 一.LiveJournal发展历程 LiveJournal是99年始于校园中的项目,几个人出于爱好做了这样一个应用,以实 ...

最新文章

  1. Windows 10全新分支版本曝光!专门优化高配置PC
  2. ISelectionSet接口
  3. java 新建double对象_java-如何在BlueJ“创建对象”对话框中输入...
  4. C语言再学习 -- 声明与定义
  5. 构建LINUX下的入侵检测系统——LIDS 系统管理命令--vlock
  6. android学习日记13--数据存储之ContentProvide
  7. Google AdWords广告的12个技巧
  8. 索尼PS5突然“上架”?预购价约7244元...
  9. Amplify Shader Editor手册
  10. 了凡四训 第一篇《立命之学》
  11. 第五部分 3D环绕声技术
  12. OpenCvSharp (C# OpenCV) OCR实现中英文识别 文字识别(附WinForm完整源码)
  13. 《当下的启蒙》的概述和精华
  14. 一站式原创文章神器,让你轻松创作高质量文章
  15. 聚焦:中国八大城市娶老婆的成本
  16. 在微信小程序中如何下载APP?
  17. docker 创建etcd集群
  18. 四年级计算机走进传统节日教案,四年级走进中国传统节日的作文范文
  19. Linux驱动开发8 platform驱动分隔、分离与分层
  20. 数据分析求职系列_简历篇

热门文章

  1. PF9810、PF9811……功率谐波测试仪、智能电量测量仪
  2. 怎么把php项目导入dw,DreamweaverCS5怎么导入项目?
  3. MHDD详细图解教程一
  4. 15款顶级的开源人工智能工具推荐
  5. 电脑计算机提示msvcp110.dll文件丢失的解决办法
  6. 【论文笔记】SCOAT-Net: A novel network for segmenting COVID-19 lung opacification from CT images
  7. 全奖博士招生,英国考文垂大学
  8. RFID和物联网的关系
  9. java jtable 分页_Jtable分页查询完整实现
  10. 头戴式蓝牙耳机哪款音质比较好?2020最受欢迎五款高清音质蓝牙耳机分享