严格地说,现在的AI技术测试与评价仅是半个或更小部分的测试与评价,即它只是建立在已有基础不完备科学技术上的测试与评价,忽略了更重要的非科技因素,如不确定性人文和环境的因素,所以这样的测试与评价大都是乌托邦式的,单纯军事领域的兵棋推演、红蓝对抗解决不了AI测试与评价的根本问题,这是一个超出了单一领域的复杂性难题,如同2015年第87届奥斯卡获奖电影《Birdman》中那句经典台词一样“AI is AI, not what is said of that AI”(道可道,非常道),所以我们认为应该借鉴孔子“随心所欲,不逾矩”的思想,即自主要有原则,而不能够无底线。AI军事化与AI游戏有根本的不同,就像生死的差异,对游戏化的军事智能测试与评价需要高度警惕。

由于人、机、环境诸多影响因素的可变性和可分离性,人工智能技术测试与评价在很多军事博弈任务中是一种普遍不可重复性的不可控实验,所以“各国应确保在部署前在实际作战条件下对人工智能军事系统进行全面测试、评估、验证和验证”会很难实现,不过“建立最低标准”应该比较现实,以确保遵守国际人道主义法和其他相关国际法规则。

令人遗憾的是,当前的AI测试与评价往往是场景化的,陆、海、空及其之间通信协同、指挥控制等等,从技术上看,主要有机器的稳定可靠、快速准确等可计算性指标;从人机交互上看,还应有人的敏捷洞察、触类旁通、责任勇敢等非计算性指标;从更高的层次上看,还应有伦理道德、法律法规等非计算指标条件。所以真实的AI技术测试与评价本质上常常是非场景化的,是计算性指标与非计算性指标结合的产物,若仅仅限于科学技术方法而言,甚至应该是无解的,如绝不能让希特勒们拥有核武器一样,也要坚决制止他们拥有高级的人工智能武器。

客观而言,智能技术中还有许多我们远远没有看到的东西,如同当前的核生化技术一样,除了最原始、最底层的技术性测试与评价之外,还有大量的非技术性测试与评价,如同前几次我们讨论过的人机环境系统问题,这里的人涉及许多方面的人,如开发者、使用者、维护者、销售者、管理者甚至包括我们这些交流探讨者等等,角度不同,认识的深度和广度也会不同,一件人工智能武器本身就是一种双刃剑,既可以伤人也可能伤己,而且反转的可能性还不小,比如一套便携式的智能空中武器或防空武器通过第三方一旦被对手缴获,很容易被对手利用攻击己方,核生化也有同样的问题;机器包括软件和硬件部分,软件程序的脆弱性、数据毒化、算法偏见、深度伪造、不可解释性、无常识性以及硬件的老化破损也存在着大量的隐患和潜在的问题;环境包括各种各样的环境,如真实环境、虚拟环境、任务环境、天气环境、社会环境等等,这些不同的环境会对AI测试与评价起到重要的作用,中国有句古话:“天时不如地利,地利不如人和”就是在讲各种环境对于博弈结果的影响,也许这句话对AI技术也有适用之处吧!比如一套AI辅助决策系统经过计算告诉你“中国新疆有棉花问题”,你就采取了行动,然而事实却不是这样的,而且是相反的,这样AI系统就起到了相反的作用,究其因,缘于这套AI系统不了解真实的社会环境所产生的算法歧视所致。真实的人机回路测试与评价系统往往是人、机、环境的上、中、外混杂进行的,而不是单纯的人在环上、中、外,而正是这种混杂性,使得人机环境系统常常失配。

随着AI新的理论和技术层出不穷,并且速度不断加快,当前过早制定的测试与评价指标会变得过时甚至是荒谬,所以目前讨论的重点还不应是过细的指标体系,而应该是现有的技术缺陷以及这些技术与可能出现的技术对人类的影响,当然还有各种不合时宜的法律规则之前的有关伦理道德的基本框架,如此“见义(should)勇为”,才有可能真正实现对AI这头怪兽的管控与约束,进而才能保障人类本身的安全不毁于“人类聪明”之手。

总之,人工智能技术的测试与评价产生于数以百万计(甚至于无穷)的“自发”(意料之外)和“设计”(意料之内)的人机环境系统秩序的复杂互动中。这种秩序以渐进、弥散、聚合、转化、调整的方式演化,它是众多人的动机/行为、机器装置的运行、环境变化互动的综合结果,而非单纯人类设计的结果。

平心而论,人机混合的智能技术同人工智能技术一样依然存在着许多缺点和不足,同样很难在复杂环境下做出正确的判断和决策,那么该如何克服这些薄弱环节达到更好的智能效果呢?通过人机环境系统智能可能是一种较好的研究途径,要确定当前、未来AI测试与评价的指标体系,进而为AI军事系统的测试和评估提出一套通用的指标和标准,建议下一步更加深入地探讨研究人、机、环境结合的系统智能问题。

语言是有局限的,不同的目的和价值对齐,会有不同的角度和认识,各种测试与评价呢?事实可以凝炼出价值,价值是否可以在某些时候凝炼出“事实”呢?或许,很多时候,道还是那个道,名却不一定是那个名,或者反之也成立……

【学会双百讲堂】中国指挥与控制学会“百名专家、百场讲座”第七讲——城市大脑系列学术报告(第一期)

主办单位:

中国指挥与控制学会

承办单位:

中国指挥与控制学会城市大脑专业委员会

远望智库

北京邮电大学人工智能学院

报告人: 刘伟

报告时间: 2022年7月23日,周六20:00

报告地点: 腾讯会议288-655-594

报告题目:人机混合智能的思考

报告内容摘要

通过我们对人机交互、人机混合智能、深度态势感知、计算与算计的理论起源、发展过程、未来展望思考,并结合相关国内外研究现状,提出一些较深入思考后的观点,并认为解决未来人工智能问题的前途在于人机环境系统智能的发展。

在“活猪实验”之后,“脑机接口之父”Miguel Nicolelis直接开启了炮轰模式

(马斯克)说的话,我一个字都不认同。

关于AI测试与评价的讨论相关推荐

  1. 小议智能的测试与评价

    西方理解智能(包括AI)一个最大的角度是物理,把智能的本质看成是物理规律,并结合数理方法去处理这些物理化了的智能体,尽管其中也有生理.心理等学科的浸入,其认识论的主轴主线依然是物理规律结合数理方法,很 ...

  2. 人脸检测颜值软件_AI人脸颜值测颜版下载-百度ai测试颜值人脸识别源码下载v1.0 免费版-西西软件下载...

    百度ai测试颜值人脸识别源码这是由官方百度AI精心打造出来的,这款软件将人脸识别氛围V2和V3两个接口,而且用户使用可以参考相应的文档权限来选择接口类型,让广大用户学习到百度AI人脸识别测颜值相关知识 ...

  3. 如何进行AI测试-入门篇

    一.人工智能(AI)是什么 人工智能,英文 Artificial Intelligence,简称 AI,是利用机器学习技术模拟.延伸和扩展人的智能的理论.方法.技术及应用的一门新的技术科学. 人工智能 ...

  4. AI测试,当下有为未来可期:业界第一本AI测试秘籍重磅发布

    近半年以来,有众多行业朋友在各种渠道询问<机器学习测试入门与实践>出版的进展.非常感谢大家对本书的热情和期待,经过不断地打磨和完善,这次总算可以大声的告诉大家. <机器学习测试入门与 ...

  5. 测试工程师的好日子来啦?Testin发布AI测试产品,提升易用性和自动化效率

    2019年10月26日,以"AI+未来"为主题的第二届NCTS中国云测试行业峰会在北京国际会议中心正式开幕.在本次大会上,Testin 总裁徐琨正式发布测试业务Testin云测的全 ...

  6. 测试身体素质健康的软件,《体质健康测试与评价》手机应用(App)的开发及应用...

    摘要: 目的:<体质健康测试与评价>实验项目是<运动生理学><运动医学常用科研仪器操作><国民体质测量与评价>及<体育测量与评价>等课程实验 ...

  7. 原创 | 开源AI测试专题、Jmeter测试专题

    开源 AI 测试专题 震惊!AI成功落地自动化测试 AI 软件测试工具 Mabl 快速概览 AI测试工具 Mabl - 测试用例自动自愈 Sauce Labs 的持续 UI 自动化测试云 疫情中诞生的 ...

  8. Csdn视频第二十期 : 测试工具与流程讨论

    Csdn视频第二十期 : 测试工具与流程讨论 http://live.csdn.net/Issue22/LivePlay.aspx

  9. 人工智能 对比试验_【AI测试】人工智能 (AI) 测试--第二篇

    测试用例 人工智能 (AI) 测试 或者说是 算法测试,主要做的有三件事. 收集测试数据 思考需要什么样的测试数据,测试数据的标注 跑测试数据 编写测试脚本批量运行 查看数据结果 统计正确和错误的个数 ...

最新文章

  1. 【播放器SDK】Android如何实现固定竖屏播放视频
  2. 渣科如何逆袭进阿里 No.137
  3. 浅谈Javascript中的void操作符
  4. 【计网】计算机网络-物理层【理论1-2】
  5. c6011取消对null指针的引用_C++中的引用
  6. bufferedimage生成的图片模糊_Kaptcha图片验证码工具
  7. [家里蹲大学数学杂志]第041期中山大学数计学院 2008 级数学与应用数学专业《泛函分析》期末考试试题 A...
  8. windows下使用kafka
  9. c语言存储学生信息并显示,C语言实现学生信息管理程序
  10. 电池革命:固态电池量产还有多远?
  11. easyUI1.7学习第一天_menu表单
  12. 关于yuv rtp 打包_【讲堂】关于KNX编程基本规律
  13. 手把手教你做html日历
  14. 怎样P漫画脸?这三个简单方法分享给你
  15. 涂鸦智能进击南美取暖器市场
  16. BUUCTF Misc 被劫持的神秘礼物
  17. linux clk驱动框架
  18. 前置机的作用(转载)
  19. 7-1 sdut-求一个3*3矩阵对角线元素之和7-2 求矩阵各行元素之和7-3 sdut- 对称矩阵的判定7-4 sdut- 杨辉三角7-5 sdut- 鞍点计算7-6 矩阵转置
  20. 微积分:如何理解方向导数与梯度?

热门文章

  1. 中级宏观经济学复习范围(马工程)
  2. switch 语句的参数类型
  3. Socket和ServerSocket的介绍
  4. Nmap命令详解(全)
  5. numpy.reshape()函数
  6. mysql修改时区方法小结
  7. sqlserver/mysql 替换部分位置的字符串
  8. Python:缓存库mo-cache支持内存、文件、Redis
  9. MO call与MT call
  10. 编写Makefile文件