大模型无关真理,实践才是

  • 前言
  • 符号智能
  • 计算智能
  • 机器学习
  • 总结

前言

假设此时此刻面对一个无法输出的检索问题或者一个效果较差的神经网络模型,大多数情况下我的本能反应告诉我,接下来要增加检索的时间和次数、添加多一些的网络层数和参数等等。

这并不是逃避问题的表现,反而贪婪策略在约束较少的情况下往往是收敛较快的策略,也往往是被试的第一种策略。事实上,让模型变得更大更复杂自人工智能在达特茅斯诞生之初就始终伴随着它的成长。


符号智能

紧跟着人工智能概念一起诞生的符号智能催生了最早起的智能实践:专家系统,它运用知识和推理来解决只有专家才能解决的复杂问题。

专家系统中最关键的因素在于人为标定的知识与经验,更像是含有“接口”的专业数据库,随着逻辑规则的制定与领域的划分,就不得不逐渐提升先验数据的数量与规模来加快收敛速度与精度。问题是显而易见的,实践中并非所有领域或所有问题都具有足够的先验经验,而且模型规则在增加的同时让逻辑维护也变得愈发艰难,故而如今的专家系统变成了一种更广义的概念。

在数据处理能力远落后于理论速度的情况下,1965年,L. Z. Zadeh教授发表了关于“模糊学”的第一篇论文,站在“专家系统”大量数据的肩膀上,一种面向实践的理论诞生了。模糊控制舍弃了传统的高精确数学模型建立,将数字量转化为模糊量,进行模糊推理后再转化为可接受的精确量,整个过程模拟了人类决策过程,是一种对“大模型”专家系统的简化,也是以仿生实践模拟为基础的联络主义的开端。

1974年英国工程师E. H. Mamdani成功用模糊理论对蒸汽机与锅炉进行了控制,靠着比传统控制算法更小的数据量,取得了更好的效果,而模糊理论则自此游曳于整个人工智能发展的长河中。

计算智能

同样的,联络主义发展下的大量优化算法如遗传算法(GA)、粒子群优化算法(PSO)等等,也在经历相似的过程。

以在移动机器人平台使用的GMapping算法为例,由基于粒子滤波的建图算法改进而来。粒子群滤波算法在理论上非常适合小范围建图这类随机搜索问题,在小范围状态空间中创建随机样本,用样本均值代替积分运算并约束,依据后验概率迭代样本,样本就是形象的“粒子”。

课程实践下不出所料,更多的粒子可以获得更好的结果,虽然说粒子数量增加会带来粒子散耗问题和陷入局部最优解,但可以通过改进提议分布和选择性重采样来解决,这也是GMapping的主要改进和广受欢迎的原因,但,是在小场景建图时广受欢迎。

事实证明,由于每个粒子都携带一副地图,在构建大地图时所需内存和计算量都会增加,并且没有回环检测,地图可能因此无法闭合。实验下,增加粒子数目可以使地图闭合,但对比消耗的内存与计算量显然不太值得,这也是它只广泛存在于实验室的原因。

机器学习

联络主义的大爆发就是基于神经网络的机器学习、深度学习快速发展的阶段,深度学习下典型的卷积神经网络则持续为大模型思想开疆扩土。AlexNet多达6亿个参数和65万个神经元,令人惊叹,并且AlexNet作者经过实验发现去掉一层卷积层准确度就会减少2%,似乎更加证明了更大更深就是王道,但实际上AlexNet作者花费了大量时间设计将模型切分到多个GPU上训练,GTX580实在难以加载整个网络。虽然在课程实践中GTX1050Ti已经可以轻松训练VGG19这个更大的模型,但这不应该成为限制模型发展的绊马索。

正如模糊控制之于专家系统,GoogleNet另辟蹊径,采用不同的卷积核组合来降低参数量,从而加深网络,但随着深度的增加却出现了梯度消失带来的问题,ResNet则提供了残差网络解决的办法,但是参数量却又与AlexNet达到了一个等级,深度更是多达几百层,紧随其后的DenseNet则加入了“经验”,强化特征传播和特征复用,减少了参数的同时减轻了对内存和计算资源的依赖。

课程学习中了解这段快速而波澜壮阔的神经网络发展历程时真的令人心潮澎湃,在开源的便利下,动手处理肺炎影像分类任务时重走这段历程也受益匪浅,但从理论到落地想来也不可能如此顺利,果然在角膜地形图匹配塑形镜任务中很快碰壁,过少的数据集让就算迁移学习成功率最高的VGGNet都无能为力,在尝试对地形图使用传统机器学习方式预训练等方式建模后,所幸效果差强人意,此时就显现出对实际数据的建模能力和抽象独立出深度学习问题的实践能力的重要性了。


总结

现在的“人工智能”的概念有别于想象,是指用计算机模拟或实现的智能。随着计算机依摩尔定律发展,不断地提升算力,出现更大更复杂的模型是必然且必要的。正如贪婪策略被第一个尝试是因为更好设计改进实验一样,理论中再优秀的模型都不是最好的解决实际问题的办法,实践尝试与AI落地才是。

大模型无关真理,实践才是相关推荐

  1. 钉钉接入大模型后,我才看懂阿里云钉一体战略的真正价值

    来源: @首席数智官(ID:shouxishuzhiguan) hello 大家好,我们是数字化领军者都在看的首席数智官. 关注我,每天给你讲一个商业案例. 今天我们要给你讲的是:钉钉接入大模型后,阿 ...

  2. 大模型的1000+篇文章总结

    大模型的1000+篇文章总结 本文收集和总结了有关大模型的1000+篇文章,由于篇幅有限只能总结近期的内容,想了解更多内容可以访问:http://www.ai2news.com/, 其分享了有关AI的 ...

  3. 大模型,化繁为简归文心

    大模型,已经变成今天AI产业最为关注.最受期待的技术方向,甚至没有之一. 其原因在于,大模型带来了强大的泛化能力以及优异的效果,并且能够实现AI模型研发-部署-应用的标准化提升.这些价值与各界对AI工 ...

  4. 开发者的520!11位业界大咖齐聚,深度解读AI大模型落地“解法”

    明天就是"520"了,在这个特殊的日子里,面向开发者的AI告白盛会--WAVE SUMMIT 2022深度学习开发者峰会即将准点上线! 随着数据井喷.算法进步以及算力的突破,效果好 ...

  5. 百度CTO王海峰:深度学习平台+大模型,夯实产业智能化基座

    2月27日,中国人工智能学会首届智能融合产业论坛在成都顺利举办.本届论坛由中国人工智能学会(CAAI)主办,中国人工智能学会智能融合专委会.百度公司.深度学习技术及应用国家工程研究中心和电子科技大学联 ...

  6. 梭哈大模型,阿里云成了跟风者?

            伴随AI大模型潘多拉魔盒打开,云市场GameChanger已到来.对阿里云这个昔日老大哥而言,从"领先者"变为"跟风者",是否还有机会去重塑行业 ...

  7. 开放报名|顶尖专家联合打造,首个系统化AI大模型前沿技术讲习班

    大模型正在引发人工智能研究与应用范式产生重大变革,越来越多的顶级团队和杰出人才纷纷加入这一技术浪潮.作为AI大模型科研先锋,智源研究院聚集了来自高校院所和创新企业的一大批大模型领域卓越学者与工程师,共 ...

  8. 论文笔记:InternImage—基于可变形卷积的视觉大模型,超越ViT视觉大模型,COCO 新纪录 64.5 mAP!

    目录 文章信息 写在前面 Background & Motivation Method DCN V2 DCN V3 模型架构 Experiment 分类 检测 文章信息 Title:Inter ...

  9. 揭秘阿里新大招:大模型只是前菜

    技术的代际变革往往对商业格局产生深远影响.眼下,随着产业各界对大模型的投入布局加深,一个业界共识逐渐诞生:大模型正在改变云生态,将为云计算行业带来新的奇点. 在过去的一段时间里,市场研究机构IDC在2 ...

最新文章

  1. libgstreamer-1.0.so.0: cannot open shared object file: No such file or directory
  2. [ActionScript 3.0] AS向php发送二进制数据方法之——在URLRequest中构造HTTP协议发送数据...
  3. 美宣布制裁中兴通讯 商务部:坚决反对并将交涉
  4. 飞书上点链接怎么指定跳转浏览器_链接示例表功能还可以这样用??
  5. python一个try块后接一个或多个finally块_Python *与*语句完全等同于一个try – (除了) – finally块?...
  6. 题解: 区间合并(opj 2-4-7620)
  7. [渝粤教育] 西南科技大学 企业生产运作管理 在线考试复习资料2021版
  8. 任意多边形的面积(转)
  9. Spring AOP原理分析(二)--@EnableAspectJAutoProxy功能分析
  10. 《Machine Learning in Action》—— Taoye给你讲讲决策树到底是支什么“鬼”
  11. 前端处理无网络兜底图片展示
  12. 蓝牙渗透测试过程:部分工具使用方法
  13. 热电阻温度计 电阻温度探测器 直接浸入式清洁传感器 精密RTD 美国Burns 胶囊式铂电阻温度检测器 迷你RTD整体热电偶套管 气温传感器 测温传感器 温度传感器 温度传感器生产厂家 温度变送器
  14. 【loj10064】黑暗城堡
  15. python项目--O2O优惠券线下使用情况数据分析
  16. MySql 查询优化
  17. 学计算机音视频教程,抖音短视频VIP教程全套合集
  18. 混合竞价模式下,开发者如何制定价格策略?
  19. python支持复数类型、以下说法错误的是_Python支持复数类型,以下哪个说法是错误的?...
  20. ffmpeg 转码 iPhone 录制的 HDR 视频,命令行示例

热门文章

  1. 完美解决Get和Post请求中文乱码的问题
  2. Verilog实现的SPI通信协议(主机模式)
  3. oledb vc访问mdb数据库_VC++程序中访问ACCESS 数据库使用用户名和密码
  4. Elasticsearch帮派?未曾设想的道路
  5. Project:文本抄袭自动检测分析
  6. HIT CSAPP LAB4
  7. lol提示游戏环境异常重启计算机,msoffice系统工具教程lol游戏环境异常请重启机器该怎么办...
  8. 博弈问题-取石子(D题小牛vs小客)附取石子游戏总结
  9. 自媒体账号被扣分限流了怎么办?继续更新还是注销?3招教你解决
  10. FEELING远翔FM8PB513B点亮LED灯(FM8PB513B)