新智元报道  

编辑:好困

【新智元导读】近日,学而思官宣称,正在自研的数学大模型「MathGPT」,目前已取得阶段性成果。

进NLP群—>加入NLP交流群

近日,在各家大厂打得如火如荼的「ChatGPT大战」中,学而思也加入其中。

不过,学而思另辟蹊径选择的是自研数学大模型「MathGPT」,以数学领域的解题和讲题算法为核心,并且已经取得了阶段性成果。

对此学而思表示,基于该自研大模型的产品级应用预计会在年内推出,将面向全球数学爱好者和科研机构。

作为公司的核心项目,学而思早在今年春节之前就启动了相应的团队建设、数据、算力准备和技术研发,并直接交由CTO田密负责。

此外,位于美国硅谷的团队建设目前也已经启动,计划成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。

MathGPT与大语言模型(LLM)的差异

今年三月,OpenAI正式发布大语言模型GPT-4。随后,国内百度、阿里也推出了各自的大模型产品。

然而,通用语言模型更像一个「文科生」,在语言翻译、摘要、理解和生成等任务上有出色表现,但在数学问题的解决、讲解、问答和推荐方面则存在明显不足——

「解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。」

对此,学而思AI团队负责人表示,这种不足是由LLM模型的自身特点决定的。LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。

行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。

因此,学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题:

第一,题目要解对,现在GPT结果经常出现错误;

第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;

第三,解题要讲的有趣、个性化,现在GPT的解释过于「学术」和机械,对孩子的学习体验很不友好。

做MathGPT,学而思凭什么

学而思作为获国家科技部批准的「智慧教育国家新一代人工智能开放创新平台」建设单位,也是教育行业唯一一家人工智能「国家队」成员,在人工智能领域有着多年的深入研究,早在2017年,学而思便成立了AI lab人工智能实验室。

据公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思AI lab获得各类顶级学术会议比赛冠军16项,亚军6项;发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;申请专利220余项,授权专利150余项,软件著作权60余项。

学而思AI lab在各类顶级学术会议比赛获奖情况

「以数学起家」的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。

另外,学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

所以,学而思选择在MathGPT方向发力也顺理成章。

另据了解,学而思学习机近期将会上线一款「AI助手」,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。

MathGPT的挑战和技术难题

如何利用大语言模型服务各行各业是当下社会的焦点问题。

比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产品体验。

但也有一些领域如数学、医学等,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。

以数学领域为例,目前市场上有几个主要流派。

比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。

走AGI路线的公司则尝试让通用LLM「更懂数学」,比如GPT-4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学问题进行调优。

学而思选择了另一条少有人走的路,不基于现有LLM做微调和接口调用、不做通用LLM,而是自研基于专业领域的「数学大模型」MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。

在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。

学而思自研独立的MathGPT大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。

随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。

进NLP群—>加入NLP交流群

学而思研发面向全球数学爱好者大模型MathGPT相关推荐

  1. 单卡30秒预测未来10天全球天气,大模型“风乌”效果超DeepMind,来自上海人工智能实验室...

    允中 发自 凹非寺 量子位 | 公众号 QbitAI 预测未来10天全球天气,仅需30秒. 这一成果来自全球中期天气预报大模型"风乌",这也是全球气象有效预报时间首次突破10天,并 ...

  2. 西北工业大学与华为联合研发的首个面向飞行器的流体力学大模型“秦岭·翱翔”预发布

    近日,第四届全国智能流体力学研讨会暨第二届智能流体力学产业联合体大会,在杭州市西湖大学云谷校区召开,大会预发布了产业联合体阶段性重大研究成果:基于昇腾AI的面向飞行器的首个流体力学大模型--" ...

  3. 为世界第一大癌症高效研发首创新药,AI大模型助力药物研发叩开未来之门

    近日,三位高中生引爆了医药圈,他们使用人工智能(AI)引擎进行靶点发现,确定了多形性胶质母细胞瘤(GBM)的新治疗靶点,多形性胶质母细胞瘤(GBM)是最具侵袭性和最常见的恶性脑肿瘤类型,占所有原发性脑 ...

  4. 大模型的1000+篇文章总结

    大模型的1000+篇文章总结 本文收集和总结了有关大模型的1000+篇文章,由于篇幅有限只能总结近期的内容,想了解更多内容可以访问:http://www.ai2news.com/, 其分享了有关AI的 ...

  5. MathGPT来了!专攻数学大模型,解题讲题两手抓

    允中 发自 凹非寺 量子位 | 公众号 QbitAI 大模型领域又来新玩家. 据了解,学而思正在进行自研数学大模型的研发,命名为MathGPT. 面向全球数学爱好者和科研机构,以数学领域的解题和讲题算 ...

  6. 科技云报道:垂直大模型竞争,能突破数据“卡点”吗?

    科技云报道原创. AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情. 随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别.应用场景.商业模式等方面差异已逐步显现. 企业涌 ...

  7. 百度与吉利共同研制汽车行业大模型,助力中国汽车产业“智领”全球

    在汽车行业电动化.智能化.网联化的变革大潮中,智能的驾驶体验和销售服务已经成为消费者购车的重要考虑因素.将先进的人工智能.大模型等技术与车企积累的丰富知识与经验结合,提升售前营销.售后服务和用户体验等 ...

  8. 大模型落地实践系列四、大模型研发应用的节奏?

    大模型落地实践系列四.大模型研发应用的节奏? 近年来,随着计算机硬件性能的提高和机器学习算法的不断优化,大模型已经成为了当今人工智能领域最热门的话题之一.在实际应用中,大模型可以帮助我们更好地完成诸如 ...

  9. 大模型为什么是深度学习的未来?

    人工智能 | 数据分析 | Chat GPT 深度学习 | 数据挖掘 | 高性能计算 当今社会是科技的社会,是算力快速发展的时代.随着数据中心.东数西算.高性能计算.数据分析.数据挖掘的快速发展,大模 ...

最新文章

  1. phpstrom配置svn/git提交
  2. ffmpeg参数说明
  3. 【数据结构与算法】之判断一个整数是否是 4 的幂次方的高逼格算法
  4. java类初始化顺序
  5. Duilib编辑框Edit输入完自动跳到下一个编辑框
  6. dup和dup2的使用方法
  7. shopxo首页的新闻头条栏:如何隐藏或关闭?
  8. 入门机器学习(十五)--无监督学习(K均值)
  9. 微软宣布已获批:重新向华为出口软件!
  10. arcgis影像怎么去黑边_ArcGIS镶嵌数据集某些比例尺下显示黑白格解决方案
  11. ZooKeeper官方文档学习笔记01-zookeeper概述
  12. 减少 JavaScript 代码量的原生技术
  13. Git分布式版本控制
  14. 论文笔记——TransPose
  15. 常用的Git代码托管平台
  16. FastDfs分布式文件存储系统
  17. C语言实现每次找出最大最小值排序
  18. 教子要过计算机考试吗,[教子有方]高考家长最容易陷入的十大志愿填报误区
  19. JAVA范例 十三)多线程编程(3)
  20. 基于Qt的海康威视网络摄像头SDK的二次开发

热门文章

  1. 云架构及设计-阿里云
  2. 为什么你有10年经验,但成不了专家?(转载)
  3. MVC+API 实现tinymce富文本编辑器上传图片、上传视频
  4. iOS之CALayer与核心动画(一)
  5. 用python画出四个不同颜色的同心圆
  6. 【BLE】通知和指示的区别
  7. 用友nc65 uap开发参照多选三种显示情况总结
  8. HEVC NAL层基础知识
  9. 家用路由器的安装和摆放
  10. Topomel Box 2.0 已停止服务