允中 发自 凹非寺
量子位 | 公众号 QbitAI

大模型领域又来新玩家。

据了解,学而思正在进行自研数学大模型的研发,命名为MathGPT

面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。

目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。

据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责。

今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。

此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。

MathGPT与大语言模型(LLM)的差异

OpenAI在今年三月份发布了大语言模型GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个“文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:

解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配

“这种不足是由LLM模型的自身特点决定的。”

学而思AI团队负责人介绍,LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。

行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。

因此,学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题

  • 第一,题目要解对,现在GPT结果经常出现错误;

  • 第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;

  • 第三,解题要讲的有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。

为了实现这些目标,MathGPT将结合大语言模型计算引擎两者的能力,大语言模型负责理解题目、分步解析,并在合适的步骤自行调用计算引擎,这样能提高题目解答正确率。

基于海量名师解题过程的数据进行模型训练,模型的解题步骤可以更加清晰。

再引入优秀老师的教学理念和方法,模型在解题趣味性上也能进一步提高。

据透露,MathGPT将先从中小学数学做起,逐步覆盖全年龄学段和解题种类。

做MathGPT,学而思凭什么

学而思作为获国家科技部批准的“智慧教育国家新一代人工智能开放创新平台”建设单位,也是教育行业首批唯一一家人工智能“国家队”成员,在人工智能领域有着多年的深入研究。

早在2017年,学而思便成立了AI lab 人工智能实验室

据公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思AI lab获得各类顶级学术会议比赛冠军16项,亚军6项;

发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;

申请专利220余项,授权专利150余项,软件著作权60余项。

学而思AI lab在各类顶级学术会议比赛获奖情况

“以数学起家”的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。

另外,学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

所以,学而思选择在MathGPT方向发力也顺理成章。

今年2月,学而思学习机上线AI讲题机器人小π。

据了解,小π研发已有数年积累,研发方向主要为数学等领域的AI智能讲题能力,核心优势在于数理逻辑和运算。

在实测中,当学而思学习机用户配套的AR镜识别到一道手写或者印刷的数学计算题时,小π机器人会对题目进行智能AI拆解分析,同时生成逻辑流畅、表达清晰的语言,将题目的解题方法讲解出来。

该功能已覆盖的题目包括分数、小数等复杂计算,甚至一些“凑数、组合”的巧妙算法,已十分接近真人老师的解题效果。

同一道数学题目在ChatGPT(上)和小π(下)的解答对比

小π相关技术于2020年启动研发,以学而思超3亿的专业题库数据作为基础,经过了3年的数据训练和打磨迭代。

另据了解,学而思学习机近期将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。

MathGPT的挑战和技术难题

如何利用大语言模型服务各行各业是当下社会的焦点问题。

大模型的出现是对生产力和生产关系的改变,各行各业都会受到影响,并会在大模型的助力下完成转型升级。

教育行业和大模型有着天然的契合点。教育也是通过交流,把知识和信息传递给学生,大模型会让教育行业的数字化、智能化速度更快。

比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产品体验。

但也有一些领域如数学、医学等,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。

以数学领域为例,目前市场上有几个主要流派。

比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。

走AGI路线的公司则尝试让通用LLM“更懂数学”,比如GPT4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学问题进行调优。

学而思选择了另一条少有人走的路,不基于现有LLM做微调和接口调用、不做通用LLM,而是自研基于专业领域的“数学大模型”MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。

学而思表示,乔布斯对电脑的定义是“思维的自行车”,MathGPT面向全球的数学爱好者,希望能成为学习数学、思考数学的“自行车”,帮助人们更好的解决学习数学、思考数学的问题。

长远看来,数学思维代表着理性逻辑,是“思维的体操”,是一种基础能力,能够与很多行业产生关联。

未来,也许每个人都是程序员,用自然语言就可以编程,创新想法,与人协作,创造新事物,但是用自然语言编程的好坏很大程度取决于是否经过数学思维的训练。我们希望通过MathGPT,帮助每个人更好地建立理性逻辑,从而终身成长,推动社会进步。

在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。

学而思自研独立的MathGPT大模型是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。

随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。

MathGPT来了!专攻数学大模型,解题讲题两手抓相关推荐

  1. 大模型的1000+篇文章总结

    大模型的1000+篇文章总结 本文收集和总结了有关大模型的1000+篇文章,由于篇幅有限只能总结近期的内容,想了解更多内容可以访问:http://www.ai2news.com/, 其分享了有关AI的 ...

  2. 科技云报道:国内AI大模型鏖战,上演科技罗生门

    科技云报道原创. ChatGPT的狂热从年初持续至今,这份狂热不仅仅来源于用户层,从业者.投资人以及企业可以说有过之无不及. 于是,这些投资人.从业者以及企业将狂热转化,宣布入局大模型赛道并推出相关产 ...

  3. 学而思研发面向全球数学爱好者大模型MathGPT

      新智元报道   编辑:好困 [新智元导读]近日,学而思官宣称,正在自研的数学大模型「MathGPT」,目前已取得阶段性成果. 进NLP群->加入NLP交流群 近日,在各家大厂打得如火如荼的「 ...

  4. 科技云报道:垂直大模型竞争,能突破数据“卡点”吗?

    科技云报道原创. AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情. 随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别.应用场景.商业模式等方面差异已逐步显现. 企业涌 ...

  5. 浪潮“源”AI大模型如何求解数学应用题

    编辑 | 宋慧 供稿 | 浪潮 "源1.0"大模型是浪潮信息发布的中文巨量模型,参数量高达2457亿,在中文语言能力理解和生成评测基准CUGE总榜中取得榜首,并获得语言理解(篇章级 ...

  6. 数学建模当中常用的十大模型及各对应算法

    数学建模当中常用的十大模型及各对应算法 图文展示:

  7. 2021年MathorCup高校数学建模挑战赛—大数据竞赛A题二手车估价问题解题思路

    MathorCup高校数学建模挑战赛-大数据竞赛 A题 二手车估价问题 原题再现:   随着我国的机动车数量不断增长,人均保有量也随之增加,机动车以"二手车"形式在流通环节,包括二 ...

  8. 初中数学9大经典解题法!

    源 / 超级数学建模 数学是一门严谨的学科,除开复杂的数学公式,最核心的是数学的解题思路,总结了初中数学9大经典解题法,希望能帮助到努力奋斗的莘莘学子!   配方法     因式分解法      换元 ...

  9. 2020年数学建模国赛A题题目和解题思路

    2020年数学建模国赛A题: 在集成电路板等电子产品生产中,需要将安装有各种电子元件的印刷电路板放置在回焊炉中,通过加热,将电子元件自动焊接到电路板上.在这个生产过程中,让回焊炉的各部分保持工艺要求的 ...

最新文章

  1. Flutter开发之诊断布局调试工具:inspector(12)
  2. tomca7.0 mysql配置连接池_tomcat7.0+mysql连接池配置
  3. check_mk自定义监控实践之powershell
  4. 剑指offer-有序二维数组中的查找
  5. WebService它CXF注释错误(两)
  6. win10系统预览体验计划错误代码0x800bfa19怎么办
  7. 使用react开发管理后台
  8. 优秀!结构最清晰的Yolov3 head和loss实现完全解析
  9. mybatis SqlMapConfig.xml
  10. Servlet打印HTML页面乱码问题
  11. linux创建空镜像,Docker创建base镜像
  12. pdf 一键生成书签目录
  13. spring boot jpa SQL语句注意事项
  14. 接口接收数据_基于原语的千兆以太网RGMII接口设计
  15. java计费系统_Java网吧计费系统
  16. 高中数学解析几何解题方法,2019高考生没有掌握方法!
  17. 计算机专业学生的必备文具,初一新生必备文具100件 学霸用的文具清单
  18. python立方根求解_计算python中的立方根
  19. 怎么识别自己的眼型?眼型图片参照
  20. Spring官方文档翻译(7章)

热门文章

  1. linux与固定ip校时命令,linux通过ntpdate网络校时
  2. java钠秒表示_智慧职教云课堂APPJava Web程序设计(石家庄科技工程职业学院)答案...
  3. mobileemumaster文件夹怎么删除_origin平台加载不出游戏怎么解决?只需删除这两个文件夹...
  4. 饥荒机器人怎么解锁_饥荒怎么解锁全人物
  5. 计算机怎样在表格中画正字,excel表格里怎样做艺术字-Excel艺术字怎么在文字下面...
  6. vue @touchmove 会导致页面跟着滚动
  7. visio第三次作业
  8. android通过usb调试安装apk后 卸载 无法安装release版 魅族note1 note3
  9. aapt安装 ubuntu_Android快速分析apk工具aapt的使用教程
  10. linux wc 命令详解,linux wc命令详解