全球新动态:MathGPT来了!专攻数学大模型,解题讲题两手抓 - 政策动态 -

当前位置:首页  >  政策动态  > 正文

全球新动态:MathGPT来了!专攻数学大模型,解题讲题两手抓

全球新动态:MathGPT来了!专攻数学大模型,解题讲题两手抓
2023-05-09 08:56:49 来源:创业邦

大模型领域又来新玩家。

编者按:本文来自微信公众号量子位(ID:QbitAI),创业邦经授权转载。


(资料图片仅供参考)

大模型领域又来新玩家。

据了解,学而思正在进行自研数学大模型的研发,命名为MathGPT

面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。

目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。

据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责。

今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。

此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。

MathGPT与大语言模型(LLM)的差异

OpenAI在今年三月份发布了大语言模型GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个“文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:

解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配

“这种不足是由LLM模型的自身特点决定的。”

学而思AI团队负责人介绍,LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。

行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。

因此,学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题

第一,题目要解对,现在GPT结果经常出现错误;

第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;

第三,解题要讲的有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。

为了实现这些目标,MathGPT将结合大语言模型计算引擎两者的能力,大语言模型负责理解题目、分步解析,并在合适的步骤自行调用计算引擎,这样能提高题目解答正确率。

基于海量名师解题过程的数据进行模型训练,模型的解题步骤可以更加清晰。

再引入优秀老师的教学理念和方法,模型在解题趣味性上也能进一步提高。

据透露,MathGPT将先从中小学数学做起,逐步覆盖全年龄学段和解题种类。

做MathGPT,学而思凭什么

学而思作为获国家科技部批准的“智慧教育国家新一代人工智能开放创新平台”建设单位,也是教育行业首批唯一一家人工智能“国家队”成员,在人工智能领域有着多年的深入研究。

早在2017年,学而思便成立了AI lab 人工智能实验室

据公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思AI lab获得各类顶级学术会议比赛冠军16项,亚军6项;

发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;

申请专利220余项,授权专利150余项,软件著作权60余项。

“以数学起家”的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。

另外,学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

所以,学而思选择在MathGPT方向发力也顺理成章。

今年2月,学而思学习机上线AI讲题机器人小π。

据了解,小π研发已有数年积累,研发方向主要为数学等领域的AI智能讲题能力,核心优势在于数理逻辑和运算。

在实测中,当学而思学习机用户配套的AR镜识别到一道手写或者印刷的数学计算题时,小π机器人会对题目进行智能AI拆解分析,同时生成逻辑流畅、表达清晰的语言,将题目的解题方法讲解出来。

该功能已覆盖的题目包括分数、小数等复杂计算,甚至一些“凑数、组合”的巧妙算法,已十分接近真人老师的解题效果。

同一道数学题目在ChatGPT(上)和小π(下)的解答对比

小π相关技术于2020年启动研发,以学而思超3亿的专业题库数据作为基础,经过了3年的数据训练和打磨迭代。

另据了解,学而思学习机近期将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。

MathGPT的挑战和技术难题

如何利用大语言模型服务各行各业是当下社会的焦点问题。

大模型的出现是对生产力和生产关系的改变,各行各业都会受到影响,并会在大模型的助力下完成转型升级。

教育行业和大模型有着天然的契合点。教育也是通过交流,把知识和信息传递给学生,大模型会让教育行业的数字化、智能化速度更快。

比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产品体验。

但也有一些领域如数学、医学等,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。

以数学领域为例,目前市场上有几个主要流派。

比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。

走AGI路线的公司则尝试让通用LLM“更懂数学”,比如GPT4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学问题进行调优。

学而思选择了另一条少有人走的路,不基于现有LLM做微调和接口调用、不做通用LLM,而是自研基于专业领域的“数学大模型”MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。

学而思表示,乔布斯对电脑的定义是“思维的自行车”,MathGPT面向全球的数学爱好者,希望能成为学习数学、思考数学的“自行车”,帮助人们更好的解决学习数学、思考数学的问题。

长远看来,数学思维代表着理性逻辑,是“思维的体操”,是一种基础能力,能够与很多行业产生关联。

未来,也许每个人都是程序员,用自然语言就可以编程,创新想法,与人协作,创造新事物,但是用自然语言编程的好坏很大程度取决于是否经过数学思维的训练。我们希望通过MathGPT,帮助每个人更好地建立理性逻辑,从而终身成长,推动社会进步。

在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。

学而思自研独立的MathGPT大模型是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。

随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

标签:

(责任编辑:news01)
世界速递!历史首次!2022年中国IT安全硬件市场规模同比下降3.3%

世界速递!历史首次!2022年中国IT安全硬件市场规模同比下降3.3%

IDC《2022年第四季度中国IT安全硬件市场跟踪报告》显示,2022年第四季度中国IT安全硬件市场厂商整体收入约
05-06 18:05:13
融资丨「蘑菇车联」完成5.8亿元C2轮融资_每日热点

融资丨「蘑菇车联」完成5.8亿元C2轮融资_每日热点

刷新自动驾驶赛道今年最大融资额创业邦获悉,蘑菇车联已完成5 8亿元C2轮融资,投资方包括成都科创投、珠海
05-06 17:29:35
环球观察:常山北明:公司正与市土地储备中心及相关部门积极沟通协调,力争土地收购补偿金早日到位

环球观察:常山北明:公司正与市土地储备中心及相关部门积极沟通协调,力争土地收购补偿金早日到位

常山北明(000158)05月06日在投资者关系平台上答复了投资者关心的问题。
05-06 17:07:18
世界热资讯!今日时讯:布克和艾顿冲上美国热搜第二三位 记者在我们进更衣室前艾顿已经走了蒙蒂则高度称赞了兰代尔

世界热资讯!今日时讯:布克和艾顿冲上美国热搜第二三位 记者在我们进更衣室前艾顿已经走了蒙蒂则高度称赞了兰代尔

小伙伴们好,带大家回顾下布克和艾顿冲上美国热搜第二三位记者在我们进更衣室前艾顿已经走了蒙蒂则高度称赞
05-06 17:00:57
观热点:无水三氯化铁商品报价动态(2023-05-06)

观热点:无水三氯化铁商品报价动态(2023-05-06)

交易商品牌 产地交货地最新报价无水三氯化铁 96%以上常州市格瑞环保科技有限公司江苏常州江苏省 常州市288
05-06 16:22:26
天天微资讯!打造美好生活全球驿站 中国石化亮相湖南首届RCEP经贸博览会

天天微资讯!打造美好生活全球驿站 中国石化亮相湖南首届RCEP经贸博览会

华声在线5月6日讯(通讯员向琪向婷记者胡杏子)5月4日至7日,以“新合作、新机遇、新未来”为主题的首届湖...
05-06 15:35:51
河南积极推进适箱货物“散改集”运输_全球简讯

河南积极推进适箱货物“散改集”运输_全球简讯

近日,河南省交通运输厅印发《河南省交通运输行业绿色低碳转型战略2023年工作任务分解方案》(简称《方案》
05-06 15:16:08
环球微速讯:2023东莞高中自主招生有什么学校?

环球微速讯:2023东莞高中自主招生有什么学校?

目前已知东华高级中学、东华松山湖高级中学、光明中学、翰林实验学校、光正实验学校、弘林高级中学、丰泰外
05-06 14:31:21
我国首个国产化船舶交通管理系统在山东潍坊试运行

我国首个国产化船舶交通管理系统在山东潍坊试运行

交通运输部消息,今天(5月6日),我国首个国产化船舶交通管理系统在山东潍坊试运行。过去我国的船舶交通管理
05-06 13:49:01
(2022-2023年个人社保缴费标准表)成都金牛区社会保险缴费基数是多少?

(2022-2023年个人社保缴费标准表)成都金牛区社会保险缴费基数是多少?

成都金牛区社保缴纳比例表,2022-2023年成都金牛区社会保险缴费基数是多少?2023年成都金牛区社保缴费标准基
05-06 13:18:19
今日看点:东信和平:目前拥有4家海外子公司和3个海外生产基地

今日看点:东信和平:目前拥有4家海外子公司和3个海外生产基地

2023年5月6日,东信和平在互动易平台回复称,公司目前拥有4家海外子公司和3个海外生产基地,业务覆盖广泛向
05-06 12:42:53
当前播报:女用自动炮机真人演示红杏_验孕棒怎么用真人演示图

当前播报:女用自动炮机真人演示红杏_验孕棒怎么用真人演示图

1、我们买了验孕棒之后,打开彩盒,然后一般会有一个铝箔袋,里面装着验孕棒。撕的时候要顺着开口撕,不要
05-06 12:03:55
大连中山发展投资4510万元竞得大连天津街南侧商用地_当前时讯

大连中山发展投资4510万元竞得大连天津街南侧商用地_当前时讯

观点网讯:5月6日,大连市自然资源局公布消息称,大连中山发展投资有限公司以底价4510 2365万元竞得大城(20
05-06 11:31:26
adidas大中华区第一季度收入大跌近12%

adidas大中华区第一季度收入大跌近12%

2023年5月5日,德国运动品牌阿迪达斯(adidas)公布了其2023年第一季度业绩报告。财报显示,在截至3月31日
05-06 11:07:07
男演员这样吃狂瘦了20斤!有没有更安全的减肥饮食法?-环球新动态

男演员这样吃狂瘦了20斤!有没有更安全的减肥饮食法?-环球新动态

“前5天8斤,后面一直掉,目前掉20斤了。”5月3日,演员伊能静在微博上分享了同为演员的丈夫秦昊的瘦身...
05-06 10:47:59
遂川县气象台发布雷电黄色预警信号【III级/较重】【2023-05-06】

遂川县气象台发布雷电黄色预警信号【III级/较重】【2023-05-06】

遂川县气象台2023年05月06日09时08分发布雷电黄色预警信号:预计未来6小时内,碧洲镇、草林镇、大汾镇、大
05-06 10:03:55
明天小米13 Ultra限量版6499元发布 天天热消息

明天小米13 Ultra限量版6499元发布 天天热消息

快科技5月5日消息,前不久小米13Ultra发布时,官方宣布张颂文成为代言人,称其为“小米影像探索家”。近...
05-06 09:36:41
每日观察!美国4月失业率降至3.4%

每日观察!美国4月失业率降至3.4%

证券时报网讯,据新华社消息,美国劳工部5日公布的数据显示,今年4月美国失业率环比下降0 1个百分点至3 4%
05-06 09:11:50
每日视讯:《浪姐4》刚开播,成员间就“暗流涌动”,迎来史上最聒噪三人组

每日视讯:《浪姐4》刚开播,成员间就“暗流涌动”,迎来史上最聒噪三人组

5月5日,《乘风破浪的姐姐》第四季终于开播了,首期刚刚播出,节目就占据了几乎整个热搜榜,一跃成为当下最
05-06 08:48:57
总股本由9亿股增长至455.85亿股    包钢股份成为我国西部最大钢铁上市公司

总股本由9亿股增长至455.85亿股 包钢股份成为我国西部最大钢铁上市公司

本网讯(内蒙古日报社融媒体记者蔡冬梅)记者从5月5日举办的2023年包钢股份投资者接待日活动上了解到,作为包
05-06 07:54:12
关于感恩父母的诗句短一点(关于感恩父母的诗)_全球热闻

关于感恩父母的诗句短一点(关于感恩父母的诗)_全球热闻

1、默默的行动肩负着默默的伟大默默的沧桑默默的爬上黑发无怨的付出儿女如何报答静静的爱在静静中融化思绪
05-06 07:22:52
【世界新要闻】百炼成钢押韵下一句诗句(百炼成钢押韵下一句)

【世界新要闻】百炼成钢押韵下一句诗句(百炼成钢押韵下一句)

1、百炼成钢释义铁砂经过多次冶炼成为纯钢。2、比喻人经过长期、艰苦的锻炼、考验,才能成为坚强、有用的人
05-06 06:31:58
世界速读:张嘉倪拥抱鼓励吴倩是什么情况 张嘉倪拥抱鼓励吴倩具体来龙去脉是怎么样

世界速读:张嘉倪拥抱鼓励吴倩是什么情况 张嘉倪拥抱鼓励吴倩具体来龙去脉是怎么样

大家好,小太来为大家解答以上问题。张嘉倪拥抱鼓励吴倩很多人还不知道,现在让我们一起来看看吧!1、大家
05-06 05:37:56
睚眦欲裂的读音_睚眦欲裂 快看点

睚眦欲裂的读音_睚眦欲裂 快看点

1、睚眦的读音:【yázì】。2、2、睚眦欲裂的意思:很愤怒,瞪眼睛时,眼眶都要开裂了似的。3、与怒目圆睁
05-06 04:05:46
环球聚焦:股票行情快报:康斯特(300445)5月5日主力资金净卖出527.95万元

环球聚焦:股票行情快报:康斯特(300445)5月5日主力资金净卖出527.95万元

截至2023年5月5日收盘,康斯特(300445)报收于14 13元,上涨0 0%,换手率1 68%,成交量2 33万手,成交额3286 0万元。
05-06 01:36:47
七星关区气象台发布雷电黄色预警信号【Ⅲ/较重】【2023-05-05】|报道

七星关区气象台发布雷电黄色预警信号【Ⅲ/较重】【2023-05-05】|报道

七星关区气象台2023年05月05日22时00分发布雷电黄色预警信号:预计未来3小时我区大屯、普宜、田坎、龙场营
05-05 23:25:44
外交部:美方正在把台湾变成“火药桶” 遭殃的是广大台湾同胞

外交部:美方正在把台湾变成“火药桶” 遭殃的是广大台湾同胞

5月5日,外交部发言人毛宁主持例行记者会。有记者问,3日,美防务产业代表团出席“美台国防工业合作论坛...
05-05 22:11:14
全球关注:携程司机端怎么注册 怎样注册携程司机端

全球关注:携程司机端怎么注册 怎样注册携程司机端

携程是一款旅行预约酒店车票的软件。许多人想要找一份兼职工作,携程司机是一个很好的选择。但是许多人不清
05-05 21:22:54
麦趣尔收关注函,要求说明公司章程对“恶意收购”界定的法律依据,将相关情形界定为恶意收购是否合规-环球短讯

麦趣尔收关注函,要求说明公司章程对“恶意收购”界定的法律依据,将相关情形界定为恶意收购是否合规-环球短讯

麦趣尔1月31日公告,公司收到深交所关注函,深交所对公司拟修订《公司章程》及《关于公司控股股东所持部分
05-05 20:42:01
天天播报:第16届主板发审委前委员栗皓被刑拘,已进入审判流程,曾与天健所前副总裁陈翔合作放行兰石重装IPO

天天播报:第16届主板发审委前委员栗皓被刑拘,已进入审判流程,曾与天健所前副总裁陈翔合作放行兰石重装IPO

来源:红刊财经2021年以来,多位曾担任第16届主板发审委委员的券商或证券服务机构人士接连被查,继操舰、朱
05-05 19:59:06

为您推荐

精彩推送