文|多鲸资本 翟良
1956年8月,在美国韩诺斯小镇达特茅斯学院中,约翰·麦卡锡等 5 名科学家聚在一起,讨论着一个不食人间烟火的主题:用机器人来模仿人类学习以及其他方面的智能。
1956年也就成为了人工智能元年。
当人工智能走过了 67 年的发展历程,一场以「 大规模 GPT 」为产业赛道的「 大战 」一触即发。2023 年 4 月是中国大模型「 狂飙 」的关键月,前有华为、商汤的大模型发布,后有科大讯飞星火认知大模型在众行业的广泛链接......一时间,整个产业圈争先恐后,资本市场风起云涌。
5 月初,大型教育企业先后竞相推出教育相关大模型产品,希望借由 AI 大模型技术,革新传统的教育模式。其中包括,学而思面向全球数学爱好者和科研机构进行的数学大模型 MathGPT 的研发;科大讯飞公布其自研的星火认知大模型等。阵势如此之大,大模型会将智能化学习领域应用推向新纪元吗?
01 大模型“狂飙”时代到来
2022 年末,Open AI 的「 ChatGPT 」宣告诞生,作为人工智能研发领域的「 新物种 」,引起国内外人工智能产业界的轩然大波,随后不到四个月的时间,一场「 大模型之战 」席卷而来。据不完全统计,目前国内已有 30 多个研发机构和企业纷纷推出自己的大模型产品,这自然少不了百度、阿里云等大公司参与其中。
中国社科院王宗琦教授指出,以大规模生成式语言模型为发展方向的研发与应用,可以在某一特定领域产生效率,但在需要强大逻辑推理能力的数学、医学等领域会有明显欠缺与不足,不论人工智能发展到何种程度,用在学科学习上,不仅需要大模型语言处理的能力,更需要其在数学学习中所具备的精细、准确的逻辑推理能力。
我们不难发现,国内各大企业发布的大模型产品,大部分的开展方向多集中在通用语言模型上,有报道称这种模型更像是一个「文科生 」,在语言翻译、摘要、理解和生成等任务上有出色的表现,但在数学问题的解决、讲解、问答和推荐方面则存在明显不足。
大语言模型在文学创作、商业文案写作、中文理解等使用场景能力突出,甚至在意图理解力以及回答准确性、流畅性上都接近人类水平,但想在数学领域具备批判性思考的能力和使用科学方法去解决问题的能力,仍需研发新的大模型。
据悉,学而思正在进行自研数学大模型 MathGPT 的研发,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,在复杂逻辑条件下,完成数学学习多步骤推理任务,该项研发目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。因此,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。
由于大语言模型的推理与计算能力有限,因此 MathGPT 需要结合大语言模型和计算引擎两者的能力,大语言模型需要理解题目、分步解析,并在合适的步骤自行调用计算引擎。据了解,数学大模型 MathGPT 的研发需要极其巨大的计算资源和大量的数据,以及更加复杂的算法和技术,学而思之所以用自己在数学和 AI 上的多年积累,面向全球范围内的数学爱好者和科研机构,进行数学大模型的研发,最终是希望通过 MathGPT 攻克数学学习和科学研究上存在的「 解题出现错误、解题步骤不稳定、解题方法机械化 」等诸多的问题。
著名教育家、课程专家李静纯先生认为,过去几年我国数学教学一直没放弃对数学建模的探索与实践,但仍然停留在数学建模思想的探索范畴,实际应用并未取得突破性进展。建立数学大模型的过程是把错综复杂的实际问题转化为合理的数学结构的问题,数学大模型是一种数学的思考方法。数学的特点不仅在于概念的抽象性、逻辑的严密性、结论的明确性和体系的完整性,而在于它应用的广泛性。特别是现在,各种实际应用的题目越来越多,这就需要建立数学大模型。
专家认为,数学大模型强调如何把实际问题转化为数学问题,学生需要应用数学思维、数学逻辑及相关知识对实际问题进行研究并经过计算,进而解决这些问题,得出反映实际问题的最佳数学模型及模型最优解。因此,在数学学习中融入数学大模型思想,鼓励学生参与数学大模型的理论与实践相结合,不但可以使学生学以致用,做到理论联系实际,而且还会使他们感受到数学的生机与活力,激发求知的兴趣和探索的欲望,数学修养自然而然得以培养及提高。
02 会解数学题的GPT如何诞生?
「 ChatGPT 」横空出世,意味着人工智能迎来前所未有的技术革命,但研发大模型产品并非易事,又有多少企业具备数据、算力、人力、财力的条件和优势?大模型产品能否赢得市场,不仅要拥有丰富的行业知识和数据,而且最关键的还要靠全面的开源技术体系作支撑;所以,有人说「 大模型 」是属于「 大公司 」的「 盛宴 」。
对于国内掀起的「 大模型 」产业风暴,复旦大学教授、上海市数据科学重点实验室主任肖仰华指出,大模型的诞生宣告了整个人工智能进入全新的重工业时代,人类历史上技术革命历经数次突破和发展,已经从相对低级的「 手工作坊 」模式最终形成了成熟的重工业发展模式,而今天的大模型产业发展有三个鲜明的特征:大模型、大算力和大数据。
据了解,当前我国大模型产业发展在数据方面是有优势的,在算力方面是有所缺乏的,是短期之内难以跟上或者超越的。有专家认为,随着大模型参数量的持续增长,大模型对于算力的需求越来越迫切。算力已经成为大模型玩家的准入门槛,已经成为制约大模型发展的主要瓶颈,这是需要付出巨大代价进行摸索的。
大模型产业的发展与竞争,归根结底是算力的竞争,绝大多数大模型玩家都缺乏算力,靠买算力支撑大模型产品的研发。而如今,从某种程度上来看,学而思已经完全实现了算力自主自控,为学而思启动大模型 MathGPT 的研发,提供开源算法体系的支持。
学而思数学大模型 MathGPT 究竟会对全球数学爱好者和科研机构带来怎样的影响?有报道称,数学大模型 MathGPT,可以用来预测、分类、聚类、优化等各种具有挑战性的各种任务,可以运用深度学习算法来解决数学领域中各种复杂的问题,提高数学学习的高效性和准确性。当今数学在各个领域蓬勃发展,应用广泛。学而思的数学大模型 MathGPT 在人工智能新的发展阶段,或许会承担更大的使命。
03 大模型产业所引发的人工智能变革,才刚刚开始
大模型产业研究与发展,对社会各行业的发展产生了重大的影响,大模型的 AI 技术广泛地链接到众行业(教育、办公、汽车、数字员工等),下沉到更多的应用场景,众行业因此迎来了全新的变革。有业界人士认为,国内大模型的发展,尽管呈现一片「 热闹 」景象,但也存在令人担忧的地方。国内人工智能产业的企业与研发机构要清醒地认识到,大模型应用模式也仍然面临着若干问题,比如仍存在技术路线同质化严重、数据生态不完善、算力掣肘、模型创新有限等问题。仍需要企业与研发机构从数据共享、算力协作、开源生态、人才培养、评测体系、成本控制、应用探索与技术研究等各方面推动大模型发展。
据了解,在数学领域,目前市场上存在几个主要流派。比如 Google 收购的 Photomath、微软数学、Mathway、专注数学计算的 WolframAlpha 等产品,主要利用通用 LLM (大型语言模型)的 AI 技术加上数据库的方式解决数学问题。尽管也产生了很大的变化,但本质上只是模型接受了更多数据的训练 —— GPT-4 仍然不能保证计算结果的准确或给出清晰易懂的推理过程。
也就是说,尽管在数学领域存在着几大大模型流派,但在实际应用场景中需要的复杂的决策能力、研判能力、综合任务的拆解能力、不确定场景的逻辑推理能力仍十分的欠缺;所以从强大的语言处理能力到复杂的逻辑推理能力仍需要漫长的摸索的时间。
在大型语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。学而思独立自研的 MathGPT 大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。
评论