可“解难题”也可“出好题”!中国科学家取得通用人工智能逻辑推理新突破

中国科研团队近日自主研发出的一款“通矩模型”,该成果26日晚在线发表于国际权威学术期刊《自然-机器智能》。相关专家表示,这是国际首个同时具备自主出题和自动解题双重能力的通用人工智能系统,标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上达到国际领先水平。

据了解,长期以来,AI在逻辑推理领域面临着两大核心挑战:一是“组合爆炸”,即几何推理往往需要寻找并添加精妙的辅助线,每增加一个点或圆,搜索空间(即探索模型中所有可能的解决方案)都会呈指数级增长;二是“高质量数据匮乏”,即现有的几何题目库规模较小,难以支持大规模模型的训练。

由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院以及北京大学武汉人工智能研究院组成的联合科研团队,通过开发一套精密的逻辑推理搜索架构,将复杂的几何世界抽象建模,使AI系统能像人类数学家一样,在逻辑推理每个节点上都能进行有序地系统性探索,避免了无效的重复尝试。

据悉,团队创新性地引入了“规范化表示”技术。这套机制赋予了AI一种“识破伪装”的能力:在复杂的几何空间中,同一个命题往往会因为图形的旋转、翻转或缩放而产生无数种表现形式。通矩模型能自动识别并合并这些对称或同构的拓扑结构,将庞杂的搜索空间压缩了几个数量级。例如,无论一个三角形在空间中如何摆放,系统都能精准锁定其本质的几何关系。这种对物理对称性的深度利用,极大地提升了搜索效率。

而在AI寻找解题“灵感”的过程中,系统通过价值函数来模拟人类的数学审美。借助强化学习技术,系统内置的“价值模型”能实时预判每一条推理路径的潜力——不仅判断结论是否成立,更在乎推导过程是否简洁。

“当AI发现一个命题的证明难度显著高于其构建复杂度时,它便捕捉到了那一抹‘直觉性的灵感’。”论文第一作者、北京通用人工智能研究院研究员张驰说,这种“价值引导”能让模型从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目,“实现了从‘模仿解题’到‘自主创造’的范式转变,这在国际上尚属首次。”

  图为团队成员正在讨论算法设计的几何问题。新华社发

张驰介绍,通矩模型仅需单张消费级显卡即可在最多38分钟内解决2000年以来所有国际数学奥林匹克竞赛的几何难题。实验表明,其推理效率和准确率均达国际先进水平。

论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,通矩模型的意义不仅在于解题速度的提升,更在于其通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。

“这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能发展的关键。我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。

据悉,目前,通矩模型自主生成的3道原创的几何新题,已入选2024年全国中学生数学联赛(北京赛区)。

张驰表示,这一成果为未来自动化数学证明、个性化智能教育及科学大模型的开发提供了技术支撑,有助于为更多感兴趣的青少年提供优质题目和讲解服务。未来,团队将继续深耕通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。

来源:新华网

1 点赞

图片转载于网络(如有侵权,请联系删除)

免责声明|内容转载于其他平台 不代表本平台观点立场

长期征集各类线索| 邮箱:wytglx@163.com

相关文章

加盟商举报退款无门 知名药企“关联”招商项目惹品牌授权争议

央广网北京1月31日消息(记者 傅天明)近日,有加盟商向媒体反映,其通过浙江修源正康科技有限公司(下称“修源正康”)参与的“修正健康集团”招商项目,在缴纳20万元意向金后遭遇项目对…

阅读全文

国家能源集团秦皇岛公司:137亩工地上的“温暖”守护

寒风凛冽,挡不住国家能源集团秦皇岛公司热气腾腾的“年”味。 去年12月26日23时18分,四期工程7号机组顺利通过168小时满负荷试运行,正式投产。 今年1月29日22时25分,7…

阅读全文

泰豪科技终止收购泰豪军工股权 去年4月消息刺激跌停

中国经济网北京2月2日讯 泰豪科技(600590.SH)1月31日披露的关于终止发行股份购买资产暨关联交易事项的公告显示,公司于2026年1月30日召开第九届董事会第九次会议,审议…

阅读全文

网购滑雪装备成风尚 现存滑雪相关企业超1.3万家

春节临近,冰雪旅游热度高涨,滑雪装备网购市场迎来爆发式增长。数据显示,滑雪核心装备订单同比大增超120%,滑雪板订单飙升140%,配套装备也同步升温,呈现出“装备先行热”的消费态势…

阅读全文

建筑产业革新提速 国内首个自研智能建造机器人生态集群在川亮相​

项目工地上,运输机器人搭载着各类建材和小型设备来回穿梭,转运物资;焊接机器人在高空舞动“手臂”,自动进行焊接作业;喷涂机器人在室内“挥毫泼墨”,对着墙面自主进行粉刷作业;钢筋加工机…

阅读全文

雄安发布“极数”数据大模型 加速构建“人工智能+”创新生态

2026年雄安新区“人工智能+”创新生态系列活动1月31日在河北雄安新区开幕。活动中,专注于处理结构化数据的通用大模型——“极数”数据大模型正式发布。 “极数”数据大模型由清华大学…

阅读全文

发表回复