😮🧐
还在担心用 AI 会让思维变懒?这篇文章告诉你解决方案 —— 用四角色多智能体 组局“辩论赛” ,既抛证据,又提质疑,让学生从“抄答案”转为“辩逻辑”,通过观点碰撞、逻辑质询,把批判性思维 “逼” 出来,突破认知外包的困境。想知道 AI 怎么从 “答案工具” 变身 “思维对手”?往下看这篇实证干货~👇
研究是什么?
研究背景:
生成式 AI(如 DeepSeek、ChatGPT)的 “一问一答” 交互模式,让学生轻易获取现成答案,诱发了严重的 “认知外包” 风险 —— 学生将分析、评价、创造等高阶思维任务转交给智能工具,自身被动接受结果,陷入 “思维懒惰→能力退化→判断失真” 的认知萎缩,严重制约批判性思维(4C 核心素养之一)的培养与发展。而传统单智能体交互缺乏多轮论证与认知挑战,难以支撑批判性思维所需的推理、反驳与重构过程。
研究目的:
针对上述困境,基于对话理论、协作辩论与图尔敏论证模型,设计一款包含多角色的智能体群聊辩论系统,通过模拟结构化、多轮次、多立场的论证过程,激发学生主动分析、质疑与重构观点;同时通过实证实验,验证该系统对大学生批判性思维的促进作用,揭示人机协作辩论中批判性思维的行为特征、逻辑链条与网络结构。
研究对象:
12 名 18-21 岁、具备一定 AI 知识的大学生(前测确保批判性思维水平无显著差异)。
研究方法:
1.对比实验设计:被试先后参与两轮实验(间隔两个月以上,避免练习效应),第一轮与单智能体开展主题探讨,第二轮与四角色多智能体开展协作辩论(多智能体群聊系统见下图),两轮实验主题难度匹配;
2.数据收集:完整抓取两轮实验的所有交互数据,共获得 3173 条有效对话消息;
3.量化分析:频次统计、滞后序列分析( LSA)、认知网络分析 (ENA)。

发现了什么?
核心结果 1:
“评价” 是批判性思维的 “核心枢纽”。多智能体模式下,学生形成 “理解→分析→评价→创造” 的稳定长链,所有高阶思维链都在 “评价” 节点汇聚或分叉,跳过 “评价” 就会陷入低阶思维循环。
核心结果 2:
多智能体角色分工显奇效。“知识提供者” 不只是输送信息,更是高阶思维催化剂,通过证据判断推动学生主动思考;“批判性思维促进者” 的质疑反驳制造认知冲突,倒逼学生回应调整。
核心结果 3:
多智能体完胜单智能体。单智能体模式以短链、低阶思维自循环为主,多智能体模式显著提升高阶思维交互频次与网络密度,批判性思维表现更优。

想到了什么?
1.多智能体的 “冲突设计” 很有价值,但如何把握冲突强度?会不会让低认知水平学生产生挫败感?
2.这套系统在 K12 学段或理科探究场景中是否适用?是否需要调整智能体的语言风格和逻辑深度?
3.除了批判性思维,多智能体辩论是否能提升创造性思维、协作能力等其他核心素养?
论文基本信息:
[1]胡金艳,闫恬萌,张彤彤.突破认知外包:面向批判性思维的人机协作辩论系统设计[J].电化教育研究,2026,47(03):54-63.
突破认知外包:面向批判性思维的人机协作辩论系统设计

多智能体辩论系统通过角色分工和认知冲突来激发高阶思维的核心机制。不过,如果这套系统的“知识提供者”角色本身给出的信息存在细微偏差或局限性,那么它所催化的“评价”与“创造”链条,是否可能在根源上被导向一个有缺陷的论证方向?
我也觉得这是一个很重要的问题。如果知识提供者给的信息有偏差、局限,后面可能会让学生陷入伪论证的死循环,也说明一方面,知识提供者不能只单纯给信息,同时要给出来源和边界,比如给一个观点的同时,明确说清信息来源、适用场景,甚至主动给出不同的说法和争议点,让信息本身就带着 “可质疑” 的特质。其次学生本身也要具有一定的思辨能力,学生在第一步就要先判断信息本身的真伪和全面性,而不只是在逻辑层面做推敲。