科学推理如何被追踪?TBP 模型:从特质到行为的过程机制

现在很多科学课用电脑模拟实验(比如模拟水环境、生态系统),让学生自己做探究、提假设、调参数。你是否想过学生在虚拟实验里 “点来点去”,我们到底怎么判断他是在认真思考,还是随意漫游?传统评价只看分数、只数次数,很难真正的看见科学推理过程。今天分享一篇 2026 年发表在C&E上的一篇量化研究,它用一套清晰的特质-机制-行为模型(TBP),把看不见的科学推理变成可测量、可追踪、可干预的过程,无论是做教育研究还是做教学实践,都能有新的启发~

一、基本信息

这篇文章把科学推理看作一段连续发生的过程,而不是一个最后才出现的结果分数。它提出学生的自我调节能力(SRL)、批判性思维(CTD)这些个人特质,不会直接变成优秀的科学推理能力,必须先转化成规范的实验策略(SIM),再进一步变成清晰的假设表达与及时修正(SIB)。这种“特质→机制→行为”的链条,就是TBP模型的核心。

研究以学习分析为核心、结合结构方程与过程挖掘的混合量化方法,用日志数据追踪学习过程,用模型解开“特质如何变成行为”的机制,用时序分析还原学生真实的思考状态,不是只关注结果与计算表面行为计数。

科学推理如何被追踪?TBP 模型:从特质到行为的过程机制

这套方法最独特的价值,在于它同时解决了“过程怎么测”“机制怎么解释”“干预怎么精准”三大难题,将结构方程建模与学习分析技术有机结合,比传统问卷或单一行为数据更有说服力、更有深度。最终它产出了一套完整可复用的分析流程、科学推理过程指标、学生状态识别方法,对模拟学习教育实践与科学推理研究有一定的启示。

二、操作过程

1. 研究设计

研究者首先选取168名十一年级学生,分为引导→开放开放→开放两种教学条件,开展为期四周的水生生态模拟实验。在模拟平台中,系统以毫秒级记录学生的每一步操作,包括参数调整、实验运行、假设输入与修改时间。

科学推理如何被追踪?TBP 模型:从特质到行为的过程机制

2. 数据收集与分析
 
操作从Simulation Task(模拟任务)开始,学生在虚拟环境中开展探究,系统同时开启两条数据采集路径:
  • 一条是直接的学习者交互行为采集,记录三类核心动作:参数配置、假设修订、运行实验;
  • 另一条是日志映射路径,系统自动从操作记录中提取关键过程指标:总尝试次数、唯一配置数,以及配置效率(尝试次数 /唯一配置数),用来客观反映学生的探究策略是否规范、高效。
 
数据采集完成后,研究将两类信息分别转化为可用于分析的变量:
  1. 研究者从日志中提取指标:用实验次数与唯一配置数衡量模拟交互策略(SIM),用假设语义精度得分和修订次数衡量模拟交互行为(SIB)。接着对量表与行为指标进行信效度检验,通过MICOM步骤验证两组学生具备测量不变性,确保后续比较可靠。
  2. 在模型分析中,使用PLSc估计反射性构念,用Mode B估计形成性构念,通过5000次Bootstrap检验主效应、中介效应与调节效应,并采用CR2聚类稳健标准误对班级集群数据进行校正。
  3. 最后,通过K-means聚类将学生划分为不同探究类型,利用三状态隐马尔可夫模型HMM刻画学生在低、中、高效率状态之间的停留与转换,并计算停留概率与组间差异,完成全过程的追踪与刻画。

科学推理如何被追踪?TBP 模型:从特质到行为的过程机制

 

三、应用启示

1. 核心研究结论:

  • 决定推理质量的不是学生“说了什么”(假设内容),而是“怎么做实验”(配置策略)。
  • 个体特质本身不能直接产生高质量的科学推理,必须通过”有序组织实验”这一中间环节才能转化为实际的推理能力。
  • 教学效果的关键不在于是否提供支架,而在于支架是否精准作用于SIM这一核心机制。
  • 低效率状态是可以被精准识别的。通过 HMM 模型,低自律学生大部分时间停留在 “随机尝试、无明确假设” 的低效率状态,而高自律学生则更多处于 “系统验证、证据驱动” 的高效状态。

2. 研究方法启示

  • 日志数据的价值在于 “过程轨迹” 而非 “次数计数”。要放弃对尝试次数、总时长等表面指标的过度关注,转而监控配置效率(尝试次数/唯一配置数)与修订节奏。开发实时仪表盘,为教师提供学生SIM与SIB的动态可视化,及时识别陷入”漫游”状态的学生。
  • 整合结构与过程分析:将结构方程建模与学习分析技术有机结合,既揭示了变量间的因果关系,又刻画了过程的时间动态。研究先用PLS-SEM揭示变量间的因果路径,再用K-means聚类和HMM模型刻画学生的动态学习过程,实现了“静态机制 + 动态过程”的双重解释,提升了研究的深度和说服力。

3. 教学实践启示

  • 把监控重点从“结果”转向“过程策略”。教师和平台没必要过度关注学生的最终实验结果,需要重点监控“配置效率”“变量控制规范性”等策略指标,当学生出现“低配置效率、大量重复无效尝试”时,及时识别为“漫游者”,并触发干预。
  • 为不同类型的学生提供差异化支架。针对聚类划分出的三类学生,可设计不同的支持策略:
    1. 漫游者:提供单变量控制模板、明确的实验步骤提示,缩小探索范围,引导其建立规范的实验习惯;
    2. 稳定者:适度引入认知冲突,鼓励其拓展探索广度,提升假设的深度;
    3. 精炼者:提供反驳性证据,挑战其现有观点,培养批判性论证能力。
  • 干预的时机比形式更重要。教师应避免在学生运行实验时打断,而是在两次实验之间的假设修订阶段,用“只改变一个变量”“用如果… 那么… 因为… 表述假设”等轻量化提示,帮助学生把实验证据转化为高质量推理。

四、论文信息

Lu, C.-M. (2026). Tracing scientific reasoning as process: A trait-behavior-performance model with learning analytics in simulated environments. Computers & Education, 246, 1–35. https://doi.org/10.1016/j.compedu.2025.105556
资源分享

利用因果推断方法在观察性健康数据中估计干预效应并优化干预策略

2026-4-29 8:04:36

研究解读

治大国如分披萨

2026-4-29 18:17:35

8 条回复 A文章作者 M管理员
  1. ai助教

    佳怡对TBP模型将科学推理从特质到行为的链条拆解得非常清晰,尤其欣赏你点出“配置效率”而非“尝试次数”才是过程质量的关键指标。顺着这个思路,如果要把这套方法迁移到更开放的探究场景(比如学生自主设计实验而非模拟平台预设参数),日志数据的“配置效率”指标是否还能有效区分策略水平?或者需要重新定义行为粒度?值得进一步思考。

    • 胡佳怡

      方法上我觉得比较新颖的是日志数据、结构方程、聚类和 HMM 的结合,不只是看问卷或成绩,而是试图还原学生在任务中的状态变化。这一点对教育技术研究很有启发,特别适合分析模拟学习、探究学习这类过程性很强的场景。不过我也有一点疑问:文章虽然用模型把路径解释得比较完整,但样本只有168名学生,而且任务也比较单一,结论能不能推广到其他学科、其他年级,还需要进一步验证。总体来说,这篇文章的亮点在于把“过程数据”真正用起来了,而不是停留在口号层面。

    • 胡佳怡

      原有研究中配置效率=实验次数/唯一配置数,用来衡量学生是否专注重复验证、规范做实验,是在科学、有规律地复测,还是在每次都换全新设置的无规律探索。

      那么在更开放的探究场景中,学生如果是自主设计实验,不存在去重复相同设置。而应该是更强调重复相同的探究逻辑,能否聚焦同一变量,迭代推进验证并进行有序探索。

    • 胡佳怡

      原有研究中配置效率=实验次数/唯一配置数,用来衡量学生是否专注重复验证、规范做实验,是在科学、有规律地复测,还是在每次都换全新设置的无规律探索。

      那么在更开放的探究场景中,学生如果是自主设计实验,不存在去重复相同设置。而应该是更强调重复相同的探究逻辑,能否聚焦同一变量,迭代推进验证并进行有序探索。

  2. 赵祥森

    虚拟实验室的意义是什么,那如果有虚拟实验了,学生自主设计实验,那老师干嘛呢

  3. 陈天娇

    文章划分了三种类型的学习者,并且提出了需要根据这些学习者特性进行个性化的教学策略设计,那么如何在课程开始之前识别者三类学习者呢?还是说是动态监控,实现对学习者行为的实时分析?

    • 胡佳怡

      研究对于这三类学习者的划分更多是一种事后的回顾性分析,而不是实时干预。它是先把所有学生的过程数据都收集完,事后用K-means聚类出精炼者、稳定者、漫游者三种典型状态。研究者的意思是这三种状态并非某一类学生固定不变的特质标签,而是伴随科学探究进程动态变化的过程状态与行为模式,学生可以在三种状态间动态切换。

      未来到真实的课堂教学中,可以将这三类行为模式做成实时监控匹配的规则,在教学中去动态监控学生的状态,并据此提供实时、适配的支架。

    • 胡佳怡

      研究对于这三类学习者的划分更多是一种事后的回顾性分析,而不是实时干预。它是先把所有学生的过程数据都收集完,事后用K-means聚类出精炼者、稳定者、漫游者三种典型状态。研究者的意思是这三种状态并非某一类学生固定不变的特质标签,而是伴随科学探究进程动态变化的过程状态与行为模式,学生可以在三种状态间动态切换。

      未来到真实的课堂教学中,可以将这三类行为模式做成实时监控匹配的规则,在教学中去动态监控学生的状态,并据此提供实时、适配的支架。

量化研究 AI 助手

Powered by DeepSeek | 智慧教学平台

👋 欢迎使用!

我是专为量化研究设计的智能助手。支持 MarkdownLaTeX 公式

您可以问我:

  • 如何解读回归分析的 R² 和 P 值?
  • 写一段 R 语言代码进行因子分析。
  • 什么是认知诊断模型(CDM)?