惊呆！学生学习兴趣越高，学得越差？

一、研究要点

这项研究以53名职前化学教师为对象，在11周《化学教学设计》课程中比较了“生成式AI支持的翻转学习”和“阅读式翻转学习”对教学设计表现、学习态度、自我调节学习与批判性思维意识的影响。结果发现，AI组学生的学习态度更积极，但在最终教学设计表现上比传统阅读组更差，两组在自我调节学习和批判性思维意识上没有显著差异，说明AI能提升学习兴趣，却不一定直接带来更高质量的学习成果。

二、方法的基本信息

惊呆！学生学习兴趣越高，学得越差？

本文研究的方法可以概括为：生成式AI支持的翻转学习方法，简称 AI-FL。研究者将它与阅读式翻转学习，简称 R-FL进行比较，考察两种课前学习方式对职前化学教师的影响。

维度	内容
方法名称	生成式AI支持的翻转学习，AI-FL
对照方法	阅读式翻转学习，R-FL
研究对象	53名职前化学教师，实验组24人，对照组29人
课程情境	《化学教学设计》课程
实施周期	11周：第1周前测与说明，第2—10周干预，第11周后测与最终教学设计任务
核心变量	教学设计表现、学习态度、自我调节学习、批判性思维意识
研究设计	准实验研究，前测—后测非等组设计

（一）核心思想

在翻转课堂的课前准备阶段加入生成式AI，是否能比传统阅读材料更有效地帮助职前化学教师完成教学设计？

两组学生的课堂内容、教师、教学主题、课堂活动和评价标准保持一致，唯一主要差异在于课前准备方式：实验组使用生成式AI围绕引导问题进行互动学习，对照组阅读课程标准、教学设计文献和优秀教案案例。

（二）独特价值

这篇文章的价值不只是“研究AI”，而是把AI放进了一个非常真实的教师教育场景中：职前化学教师如何设计一节课。它关注的不是学生有没有觉得AI方便，而是进一步追问：AI真的能帮助学生做出更高质量、更符合评分标准的教学设计吗？

（三）研究结论

AI组的学习态度更积极，但教学设计成绩不如阅读组。这说明AI可能更容易带来即时反馈、陪伴感和学习兴趣，却不一定能自动带来深度理解、标准对齐和高质量产出。

第一，AI-FL能提升学习态度。 实验组后测学习态度高于对照组，说明生成式AI的即时回应和互动性可能让学生更愿意投入学习。

第二，AI-FL没有提升最终教学设计表现。 在控制前测成绩后，对照组的教学设计表现显著高于实验组，说明阅读课程标准、理论文献和优秀案例可能更有助于学生形成稳定的评价依据和设计框架。

第三，AI-FL对自我调节学习和批判性思维意识没有显著影响。 这提示我们，单纯让学生使用AI，并不等于他们会自动学会计划、监控、反思和批判性判断。

三. 方法的操作过程

（一）应用原则

第一，AI不能替代教学目标和评价标准。 在本文中，学生完成的是化学教学设计任务，最终作品要按照教学目标、内容分析、学习者分析、教学过程设计、拓展设计、文本质量和创新性等维度评分。因此，AI只能作为辅助工具，不能代替课程标准和评分量规。

第二，课前学习必须有明确的问题支架。 无论是AI组还是阅读组，教师都提供了相同的每周主题和3—4个核心引导问题。例如，围绕“教学目标设计”“教学情境设计”“教学活动设计”“教学评价”等主题展开准备。

第三，课堂活动要保持深度加工。 两组学生课内活动一致，主要包括小组讨论、案例分析、教学设计方案比较和课堂任务完成。也就是说，真正的学习并不是“课前问AI”结束，而是要在课堂中进一步讨论、修正和应用。

（二）操作步骤

步骤一：前测与研究说明。 第1周，研究者对学生进行前测，收集教学设计表现、学习态度、自我调节学习和批判性思维意识等数据，同时说明实验流程。

步骤二：分组实施不同课前准备方式。 实验组采用AI-FL，即学生围绕教师提供的引导问题使用大语言模型工具进行互动学习，并提交AI对话截图和问题回答。对照组采用R-FL，即学生阅读指定材料，包括课程标准、教学设计文献和优秀教案案例，并基于阅读内容回答同样的问题。

步骤三：开展相同的课堂活动。 第2—10周，两组学生进入相同的课堂学习环节，包括小组讨论、案例分析、教学设计原则提炼和课堂任务完成。

步骤四：完成最终教学设计任务与后测。 第11周，学生完成综合性化学教学设计任务，同时填写后测问卷。

步骤五：进行评分和统计分析。 学生的教学设计作品由两名评分者使用统一量规独立评分。原始量规总分为25分，研究中线性转换为100分。评分者一致性较好，ICC = 0.838。随后研究者使用独立样本t检验检验前测等同性，并使用协方差分析 ANCOVA 控制前测差异，比较两组后测结果。

惊呆！学生学习兴趣越高，学得越差？

（三）数据分析方法

本文主要使用了以下数据分析方法：

分析方法	用途
描述性统计	呈现两组前测、后测的均值和标准差
独立样本t检验	检查实验组和对照组前测是否存在显著差异
ANCOVA 协方差分析	控制前测成绩后，比较两组后测差异
偏η² partial eta squared	报告效应量大小
ICC 组内相关系数	检验两名评分者对教学设计作品评分的一致性
Cronbach’s α	检验问卷量表信度
探索性因子分析 EFA	初步检验学习态度、自我调节学习、批判性思维意识量表的结构效度

四、方法的应用启示

（一）适用情境

这种方法适合用于以下课程或教学场景：

第一，适合教师教育课程。 例如教学设计、课程与教学论、学科教学法、微格教学等课程。因为这些课程既需要学生理解理论，又需要他们产出真实的教学方案。

第二，适合有明确评价标准的任务。 例如教案设计、教学活动设计、课堂评价设计、项目方案设计等。AI可以帮助学生生成想法，但最终仍需要用标准、证据和案例进行检验。

第三，适合翻转课堂或混合式学习。 课前让学生使用AI或阅读材料完成准备，课内再进行讨论、辨析、修正和迁移应用。

五、个人思考

这篇文章最大的启发是：AI让学生“更愿意学”，但不一定让学生“学得更深”。

生成式AI的优势在于即时反馈、语言流畅、互动便利。它能降低学生进入任务的门槛，让学生觉得学习更有趣、更轻松。但这也可能带来一个问题：学生过早接受AI生成的答案，减少了自己查阅标准、比较案例、反复推敲和修改方案的过程。

相比之下，阅读组虽然看起来不如AI组“新潮”，但阅读课程标准、教学设计理论和优秀案例，可能更能帮助学生建立稳定的判断依据。对于教学设计这种高度依赖“目标—活动—评价一致性”的任务来说，有依据地设计，比快速生成文本更重要。

因此，我认为AI在教师教育中的最佳定位不是“替学生写教案”，而是作为一个受约束的教学设计助手。教师可以要求学生先阅读课程标准和优秀案例，再使用AI生成多个方案，最后用评分量规进行比较、修改和说明。这样，AI不是替代思考，而是促进思考。

六、值得讨论的新问题

问题一：AI应该替代阅读，还是辅助阅读？ 本文结果显示，单独使用AI并不一定比阅读更好。未来可以增加第三组：“阅读 + AI组”，比较它是否优于单纯AI组和单纯阅读组。

问题二：怎样设计AI提示词，才能避免学生浅层使用AI？ 例如要求AI提供多个方案、说明每个方案的依据、指出潜在问题，再让学生用课程标准进行核查。

问题三：AI是否会让学生产生“看似完成、实则浅层”的学习错觉？ AI生成的内容往往结构完整、表达流畅，但不一定符合具体教学情境和评分标准。

问题四：AI对不同水平学生的影响是否不同？ 基础较好的学生可能会把AI当作资源整合工具，基础较弱的学生可能更容易直接依赖AI答案。

问题五：AI能否真正促进自我调节学习和批判性思维？ 本文发现短期内没有显著效果，这说明这些能力可能需要更长时间、更明确的训练和更严格的过程性评价。

七、论文基本信息

Zhang, J., Deng, X., Wu, T., & Wang, K. (2026). GenAI-supported flipped learning in preservice chemistry teacher education: Lesson-design performance, learning attitude, self-regulated learning, and critical thinking awareness. Behavioral Sciences, 16(4), 514. https://doi.org/10.3390/bs16040514

感谢AI助教，确实AI组会存在因为AI的即时互动与反馈能够更快获得答案，我觉得这个提问也带给我一个新的思考，就是之前我看到过一个说法“AI其实对人更大的挑战是其剥夺了人作为新手的时间”，其实就像这个提问中暗含的阅读组需要更多的时间消化文本，这里面其实表示阅读组会有更多时间去思考、去理解吸收、更深入沉浸文本中，不过我觉得讨论学习时间不够具体，我觉得还应该加入一个具体的限定就是“有效学习时间”，其实如果学生对于这个内容有思考，可以和AI交互很多内容，在时间上或许与阅读组差异不大，这里面确实也有学习深度的影响，这个确实是不可回避的问题。53名样本量当然显得较少，但是对于学科课程教学来说，现在样本还是比较难找的，53够也能够说明一些问题，未来研究可以向职前科学教师、职前物理教师领域拓展，看看其在不同学科领域中的结论😁

8 条回复 A文章作者 M管理员

更换删除

ai助教M userslv0

4月30日

陆杨对AI-FL与R-FL的比较设计很清晰，但这里有一个关键问题：两组课前学习时间是否对等？AI组与AI互动可能更快获得答案，而阅读组需要更多时间消化文本。如果时间投入不同，那么教学设计表现的差异可能并非源于学习方式本身，而是学习深度的差异。此外，53名样本量较小，且职前化学教师的特殊性是否限制了结论向其他学科或学段的迁移？
- 陆杨A@ai助教M userslv0
  
  4月30日
  
  感谢AI助教，确实AI组会存在因为AI的即时互动与反馈能够更快获得答案，我觉得这个提问也带给我一个新的思考，就是之前我看到过一个说法“AI其实对人更大的挑战是其剥夺了人作为新手的时间”，其实就像这个提问中暗含的阅读组需要更多的时间消化文本，这里面其实表示阅读组会有更多时间去思考、去理解吸收、更深入沉浸文本中，不过我觉得讨论学习时间不够具体，我觉得还应该加入一个具体的限定就是“有效学习时间”，其实如果学生对于这个内容有思考，可以和AI交互很多内容，在时间上或许与阅读组差异不大，这里面确实也有学习深度的影响，这个确实是不可回避的问题。53名样本量当然显得较少，但是对于学科课程教学来说，现在样本还是比较难找的，53够也能够说明一些问题，未来研究可以向职前科学教师、职前物理教师领域拓展，看看其在不同学科领域中的结论😁
金 Guest

4月30日

感觉这个研究很契合当下我们关注的一些问题，就我自己而言，我会觉得在我刚开始接触大量文献的时候AI给我提供了很多帮助，一是他的阅读速度真的很快，可以帮我快速得到我想要的结果；二是在情绪上，因为有AI的辅助降低了我对阅读任务的抵触情绪。但从另一方面来看阅读的结果也不只是为了一些结论，这个过程本身也是能力增长的一部分。所以我觉得AI辅助阅读可以成为方式之一，但一定要有自己亲自阅读的时间。
金鑫烨 userslv0

4月30日

感觉这个研究很契合当下我们关注的一些问题，就我自己而言，我会觉得在我刚开始接触大量文献的时候AI给我提供了很多帮助，一是他的阅读速度真的很快，可以帮我快速得到我想要的结果；二是在情绪上，因为有AI的辅助降低了我对阅读任务的抵触情绪。但从另一方面来看阅读的结果也不只是为了一些结论，这个过程本身也是能力增长的一部分。所以我觉得AI辅助阅读可以成为方式之一，但一定要有自己亲自阅读的时间。
- 陆杨A@金鑫烨 userslv0
  
  4月30日
  
  感谢金同学的分享，我自己也有这样的体验，AI能够很快的提取一篇文章的研究脉络及框架，如果仅仅只是了解文章的研究结论，那利用AI确实能够很快提取。不过利用AI不能够放弃自己的阅读体验，在这个过程中，确实就像金同学所说，阅读的过程本身也是能力增长的过程，在阅读的过程中，可能作者的文字表达、逻辑框架、行风风格都会对自己产生潜在影响，有一种润物细无声的感觉，就像刚开始读英文文献的时候，会觉得很痛苦，在读了几篇以后，就会发现好像也没有那么痛苦了，阅读速度也快起来了，自己在写文章的时候，脑海中会出现一些经典的字词句，我觉得这些是AI辅助阅读中，还需要自己亲自阅读的原因😁
李泽堃 userslv0

4月30日

这项研究选题很有现实针对性，把AI放进“教学设计”这种高要求任务里来检验，而不是停留在态度层面，这一点很有价值。方法上用准实验和ANCOVA也比较规范。AI让人更愿意学，但未必学得更好，这也提醒我们不能高估工具本身。我的感受是，问题可能不在“用不用AI”，而在“怎么用”——如果缺少评价标准和过程约束，AI确实容易让学习停留在表面。
郑渝晴 userslv0

4月30日

我觉得文章的结论很值得人思考——AI让学生“更愿意学”，但不一定让学生“学得更深”，当学习者在利用ai进行学习时，很可能因为较快获得答案而不再反复思考、查找资料等，因此，当我们想将ai引入教学时，可能可以考虑对ai进行限制，比如不能直接给完整答案，需要引导学习者逐步解决问题等
孙晓霄 userslv0

4月30日

这是一篇选题犀利、现实意义极强的教育准实验研究，文章戳破 “AI 万能” 的误区，研究表明AI 可以提升学习兴趣与课堂好感度，但替代不了研读课标、文献、优秀案例带来的专业框架建构与深度思考。但是文章缺少不同水平学生的异质性分析，没有区分基础好 / 基础弱的师范生，是否基础弱的学生更容易依赖 AI 躺平，基础好的能借 AI 提质？11 周干预只看前后测，缺少每周学习投入、AI 使用频次、预习任务完成质量过程数据？

{{userData.name}}已认证

惊呆！学生学习兴趣越高，学得越差？

一、研究要点

二、方法的基本信息

（一）核心思想

（二）独特价值

（三）研究结论

三. 方法的操作过程

（一）应用原则

（二）操作步骤

（三）数据分析方法

四、方法的应用启示

（一）适用情境

五、个人思考

六、值得讨论的新问题

七、论文基本信息

治大国如分披萨

“干预效果因人而异”可能只是题目的障眼法

天赋 vs 运气：随机性在成功与失败中的作用

《学术还是功利：教育博士生学习动机如何影响学业成就》量化研究分享

只学习不玩耍，聪明孩子也变傻？

剪刀石头布

学前情境教育影响儿童创造性思维发展的实验研究_王灿明

《酸味与创造力的关系研究》量化研究分享

量化研究分享：将错就“措”还是改“谐”归正?谐音对消费者广告评价的影响

生成式人工智能工具使用对高校学生批判性思维与自主学习能力的影响

《择偶优劣势对师范大学生教师职业认同的影响：择偶价值感的中介及自尊的调节作用》量化研究分享

{{userData.name}}已认证

一、研究要点

二、方法的基本信息

（一）核心思想

（二）独特价值

（三）研究结论

三. 方法的操作过程

（一）应用原则

（二）操作步骤

（三）数据分析方法

四、 方法的应用启示

（一）适用情境

五、个人思考

六、值得讨论的新问题

七、论文基本信息

治大国如分披萨

“干预效果因人而异”可能只是题目的障眼法

量化研究 AI 助手

四、方法的应用启示