AI 错题分析与知识图谱：从错题归因到薄弱点精准定位-平芜编程栈

AI 错题分析与知识图谱：从错题归因到薄弱点精准定位

一、刷题的"无效重复"：做错了一道题，同类题还是错

刷题最令人沮丧的不是"做不出来"，而是"做错了同类型的题还是做错"。一道动态规划题因为状态定义错误而失分，下次遇到类似题，还是会在状态定义上犯错。根本原因是缺乏系统性的错题归因——只记住了"这道题错了"，没有分析"错在哪一步、哪个知识点薄弱"。

AI 错题分析的核心价值是"从单题错误定位知识薄弱点"。通过分析解题过程中的错误模式（而非仅看最终答案），构建知识图谱中的薄弱路径，然后精准推送针对性练习，打破"无效重复"的循环。

二、错题归因与知识图谱模型

graph TB subgraph 错题分析 A[解题过程记录] --> B[错误步骤定位] B --> C[错误类型分类<br/>概念错误/计算错误/策略错误] C --> D[知识点归因] end subgraph 知识图谱 E[知识点节点<br/>DP/贪心/图论/...] F[前置依赖边<br/>状态定义→状态转移] G[薄弱度标记<br/>错误频率×严重度] D --> E E --> F F --> G end subgraph 精准推送 G --> H[薄弱路径提取] H --> I[难度适配<br/>当前能力±1] I --> J[针对性练习推送] end

错题归因的关键是"定位错误步骤"而非"判断对错"。一道题做错，可能是审题错误、思路错误、实现错误或边界处理错误。不同错误类型对应不同的知识点薄弱点，需要不同的补救策略。

三、错题分析系统实现

3.1 解题过程记录与错误定位

from dataclasses import dataclass, field from enum import Enum from typing import List, Optional class ErrorType(Enum): MISREAD = "审题错误" # 题目理解偏差 CONCEPT = "概念错误" # 算法/数据结构概念不清 STRATEGY = "策略错误" # 解题方向错误 IMPLEMENT = "实现错误" # 代码逻辑错误 BOUNDARY = "边界错误" # 边界条件遗漏 CALCULATION = "计算错误" # 算术/逻辑运算错误 @dataclass class StepRecord: """解题步骤记录""" step_index: int description: str code: Optional[str] = None is_correct: bool = True error_type: Optional[ErrorType] = None error_detail: Optional[str] = None @dataclass class SolutionRecord: """完整解题记录""" problem_id: str steps: List[StepRecord] = field(default_factory=list) final_correct: bool = False time_spent: int = 0 # 秒 class ErrorAnalyzer: """错题分析器：定位错误步骤并归因""" def analyze(self, record: SolutionRecord) -> dict: if record.final_correct: return {"status": "correct", "weaknesses": []} errors = [s for s in record.steps if not s.is_correct] if not errors: return {"status": "unknown_error", "weaknesses": []} # 定位第一个错误步骤（根因） root_error = errors[0] # 归因到知识点 knowledge_points = self._map_to_knowledge( record.problem_id, root_error ) return { "status": "incorrect", "root_error": { "step": root_error.step_index, "type": root_error.error_type.value, "detail": root_error.error_detail, }, "weaknesses": knowledge_points, "error_count": len(errors), } def _map_to_knowledge( self, problem_id: str, error: StepRecord ) -> List[str]: """将错误映射到知识点""" mapping = { ErrorType.MISREAD: ["题目理解", "约束条件分析"], ErrorType.CONCEPT: self._infer_concept(problem_id, error), ErrorType.STRATEGY: ["解题策略选择", "算法设计"], ErrorType.IMPLEMENT: ["代码实现", "边界处理"], ErrorType.BOUNDARY: ["边界条件", "特殊情况"], ErrorType.CALCULATION: ["运算准确性"], } return mapping.get(error.error_type, ["未知"])

3.2 知识图谱与薄弱度计算

from collections import defaultdict @dataclass class KnowledgeNode: """知识图谱节点""" name: str category: str # DP/贪心/图论/数据结构/... prerequisites: List[str] # 前置知识点 error_count: int = 0 total_attempts: int = 0 class KnowledgeGraph: """知识图谱：管理知识点依赖与薄弱度""" def __init__(self): self.nodes: dict[str, KnowledgeNode] = {} self._init_default_graph() def _init_default_graph(self): """初始化默认知识图谱""" nodes = [ ("数组基础", "数据结构", []), ("哈希表", "数据结构", ["数组基础"]), ("双指针", "算法", ["数组基础"]), ("滑动窗口", "算法", ["双指针", "哈希表"]), ("二分查找", "算法", ["数组基础"]), ("DFS/BFS", "算法", ["数组基础"]), ("树与图", "数据结构", ["DFS/BFS"]), ("动态规划基础", "DP", ["数组基础"]), ("状态定义", "DP", ["动态规划基础"]), ("状态转移", "DP", ["状态定义"]), ("背包问题", "DP", ["状态转移"]), ("子序列问题", "DP", ["状态转移"]), ("最短路径", "图论", ["树与图", "动态规划基础"]), ("拓扑排序", "图论", ["DFS/BFS"]), ] for name, category, prereqs in nodes: self.nodes[name] = KnowledgeNode( name=name, category=category, prerequisites=prereqs ) def update_weakness( self, knowledge_name: str, is_correct: bool ) -> None: """更新知识点薄弱度""" if knowledge_name not in self.nodes: return node = self.nodes[knowledge_name] node.total_attempts += 1 if not is_correct: node.error_count += 1 def get_weakness_score(self, name: str) -> float: """计算薄弱度分数（0-1，越高越薄弱）""" node = self.nodes.get(name) if not node or node.total_attempts == 0: return 0.0 return node.error_count / node.total_attempts def get_weak_paths(self, top_n: int = 3) -> List[List[str]]: """提取最薄弱的知识路径""" # 按薄弱度排序 sorted_nodes = sorted( self.nodes.values(), key=lambda n: self.get_weakness_score(n.name), reverse=True ) paths = [] for node in sorted_nodes[:top_n]: if self.get_weakness_score(node.name) < 0.2: break # 薄弱度太低，不需要补救 # 回溯到前置依赖，形成路径 path = self._trace_prerequisites(node.name) paths.append(path) return paths def _trace_prerequisites(self, name: str) -> List[str]: """回溯前置依赖路径""" path = [name] current = self.nodes.get(name) while current and current.prerequisites: # 选择最薄弱的前置依赖 weakest = max( current.prerequisites, key=lambda p: self.get_weakness_score(p) ) if self.get_weakness_score(weakest) < 0.1: break path.append(weakest) current = self.nodes.get(weakest) return path