mathqform

MathQForm 評価ルーブリック / Evaluation Rubric

v0.1 — パイロット版 / pilot

主軸 1: Well-posedness(適切定式化)

問いが数学的に明確に定義されているか。/ Whether the question is mathematically well-defined.

スコア / Score 基準 / Criteria 例 / Example
5 全ての概念が正確に定義され、矛盾がなく、回答の形式が明確 / All concepts precisely defined, no contradictions, answer format clear 「$f: [a,b] \to \mathbb{R}$ が連続で $f(a) < 0 < f(b)$ のとき、$f(c) = 0$ なる $c \in (a,b)$ の存在を示せ」
4 ほぼ完全だが、微細な曖昧さが残る / Nearly complete but minor ambiguity remains 省略された仮定があるが文脈から推定可能 / Omitted assumptions inferable from context
3 主旨は理解できるが、解釈の余地がある / Main point understandable but room for interpretation 「連続関数の性質を調べよ」/ “Investigate properties of continuous functions”
2 重要な定義の欠落や不整合がある / Important definitions missing or inconsistent 使用される記号の定義がない / Symbols used without definition
1 問いとして成立していない / Does not function as a question 「適当にまとめよ」/ “Summarize loosely”

主軸 2: Significance(数学的意義)

問いが数学的に意味のある探究につながるか。/ Whether the question leads to meaningful mathematical inquiry.

スコア / Score 基準 / Criteria
5 非自明な結果に至る可能性が高い。理論の本質に迫る / Likely to lead to non-trivial results; targets the essence of the theory
4 数学的に興味深く、意味のある知見が得られる / Mathematically interesting; yields meaningful insights
3 標準的な教育的価値がある。定理の理解を深める / Standard educational value; deepens understanding of theorems
2 既知の結果の再確認に留まる / Limited to reconfirming known results
1 自明、不毛、または定義の言い換えにすぎない / Trivial, futile, or merely rephrasing definitions

主軸 3: Information Preservation(情報保持性)

元のソースメモの論点が構造化問いに反映されているか。/ Whether the source note’s points are reflected in the structured question.

スコア / Score 基準 / Criteria
5 元メモの全論点を包含し、さらに発展させている / Encompasses all source points and develops them further
4 主要な論点を含むが、一部の副次的要素が落ちている / Major points included but some secondary elements lost
3 中心的テーマは保持されているが、具体的な問題意識が薄まっている / Central theme preserved but specific concerns diluted
2 元メモの方向性から逸脱している箇所がある / Deviates from the source note’s direction in places
1 元メモとの対応が認められない / No correspondence with the source note

主軸 4: Tractability(扱いやすさ)

B4〜M1 レベルの学生が取り組み可能か。/ Whether B4-M1 level students can approach the problem.

スコア / Score 基準 / Criteria
5 B4 が独力で着手可能。必要な前提知識が明確 / B4 can start independently; prerequisites clear
4 B4 が文献参照で取り組める。指導なしでも方向性がわかる / B4 can work with literature; direction clear without guidance
3 指導付きで取り組める。一部に高度な概念を含む / Possible with guidance; contains some advanced concepts
2 M1 でも困難。大幅な前提知識の追加学習が必要 / Difficult even for M1; extensive additional study needed
1 大学院上級レベル。B4-M1 には手に負えない / Advanced graduate level; beyond B4-M1 scope

補助軸 A: Clarity(明瞭性)

記述が明瞭で理解しやすいか。/ Whether the writing is clear and easy to understand.

スコア / Score 基準 / Criteria
5 極めて明瞭。論理構造が見通せる / Extremely clear; logical structure transparent
3 概ね理解可能だが、読み返しが必要な箇所がある / Generally understandable but requires re-reading
1 理解困難。主語述語が不明確 / Hard to understand; subject-predicate unclear

補助軸 B: Formalizability(形式化可能性)

Lean 4 等の証明支援系で形式化できる見込みがあるか。/ Whether formalization in proof assistants like Lean 4 is feasible.

スコア / Score 基準 / Criteria
5 直ちに形式化可能。Mathlib に対応する概念がある / Immediately formalizable; corresponding Mathlib concepts exist
3 部分的に形式化可能。一部の概念に非形式的要素を含む / Partially formalizable; some informal elements
1 形式化の見通しがない。自然言語に強く依存 / No prospect; heavily dependent on natural language