看完有些尴尬,我还以为这个突破会出现在 DeepSeek-Prover-V2[1] 而不是 DeepSeek-Math-V2[2]。 我一向是不看好 LLM as Verifier 的,因为细微的小问题累积起来会导致模式崩塌。 AI4Math 分为两派,一派是形式化派,一派是概率派。 Miller-Rabin 判定素数有概率出错这种被称为随机误差,而 ...