探客时代

在统计学里，做决策有点像在没有红绿灯的繁忙街道上过马路：你需要权衡“走得过早”的风险与“等得太久”的风险。在假设检验中，这两种风险分别是第一类错误与第二类错误，而且无法同时将它们都降到零。

🕵️ 认识这两类错误

第一类错误（Type I，假阳性）：原假设为真却被错误地拒绝。类比医学：将健康的人误诊为患病。

第二类错误（Type II，假阴性）：原假设为假却未被拒绝。类比医学：漏诊真实存在的疾病。

它们像跷跷板⚖️：通常压低一个，另一个就会升高。

🦟 疟疾示例

设想你在疟疾流行区的一家诊所。一位病人出现发热、寒战、全身酸痛等症状，你有一个快速检测试剂：

若发生第一类错误：你说病人得了疟疾，但其实没有。他会吃到不必要的药物（可能有轻微副作用），并且真正的病因被耽误。

若发生第二类错误：你说病人没有疟疾，但其实有。不及时治疗，病情可能迅速恶化，严重者危及生命。

在这个场景中，第二类错误往往更危险🚨：

疟疾进展快，尤其对儿童与孕妇。

抗疟药物相对安全且费用不高。

漏诊真实病例的后果远重于误治一例假阳性。

因此，一些诊所在症状高度可疑而检测为阴性时，也会倾向先行治疗——宁可“误治”也不要漏掉危及生命的真病例。

🖥️ 用 Python 模拟第一类与第二类错误

下面是一个小模拟，展示疟疾检测中的假阳性与假阴性：

示例输出：

如何使用：

调高 sensitivity（敏感度）观察“尽量不漏诊”时第二类错误如何下降。

调高 specificity（特异度）观察“尽量不误诊”时第一类错误如何下降。

注意：改进一端，往往会牺牲另一端，这是永恒的权衡。

📊 如何权衡取舍

选择压低哪一类错误，取决于应用情境：

当“假阳性”的代价极高（如侵入性手术、昂贵/副作用大的药物）时，应重点降低第一类错误。

当“假阴性”的代价极高（如进展迅速的疾病、错过救治窗口）时，应重点降低第二类错误。

你无法同时将两者都降到极低，因此需要根据风险设定显著性水平（α，对应第一类错误率）与检验功效（power，与第二类错误率相关）。

💡 最后一点思考

在疟疾诊断这类高风险场景中，首要目标是“救命”，即使这意味着会有一部分人吃到了并不必要的药物。

在每个领域，都要问自己：

我们更能接受哪种错误？哪一种错误是绝对不能犯的？

在第一类与第二类错误之间如何取舍