机器学习小课堂：揭秘ML背后的计量标准大秘密

大飞知识 2026-01-06 13:33:10 20浏览

1. 准确率（Accuracy）：这是最常见的度量标准之一，通常用于分类任务。准确率是指正确预测的样本数占总样本数的比例。例如，如果一个分类器将80%的图像识别为猫，那么它的准确率就是80%。

2. 精确度（Precision）：精确度是衡量模型在预测为正类时，真正为正类的占比。它可以帮助我们了解模型对正样本的敏感程度。例如，如果我们有一个二分类问题，模型预测为正的概率是0.7，那么它的精确度就是0.7。

3. 召回率（Recall）：召回率是衡量模型在预测为正类时，真正为正类的占比。它帮助我们了解模型对正样本的覆盖程度。例如，如果我们有一个二分类问题，模型预测为正的概率是0.7，那么它的召回率就是0.7。

4. F1分数（F1 Score）：F1分数是一个综合了精确度和召回率的指标，用于评估模型在两类问题上的性能。F1分数的值介于0和1之间，值越大表示模型的性能越好。例如，如果我们有一个二分类问题，模型预测为正的概率是0.7，那么它的F1分数就是0.7。

5. AUC-ROC曲线（Area Under the Curve - ROC Curve）：AUC-ROC曲线是一种评估分类器性能的方法，特别是在多分类任务中。它通过计算ROC曲线下的面积来衡量模型在不同阈值下的性能。AUC-ROC曲线越接近1，表示模型的性能越好。

6. 混淆矩阵（Confusion Matrix）：混淆矩阵是一个表格，用于展示模型预测结果与实际结果之间的关系。它可以帮助我们了解模型在预测为正类和负类时的准确度、召回率和精确度等指标。

7. 均方误差（Mean Squared Error, MSE）：MSE是衡量模型预测值与真实值之间差异的一种方法。它越小表示模型的性能越好。

8. 平均绝对误差（Mean Absolute Error, MAE）：MAE是另一种衡量模型预测值与真实值之间差异的方法。它比MSE更适用于连续变量。

9. 均方根误差（Root Mean Squared Error, RMSE）：RMSE是MSE的平方根，用于衡量模型预测值与真实值之间的总体差异。它比MSE更能反映模型的泛化能力。

10. 交叉验证（Cross-Validation）：交叉验证是一种评估模型性能的方法，它通过多次划分数据集来测试模型在不同子集上的表现。交叉验证可以提供更稳健的评估结果，因为它考虑了数据分布的不确定性。