了解增益图和提升图
增益图和提升图是用于衡量使用模型的好处的两个度量,用于目标营销等业务环境。它不仅限于营销分析。它还可以用于其他领域,例如风险建模、供应链分析等。换句话说,增益图和提升图是解决数据集不平衡分类问题时使用的两种方法。
示例:在目标营销或营销活动中,客户对活动的响应通常非常低(在许多情况下,对营销活动做出响应的客户不到 1%)。组织将提高每个客户联系的成本,因此希望最大限度地降低营销活动的成本,同时达到客户期望的响应水平。
增益图和提升图是逻辑回归中的度量,可帮助组织了解使用该模型的好处。从而更好更高效的输出进行。
使用以下步骤获得增益和提升图:
- 使用 LR 模型预测概率 Y = 1(正),并按照预测概率的降序排列观察结果 [即 P(Y = 1)]。
- 将数据集分成十分位数。计算每个十分位数中的阳性数 (Y = 1) 以及最多十分位数的累计阳性数。
- 增益是高达十分位数的正面观察的累积数量与数据中正面观察的总数之间的比率。增益图表是在垂直轴上的增益和水平轴上的十分位数之间绘制的图表。
4.提升是使用该模型直到十分位 i 的阳性观察数与基于随机模型的直到十分位 i 的预期阳性数之比。提升图是垂直轴上的提升和水平轴上对应的十分位数之间的图表。
增益图表计算:
增益图:
提升图计算:
提升图:
- 累积增益和提升图是衡量模型性能的视觉辅助工具。
- 两个图表均由提升曲线(在提升图中)/增益图(在增益图中)和基线(蓝线表示提升,橙线表示增益)组成。
- 提升/增益和基线之间的区域越大,模型越好。