我数据生涯中见证的最昂贵的错误

还没发文章的小羊 2024-12-05 15:41:19
来源于Ng 为什么机器学习的真正成功不仅仅在于优化单一指标 "新的信用模型表现不如预期,"他说道。 我的同事们从"作战室"出来时,看起来很沮丧。 这是我第一次在商业环境中目睹数据科学的"失误",当时我还没有完全理解其影响程度。 在接下来的六个月里,我逐渐认识到这是一个代价极其高昂的错误,无论是从财务还是运营的角度来看,因为它对公司产生了连锁反应和持续的影响。 这个问题影响到了每个团队,我们在之后的几个月里都在不懈努力: • 分析师负责跟踪资产组合的健康状况 • 数据科学家致力于诊断问题并修复 • 工程师与数据科学家合作部署新模型 • 产品营销人员负责活动策划和消息传达 • 运营人员负责客户沟通和还款 第一个危险信号是违约率远高于预期,但这仅仅是个开始: • 更高的违约率意味着更多客户进入催收队列 • 负责客户沟通的债务催收团队很快就不堪重负 这种能力不足导致了高压的工作环境,造成运营团队人员流失增加,降低了生产力和绩效指标。 最终,公司不得不将比平常更多的贷款作为坏账注销。在接下来的几个月里,风险损失达到了惊人的水平。 究竟发生了什么? 这个模型在测试中表现很好——它本应比前一个版本有显著改进,并达到了所有关键业务目标。 但在真实世界部署后却没有产生任何价值。 为什么? 它被过度优化了。 更多内容见图中

0 阅读:0
还没发文章的小羊

还没发文章的小羊

感谢大家的关注