据arxiv.org报道,美团联合华中科技大学研究团队在KDD ’22会议上发表论文,提出一套面向即时配送场景的多阶段奖金分配(MSBA)框架,该框架已部署于美团外卖平台,日均处理数百万订单,实测使订单取消率下降超25%,餐厅食品浪费补偿成本降低超30%。
问题背景:日均16.5万单因无人接单被取消
论文指出,在美团外卖平台上,由于众包骑手未接单,平均每天产生约165,000单NA-cancelled订单(即“未接受即取消”订单)。此类取消不仅直接损害用户体验,更引发连锁负面效应:占平台日均负面评价的55%以上(约30,000条/日),并导致餐厅端年均数亿元人民币的食品浪费补偿支出。
传统机制局限与新框架构成
此前,美团采用固定规则式奖金激励,例如“订单发布10分钟后加发3元、20分钟后加发6元”。该方式缺乏对订单全生命周期的全局优化能力,无法动态响应骑手供给波动、区域拥堵、时段峰值等实时变量。
为此,研究团队提出四模块协同的MSBA框架:
- 半黑箱接单概率模型:基于历史数据拟合奖金金额与骑手接单概率之间的非线性关系
- 拉格朗日对偶动态规划(LDDP)算法:离线计算各分配阶段的经验拉格朗日乘子,支撑全局预算约束下的最优决策
- 在线分配算法:利用预计算乘子,在毫秒级(O(1)时间复杂度)内为每单实时生成个性化奖金
- 周期性调控策略:依据实际订单流与预算消耗速率,动态调整各阶段奖金阈值与触发条件
实证效果:离线与线上双验证
研究团队使用美团真实历史数据开展离线实验,并同步在生产环境进行A/B测试。结果显示:
- 相比单阶段奖金机制,MSBA使订单取消率降低约25%
- 相比统一奖金机制(如全量订单固定加发5元),取消率降幅达约50%
- 在线A/B测试证实:在真实流量下,订单取消率下降超25%,餐厅食品浪费补偿支出减少超30%
- 系统已全面上线,稳定支撑美团外卖平台每日数百万订单的实时奖金决策
该框架不仅适用于外卖场景,论文亦指出其方法论可迁移至其他时间敏感型定价问题,例如生鲜商品临期折扣、共享出行高峰溢价、即时仓储拣货激励等供应链末端高频决策场景。作为中国头部本地生活平台首次在KDD顶级会议公开披露的规模化AI调度实践,该成果体现了国内企业在智能物流与末端配送领域从工程应用向算法原创的实质性跃升。当前,达达快送、顺丰同城等平台已在类似场景探索动态激励模型;阿里本地生活2023年财报提及“骑手履约效率提升12%”,虽未披露技术细节,但行业共识认为动态奖金分配是关键路径之一。对全球供应链从业者而言,该案例表明:在人力密集、时效刚性、供需瞬时匹配的履约环节,以数据驱动的细粒度、多阶段、预算可控的激励机制设计,正成为提升供应链韧性与运营确定性的核心杠杆之一。
来源:arxiv.org
本文编译自海外媒体报道,由 SCI.AI 编辑团队整理发布。










