MIT与Symbotic开发AI系统提升仓储机器人吞吐量25%

据news.mit.edu报道，麻省理工学院（MIT）与美国智能仓储技术公司Symbotic联合研发出一套新型人工智能系统，可动态优化数百台仓储机器人的通行优先级，实现在模拟电商仓库环境中吞吐量提升约25%，显著缓解拥堵与碰撞导致的作业中断。

动态优先级调度破解机器人交通瓶颈

在大型自主化仓库中，数百台机器人持续穿行于货架通道之间，执行订单拣选与分发任务。即便微小的局部拥堵或轻微碰撞，也可能引发连锁反应，造成整体作业效率大幅下滑。为应对这一挑战，MIT与Symbotic团队提出一种混合式AI协调方法：系统通过实时感知仓库环境状态，自动判断哪些机器人应被赋予通行优先权，并提前为其规划绕行路径，从而在拥堵发生前主动规避瓶颈。

深度强化学习+经典规划算法的混合架构

该系统采用深度强化学习（Deep Reinforcement Learning）训练神经网络模型，使其在高度仿真的电商仓库布局中反复试错学习——模型在仿真中获得奖励的条件是：既提升整体包裹处理数量（throughput），又避免机器人间冲突。训练完成后，该模型能准确识别长期路径约束及机器人间的动态交互关系，并预测当前与未来时段的潜在交互风险。

当神经网络确定各机器人的优先级顺序后，系统调用一个经工业验证的快速可靠路径规划算法，向每台机器人下达具体移动指令。这种“学习决策+精确执行”的分工设计，兼顾了适应性与实时性。

“在制造与物流领域，企业长期依赖人类专家编写的算法来解决决策问题。但我们证明，借助深度强化学习，可实现超越人类专家的性能。这种路径非常有前景——在巨型仓库中，哪怕仅提升2%至3%的吞吐量，也会带来巨大运营效益。”——Han Zheng，麻省理工学院信息与决策系统实验室（LIDS）博士生、论文第一作者

跨场景泛化能力与实测优势

研究团队未使用通用工业仿真平台（因其效率不足），而是自主构建了多套差异化虚拟仓库环境，用于测试模型在未见过的新布局、新机器人密度下的表现。结果显示：

相比传统人工设计算法与随机搜索法，该混合方法在单位机器人包裹交付量上平均提升25%；
能生成切实可行的避堵路径方案，而传统方法在此类高密度场景下常因计算复杂度爆炸而失效；
系统具备强泛化能力，可快速适配不同规模、不同布局的仓库，无需重新从头训练。

“纯机器学习方法仍难以直接求解复杂的组合优化问题，而由人类专家手工设计高效算法又极其耗时耗力。我们的混合方法，正是将专家设计的算法恰当地嵌入机器学习框架中，从而极大简化学习任务。”——Cathy Wu，麻省理工学院土木与环境工程系及数据、系统与社会研究所（IDSS）副教授、LIDS成员、论文通讯作者

技术实现原理与算法细节

该系统的核心在于将深度强化学习与经典路径规划算法相结合。神经网络负责学习仓库环境的动态特征，包括机器人密度、任务分布、通道拥堵模式等，并输出优先级决策。随后，传统的A*或D*算法根据这些优先级为每个机器人计算最优路径。这种分工使得系统既能处理高维、非线性的决策问题，又能保证路径规划的实时性与可行性。

与传统方法的性能对比

在相同仿真环境下，传统基于规则或启发式的方法在机器人密度较低时表现尚可，但当密度超过每千平方米50台机器人时，其计算复杂度呈指数级增长，导致规划延迟急剧上升，甚至无法在合理时间内生成可行路径。而新方法通过神经网络提前预测拥堵趋势，能在毫秒级内调整优先级，使整体系统吞吐量保持稳定。

商业化前景与行业影响

Symbotic作为该研究的合作方与资助方，已在其为沃尔玛、家得宝等零售巨头部署的自动化配送中心中测试类似技术。若本次研究成果能顺利转化为产品模块，预计可在现有系统基础上进一步提升15%-20%的作业效率。对于中国市场的京东物流、菜鸟等企业，其“货到人”机器人仓规模已达数百台，同样面临高密度调度难题，该技术有望通过技术授权或联合研发方式引入。

本文由 AI 辅助生成，经 SCI.AI 编辑团队审核校验后发布。

信息来源：news.mit.edu