据news.mit.edu报道,麻省理工学院(MIT)与美国智能仓储技术公司Symbotic联合研发出一套新型人工智能系统,可动态优化数百台仓储机器人的通行优先级,实现在模拟电商仓库环境中吞吐量提升约25%,显著缓解拥堵与碰撞导致的作业中断。
动态优先级调度破解机器人交通瓶颈
在大型自主化仓库中,数百台机器人持续穿行于货架通道之间,执行订单拣选与分发任务。即便微小的局部拥堵或轻微碰撞,也可能引发连锁反应,造成整体作业效率大幅下滑。为应对这一挑战,MIT与Symbotic团队提出一种混合式AI协调方法:系统通过实时感知仓库环境状态,自动判断哪些机器人应被赋予通行优先权,并提前为其规划绕行路径,从而在拥堵发生前主动规避瓶颈。
深度强化学习+经典规划算法的混合架构
该系统采用深度强化学习(Deep Reinforcement Learning)训练神经网络模型,使其在高度仿真的电商仓库布局中反复试错学习——模型在仿真中获得奖励的条件是:既提升整体包裹处理数量(throughput),又避免机器人间冲突。训练完成后,该模型能准确识别长期路径约束及机器人间的动态交互关系,并预测当前与未来时段的潜在交互风险。
当神经网络确定各机器人的优先级顺序后,系统调用一个经工业验证的快速可靠路径规划算法,向每台机器人下达具体移动指令。这种“学习决策+精确执行”的分工设计,兼顾了适应性与实时性。
“在制造与物流领域,企业长期依赖人类专家编写的算法来解决决策问题。但我们证明,借助深度强化学习,可实现超越人类专家的性能。这种路径非常有前景——在巨型仓库中,哪怕仅提升2%至3%的吞吐量,也会带来巨大运营效益。”——Han Zheng,麻省理工学院信息与决策系统实验室(LIDS)博士生、论文第一作者
跨场景泛化能力与实测优势
研究团队未使用通用工业仿真平台(因其效率不足),而是自主构建了多套差异化虚拟仓库环境,用于测试模型在未见过的新布局、新机器人密度下的表现。结果显示:
- 相比传统人工设计算法与随机搜索法,该混合方法在单位机器人包裹交付量上平均提升25%;
- 能生成切实可行的避堵路径方案,而传统方法在此类高密度场景下常因计算复杂度爆炸而失效;
- 系统具备强泛化能力,可快速适配不同规模、不同布局的仓库,无需重新从头训练。
“纯机器学习方法仍难以直接求解复杂的组合优化问题,而由人类专家手工设计高效算法又极其耗时耗力。我们的混合方法,正是将专家设计的算法恰当地嵌入机器学习框架中,从而极大简化学习任务。”——Cathy Wu,麻省理工学院土木与环境工程系及数据、系统与社会研究所(IDSS)副教授、LIDS成员、论文通讯作者
技术实现原理与算法细节
该系统的核心在于将深度强化学习与经典路径规划算法相结合。神经网络负责学习仓库环境的动态特征,包括机器人密度、任务分布、通道拥堵模式等,并输出优先级决策。随后,传统的A*或D*算法根据这些优先级为每个机器人计算最优路径。这种分工使得系统既能处理高维、非线性的决策问题,又能保证路径规划的实时性与可行性。
与传统方法的性能对比
在相同仿真环境下,传统基于规则或启发式的方法在机器人密度较低时表现尚可,但当密度超过每千平方米50台机器人时,其计算复杂度呈指数级增长,导致规划延迟急剧上升,甚至无法在合理时间内生成可行路径。而新方法通过神经网络提前预测拥堵趋势,能在毫秒级内调整优先级,使整体系统吞吐量保持稳定。
商业化前景与行业影响
Symbotic作为该研究的合作方与资助方,已在其为沃尔玛、家得宝等零售巨头部署的自动化配送中心中测试类似技术。若本次研究成果能顺利转化为产品模块,预计可在现有系统基础上进一步提升15%-20%的作业效率。对于中国市场的京东物流、菜鸟等企业,其“货到人”机器人仓规模已达数百台,同样面临高密度调度难题,该技术有望通过技术授权或联合研发方式引入。
本文由 AI 辅助生成,经 SCI.AI 编辑团队审核校验后发布。
信息来源:news.mit.edu










