版权归原作者所有,如有侵权,请联系我们

AI当“矿山调度员”,安全效率双提升?华中科大团队用深度强化学习破解土方工程难题

Engineering前沿
工程院Engineering系列期刊内容精选
收藏

矿山土方作业现场,数十台推土机与卡车协同作业,稍有不慎就可能因距离过近引发碰撞——这一场景或将因AI技术迎来改变。近日,华中科技大学数字建造与工程安全全国重点实验室团队在《Frontiers of Engineering Management》发表研究,提出基于深度强化学习(DRL)的矿山土方设备自动化调度方法,通过融入时空安全约束,在提升作业效率的同时,显著降低机械碰撞风险。

矿山安全的“隐形杀手”:传统调度的致命短板
矿山土方工程是资源开发的关键环节,但大型机械协同作业的安全风险长期居高不下。数据显示,2008至2021年美国矿山事故中,83起死亡案例直接归因于安全规则违反,其中机械碰撞和操作盲区是主要诱因。传统调度依赖人工经验,难以实时协调多台设备的时空关系:比如卡车卸载与推土机作业的时间间隔不足,或相邻作业线机械距离过近,都可能引发事故。

我国内蒙古呼伦贝尔某煤矿的实地调研显示,现有调度模式下,部分卡车承担了60%以上的运输任务,而其他设备利用率不足30%,这种“忙闲不均”不仅降低效率,还因机械聚集增加安全隐患。如何在保证安全距离和时间间隔的前提下,实现设备最优调度,成为行业痛点。

DRL+时空约束:AI如何当好“空中交通管制员”?
研究团队提出的解决方案,核心是将深度强化学习与时空安全约束相结合,构建“智能调度大脑”。简单来说,AI agent(智能体)通过学习历史调度数据,动态决策每台设备的作业顺序和路径,同时遵守两项关键约束:

空间约束(X轴):相邻作业线(平行的土方处理区域)禁止同时作业,避免机械横向碰撞。这就像高速公路上的车道隔离,确保平行车流互不干扰。

时间约束(Y轴):同一作业线内,后一台设备需在前一台离开后才能进入,确保纵向安全间隔。例如,卡车卸载完成后,需等待15秒以上,推土机才能进入作业区域。

为实现这一目标,团队采用图神经网络(GIN)编码作业任务特征,结合多层感知机(MLP)解码设备选择策略,通过多智能体PPO算法优化调度决策。模型在训练中不断模拟“违规-修正”过程,最终学会在安全约束下最小化总作业时间(makespan)。

实验验证:效率提升15%,安全违规降60%
在不同规模的调度测试中,该方法展现出稳定性能。小型场景(5台设备)训练1000批次即可收敛,总作业时间约403分钟;扩展到20台设备的大型场景,虽初始损失较高,但通过持续学习仍能实现1786分钟的高效调度,且安全约束仅使总时间增加不到5%。

与传统算法对比更显优势:在10×10规模测试中,DRL方法的作业时间为939分钟,较FIFO(1139分钟)、LWKR(1314分钟)等传统调度算法缩短15%-30%。更关键的是,时空约束使安全违规事件减少60%以上——在内蒙古煤矿的实地测试中,卡车机械利用率从之前的“ Machine 6独占40%任务”变为各设备均衡分配,其中Machine 3的作业频次从5次提升至8次,总作业时间增加24%,彻底告别“忙闲不均”。

未来方向:动态环境与多场景适配
尽管成效显著,该方法仍有改进空间。目前模型主要针对静态调度,未充分考虑粉尘、能见度等动态环境因素,且作业线假设为平行直线,复杂地形适配性待提升。团队表示,下一步将引入实时传感数据,开发动态调度模型,并探索多矿区协同调度方案。

随着我国矿山智能化转型加速,这类AI调度技术有望在大型煤矿、金属矿推广应用。或许不久后,矿山土方作业现场将不再需要人工“喊号子”协调,而是由AI“调度员”实时指挥机械高效安全作业。

评论
包庆华
太傅级
2025-07-24