计算机集成制造系统
計算機集成製造繫統
계산궤집성제조계통
COMPUTER INTEGRATED MANUFACTURING SYSTEMS
2014年
12期
3000-3010
,共11页
知识化制造%航空发动机%装配%自适应调度%Q学习
知識化製造%航空髮動機%裝配%自適應調度%Q學習
지식화제조%항공발동궤%장배%자괄응조도%Q학습
knowledgeable manufacturing%aero-engine assembly%adaptive scheduling%Q-learning
针对不确定生产环境下航空发动机装配的自适应调度问题,结合强化学习的实时性特点和知识化制造系统的自适应特征,提出用于解决航空发动机装配问题的双层Q学习方法.上层Q学习着眼于局部,学习合适的分派规则并将作业分配到并行机器,从而最小化设备空闲和平衡机器负荷;下层Q学习着眼于全局,学习最优的调度策略用来对分配到机器的工序进行调度,以最小化作业整体提前期.采用基于函数逼近的Q(λ)学习方法对值函数进行更新,通过合理地定义强化学习问题三大要素:动作、状态和回报函数,将航空发动机自适应装配调度问题转化为强化学习问题.仿真实验结果表明,通过在上下两层适时选取调度规则,采用双层Q学习方法比单层Q学习在总体上具有更好的优势,调度结果远优于单个规则,显示出了良好的自适应性能.
針對不確定生產環境下航空髮動機裝配的自適應調度問題,結閤彊化學習的實時性特點和知識化製造繫統的自適應特徵,提齣用于解決航空髮動機裝配問題的雙層Q學習方法.上層Q學習著眼于跼部,學習閤適的分派規則併將作業分配到併行機器,從而最小化設備空閒和平衡機器負荷;下層Q學習著眼于全跼,學習最優的調度策略用來對分配到機器的工序進行調度,以最小化作業整體提前期.採用基于函數逼近的Q(λ)學習方法對值函數進行更新,通過閤理地定義彊化學習問題三大要素:動作、狀態和迴報函數,將航空髮動機自適應裝配調度問題轉化為彊化學習問題.倣真實驗結果錶明,通過在上下兩層適時選取調度規則,採用雙層Q學習方法比單層Q學習在總體上具有更好的優勢,調度結果遠優于單箇規則,顯示齣瞭良好的自適應性能.
침대불학정생산배경하항공발동궤장배적자괄응조도문제,결합강화학습적실시성특점화지식화제조계통적자괄응특정,제출용우해결항공발동궤장배문제적쌍층Q학습방법.상층Q학습착안우국부,학습합괄적분파규칙병장작업분배도병행궤기,종이최소화설비공한화평형궤기부하;하층Q학습착안우전국,학습최우적조도책략용래대분배도궤기적공서진행조도,이최소화작업정체제전기.채용기우함수핍근적Q(λ)학습방법대치함수진행경신,통과합리지정의강화학습문제삼대요소:동작、상태화회보함수,장항공발동궤자괄응장배조도문제전화위강화학습문제.방진실험결과표명,통과재상하량층괄시선취조도규칙,채용쌍층Q학습방법비단층Q학습재총체상구유경호적우세,조도결과원우우단개규칙,현시출료량호적자괄응성능.