一种基于深度强化学习的优化
芯片布局系统及方法,包括:数据预处理模块、策略网络模块、奖励预测模块和参数更新模块,其中:数据预处理模块读取并解析pl、net文件,将其中的网表图信息转换为智能体的初始状态以及奖励函数;策略网络模块通过卷积神经网络和图神经网络分别得到分别包含粗细粒度的全局嵌入特征与结点嵌入特征,将两个网络分别得到的特征向量融合,最终预测出当前时刻行为,即元件可能的放置位置的概率分布;奖励预测模块在网表图内的所有元件都放置完毕后,对布局结果进行总体评价,估计得到线长和拥塞程度指标反馈给智能体;参数更新模块根据从经验池中进行采样得到的样本采用近端策略优化算法周期地更新神经网络的参数,实现更好的拟合效果。
声明:
“基于深度强化学习的优化芯片布局系统及方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)