一种基于强化学习的Baxter机械臂轨迹跟踪控制方法,首先对Baxter机械臂前三个关节进行系统辨识,确定其连续时间的状态空间方程并将之离散化,得到离散的状态空间模型,该步骤仅用于在仿真时获取机器人前三个关节下一时刻的位置和速度跟踪误差;首先给定机械臂前三个关节一个初始状态,按照固定的采样时间测量并记录三个关节下一时刻的位置和速度跟踪误差,对采集到的位置和速度信息预处理之后使用递归的最小二乘法计算最优控制策略所对应的权值矩阵H,最后根据权值矩阵计算出下一时刻的最优反馈控制。本发明自动适应模型改变带来的模型误差,提高机器人在日常使用中的准确性。
本发明公开了一种多代理强化学习合作任务下的奖励函数建模方法,包括:每个代理独立观测环境状态,输入各自的策略网络,得到各自的动作决策;在模拟环境执行各代理的动作,得到每个代理各自的奖励;将各代理之间的交互建模为一张无向图,使用此图计算出每个代理的奖励的加权总和;使用加权后的奖励训练代理的策略网络。该方法能够对多个代理与环境交互后的结果进行整合,同时建模出的无向图能够起到可信度赋值的效果,给训练算法提供更加精准的奖励描述,帮助多代理系统在合作任务上学习到更好的策略。
本发明公开了一种基于多智能体强化学习和双层策略分配的多区域热电协调控制方法,包括:建立多区域热电联合系统数字孪生模型;创建多个区域智能体,并建立多个区域智能体间的通信机制;设计基于多智能体均衡学习算法的多区域均衡控制器,包括奖励函数、均衡选择函数和资格迹的选取;通过多区域均衡控制器对各个区域进行状态估计、更新资格迹、奖励值观测和更新状态‑动作值函数操作后,再进行多个区域部分信息的交互,在线寻求各区域最优均衡总控制策略;将区域热电联合系统中每台机组作为一个机组智能体,以各机组的爬升时间作为一致性变量,采用一致性算法将各区域总控制策略分配给各个机组,实现区域内各机组之间的协调控制。
本发明公开了山核桃功能器官和林地土壤C、N、P化学计量相关性确定方法,此确定山核桃季节性精准施肥措施,包括:采样;土壤指标和植株全氮全磷含量测定;采用SPSS软件进行数据处理。采用本发明的方法,可以确定,叶片和细根的N、P含量与土壤N、P含量间没有明显的相关性,这说明山核桃植株对土壤N、P的变化具有内稳态平衡机制。叶物质的积累与叶片的C∶P比呈现极显著相关,由此我们可以推断P对山核桃碳物质的积累,即植株的生长发育乃至结实起着极其重要的作用。
本发明涉及一种电化学耦合上流式厌氧生物反应装置及使用方法。该装置包括上流式厌氧生物反应器筒体、生物电极系统、恒温水浴系统,生物电极系统为所述的上流式厌氧生物反应器筒体内微生物体系提供电子供体,恒温水浴系统为所述的上流式厌氧生物反应器筒体提供恒温水浴;上流式厌氧生物反应器的污泥区设置一对可调电极面积和电极间距的生物电极,生物电极通过金属导线与反应装置主体外部的直流电源相连接,电极电压、回路电流以及阴极电势均通过装置主体外部连接的直流电源和电表进行实时监测和调控。本发明加速厌氧污泥颗粒化,实现反应器的快速启动和对氯代硝基苯的稳定降解,并且结构可靠、易加工、能耗小、运行稳定。
本发明公开了一种基于深度强化学习的分层决策方法,先初始化决策对象的战术决策层智能体和意图识别层智能体,意图识别智能体采用深度循环Q网络根据输入的意图识别观测信息,生成意图识别层行为,根据意图识别层行为选择战术决策层智能体;战术决策层智能体采用深度确定性策略梯度算法,根据战术决策观测信息计算战术决策层智能体的行为。本发明战术决策层和意图识别层在训练时是相互独立的,在决策时是相互联系的,避免了同时训练难以收敛的问题,能够加快训练时的算法收敛速度,进而提升智能体整体决策能力。
本申请涉及一种基于强化学习的无超调PID控制器参数整定方法。本申请通过构造学习智能体,观测当前状态数据输入到动作神经网络得到动作参数,之后再观测下一状态的数据以及奖励。当前状态,动作,转移后状态,奖励值,四个元素组成了状态转移元组,每一次被控对象执行动作时都会进行一次状态转移,并将状态转移元组存入经验池内。智能体抽取一定量的状态转移元组,用于训练动作网络和评价网络。重复训练动作网络和评价网络直到参数收敛,保存参数权重。最终智能体根据当前状态数据输出最优PID参数提供给PID控制器,使得被控对象的状态值在无超调的基础上以较快的速度达到设定值,进而实现对控制器PID参数无超调整定的方面改进。
本发明公开了一种外周血中抗NY?ESO?1自身抗体的检测方法,所述方法以NY?ESO?1重组蛋白为抗原制备抗NY?ESO?1抗体,将抗NY?ESO?1抗体与胶乳微球偶联制备抗体偶联物,然后将NY?ESO?1重组蛋白混合液a与外周血待测样品混合反应5?10min,最后再加入抗体偶联物,检测546nm处吸光值,根据标准曲线获得样品中抗NY?ESO?1自身抗体浓度;本发明还提供一种外周血中抗NY?ESO?1自身抗体的化学发光检测方法。本发明所述外周血中抗NY?ESO?1自身抗体的检测方法可在生化分析仪和化学发光免疫分析仪等大型自动化仪器上进行大样本自动化检测,灵敏度1?10ng/mL。
本发明公开了一种基于均相化学发光技术的快速诊断试纸条,包括PVC底板、样品垫、玻璃纤维垫、包被C线以及T线的硝酸纤维素膜、吸水垫;玻璃纤维垫中包被有偶联了特异性抗体Ⅰ的供体微球;硝酸纤维素膜的T线为偶联了特异性抗体Ⅱ的受体微球,硝酸纤维素膜的C线为偶联了能与所述特异性抗体Ⅰ相结合的特异性抗体Ⅲ的受体微球;所述特异性抗体Ⅰ和特异性抗体Ⅱ均能与待测蛋白特异性结合,且结合在待测蛋白质的不同表位。该诊断试纸条具有特异性强、灵敏度高、快捷、简便、可定量,适合快速诊断等特点。
本发明公开了一种多代理强化学习合作任务场景下的代理间交换知识的方法,包括:每个代理独立观测环境,使用神经网络将环境进行编码,提取相关的特征向量;所述代理将各自的特征向量交由中心站(使用循环神经网络实现)进行整合,所述中心站为各代理生成新的知识编码并进行分发;所述代理接收到新的知识,整合旧有的环境特征向量,然后输入神经网络策略进行决策;上述所有神经网络的参数学习是端到端进行的。该方法能够对多个代理所观测的知识进行整合,帮助多代理系统在合作任务上学习到更好的策略。其中,代理的数目不受限制。
本发明公开了一种水体中壬基酚聚氧乙烯醚的气相色谱-质谱检测方法,属于水环境污染物的检测技术领域,包括膜过滤预净化、固相萃取富集及洗脱,洗脱液经特殊化学处理后,用有机溶剂萃取,然后对有机相进行气相色谱-质谱检测,与标准曲线比较,定量得到壬基酚聚氧乙烯醚浓度值。本发明预处理简单、易于操作、线性范围宽、富集倍数高、重现性较好、定性准确,无须采用昂贵的液相色谱-质谱仪,能够快速分析水体中壬基酚聚氧乙烯醚浓度。
本发明能够提供基于深度强化学习的机器人导航方法及系统、设备、介质。该方法包括:获取实时观测数据,以构建环境地图和确定机器人的当前位置和目标点相对位置。生成导航动作信息,依据导航动作信息控制机器人从当前位置向目标点相对位置移动。经过第一设定时长后判断机器人是否到达目标点相对位置。根据未到达目标点生成新导航路径,并控制机器人沿着新导航路径移动,以及再经过第二设定时长后返回获取实时观测数据步骤;或根据到达目标点结束导航。本发明能够在没有初始地图的环境下控制机器人在导航过程中灵活地避开静态和动态障碍物,计算量较小。本发明创新地结合了全局信息和局部信息,有效避免了常规机器人在局部区域徘徊的问题。
本实用新型提出了一种压力蒸汽灭菌化学指示卡,包括指示卡带、第一标准色块、指示剂色块、第二标准色块、翻折部和刻度测量边,所述指示卡带的正面设有刻度测量边,所述指示卡带的正面设有指示剂色块,所述指示剂色块的一侧设有第一标准色块,所述指示剂色块的另一侧设有第二标准色块,所述第二标准色块位于指示卡带的背面,所述第二标准色块内开设有观察孔,所述指示剂色块与第二标准色块之间设有翻折部,所述第二标准色块通过观察孔沿翻折部翻转与指示剂色块相配合,增加刻度测量边,可以充当医用尺,便于携带,采用可翻转式标准色块,通过观察孔查看指示剂色块与标准色块的颜色对比,更为直观。
本实用新型公开了一种防止挥发的化学实验室量杯,包括量杯,所述量杯顶部的一侧设置有第二出水口,且量杯的一侧设置有量表盘,所述量杯远离量表盘的外侧设置有防护垫,且量杯的顶部设置有与量杯杯口相配合的量杯盖,所述量杯的内部设置有与其相配合的漏斗,且漏斗的底部设置有连接管。本实用新型通过设置的漏斗和真空层,防止溶液的挥发,从而在测量溶剂时使测量结果更准确,通过设置的量杯盖和密封圈相互作用,既可以防止配置溶液时因摇晃导致溶液洒落,又可以长时间密封贮存溶液,通过设置的过滤网可以过滤水中的杂质,可以更好地配置纯净溶液。
本发明涉及一种基于电化学特征的单体锂离子电池三维热模型,包括步骤:1)单体锂离子电池三维模型建立方案;2)单体锂离子电池径向热模型建立;3)单体锂离子电池热模型方程建立。本发明的有益效果是:本发明对单体锂离子电池进行循环老化实验,实验在不同温度环境下进行;其中,参考性能测试分别在15℃,25℃,30℃温度环境下进行,并采用恒流恒压充电模式;循环老化测试分别在25℃和50℃温度环境下进行,并采用恒流充电、恒压充电和恒流放电模式;每一次实验静置时间为6小时。
本实用新型公开了一种自动化电化学发光成像仪,包括机箱、控制显示主体、观测主体、自动开门单元和自动定位单元;机箱的上端安装有控制显示主体,观测主体安装在机箱的内部上端,自动开门单元安装在机箱上,自动定位单元包含左右移组件、前后移组件、滑框、滑块、电动伸缩杆和电解主体,所述滑框与机箱的内部底侧横向滑动,所述滑框安装左右移动力组件上,所述滑块与滑框横向滑动连接,滑块安装前后移动力组件上,所述滑块的上端连接电动伸缩杆的底端,所述电解主体安装在滑块的上端;其中,电动伸缩杆的输入端通过外部控制开关组与外部电源的输出端电连接,自动操作,操作便捷,大大提高了工作效率。
本发明公开了一种基于值分解和注意力机制的多智能体强化学习方法,包括:(1)构建学习环境,学习环境包括多个智能体,每个智能体包括Critic网络和Actor网络;(2)初始化Critic网络和Actor网络参数;(3)将每个智能体的动作反馈给游戏环境,将当前观测值、动作、奖励以及下一时刻观测值存入经验池中;(4)计算局部Q值函数和全局Q值函数,并对Critic网络进行参数更新;(5)计算每个智能体在当前观测值下采取当前动作所产生的优势函数,对Actor网络进行参数更新;(6)Critic网络和Actor网络的参数更新完毕后,利用训练完成的智能体在游戏环境中执行动作。本发明的方法在复杂的异构部分可观测场景中,性能效果更好且收敛速度更快。
本发明公开了一种凝汽器低腐蚀高净度化学清洗方法,该方法的清洗流程为:初步冲洗及泄漏检查→加入杀菌粘泥剥离剂清洗软垢→加入Lan-826多用酸洗缓蚀剂和还原剂进行缓蚀处理→加入GJ-2E除锈除垢剂以及Lan-826多用酸洗缓蚀剂清除硬垢→用碱洗中和剂中和→钝化或预膜。本发明的有益效果是:充分清洁凝汽器生物粘泥;所采用的缓蚀方法降低了酸洗清洗剂对凝汽器管道的腐蚀,提高了凝汽器管道的使用寿命;同时所采用的酸洗清洗剂充分净化管道硬垢,管道净化更彻底;清洗时间短、除垢率高、劳动强度低、工艺简单,清洗之后的机组运气参数基本达到铭牌出力。
本发明公开了一种基于时间分配和强化学习的交通信号灯控制方法,包括:(1)配置仿真路口环境以及车流数据到交通模拟器,搭建智能体网络;(2)智能体网络根据路况状态产生下一信号周期的动作,并交由交通模拟器仿真一个信号周期;(3)把上一信号周期的经验存到重演缓存;(4)从重演缓存中采样经验训练智能体网络,并判断仿真的步数是否达到预设值,如果没有达到,则返回步骤(2),否则执行下一步;(5)重置交通模拟器并对智能体网络进行测试,完成测试后进行交通信号灯控制的应用。利用本发明,可以显著提升交通效率,能更容易地应用到实际道路上。
本发明公开了一种基于强化学习的视频图像编码压缩效率提升方法,针对不同图像内容分块最优化关键编码策略参数。创建分别用于预测策略值,和判别策略值好坏的神经网络,即预测网络和判别网络。预测网络作为编码器的前处理模块,输入图像的原始像素值,输出图像各个分块的最优化策略参数,不需要编码器的反馈。编码结果评分是在对整帧视频图像,或者整段视频图像编码完成之后,得到的压缩效率综合评分。整个环节与编码器耦合弱,易于实施,可以与主流视频或图像编码标准结合,有效提升编码压缩效率。本发明在编码时只需要预测网络执行决策过程,速度较快,并且具有较高的鲁棒性。
本发明公开了一种基于近红外光谱波数K均值聚类的烟草化学值定量方法,包括如下步骤:建立训练集和测试集,采集训练集中所有烟草样本的近红外光谱,以及目标成分含量;采用K均值聚类对训练集中各烟草样本的近红外光谱的波数进行聚类;每一次聚类完成后,利用PLS分别建立各子类谱段与目标成分含量的关系模型,并计算各关系模型的交叉验证均方根误差;以各关系模型对应的交叉验证均方根误差之和最小的聚类数作为最优聚类数,并将最优聚类数对应的各关系模型进行加权求和,得到全谱模型;采集测试集中各烟草样本的近红外光谱,并依据全谱模型,得到测试集中各烟草样本的目标成分含量。本发明与现有的PLS方法相比,能显著降低模型的预测误差。
本发明提供了一种基于连词标记和强化学习的自然语言推理方法,包括以下步骤:(1)在连词预测任务上训练一个连词预测模型;(2)在自然语言推理模型中,输入前提和猜想文本并使用编码器对其编码,得到表达矩阵;(3)将连词预测模型的编码器嵌入到自然语言推理模型中,将步骤(2)编码过程中得到的前提和猜想的词向量送入预训练好的编码器并输出表达向量;(4)将自然语言推理模型的编码器和嵌入的连词预测模型中的编码器在注意力机制中交互,得到一个注意力向量;(5)将注意力向量转化为概率分布并输出结果。利用本发明,通过迁移其他监督学习任务所学到的知识,大大提升了在大规模数据集上进行自然语言推理任务的准确率。
本发明公开了一种金属有机框架荧光探针及其在硫化氢检测中的应用,该金属有机框架荧光探针的制备方法包括如下步骤:(1)制备合成含有未配位羧基的UiO?66?(COOH)2;(2)利用搅拌加热,将金属离子Eu3+和Cu2+成功配位UiO?66?(COOH)2的未配位羧基上,得到荧光探针Eu3+/Cu2+@UiO?66?(COOH)2。本发明的金属有机框架荧光探针稳定性较好,该探针可用于硫化氢快速识别、定量检测,而且具有较高的选择性和较好的抗干扰能力;可以实现比率荧光分析,大大消除检测条件差异对结果的影响,提高检测的灵敏度。可用于环境、生物、化学等样品中硫化氢的检测。
本发明公开了一种基于荧光光谱的苹果黄酮含量无损检测方法,该方法通过使用特定波段波长的激发荧光照射苹果表皮,使用光谱仪采集反射的荧光光谱,然后通过传统的化学方法测定相应区域的黄酮含量,利用主成分分析法分析采集到的荧光光谱与黄酮含量直接的关系,建立一个用于预测苹果黄酮含量的预测模型,根据该预测模型分析待测苹果的荧光光谱得到其黄酮含量,实现苹果黄酮含量的无损检测方法。与传统的化学检测相比,不需要配置试剂与复杂的操作,只需要通过LED进行荧光激发,就可以实现黄酮含量的检测。
本发明公开了一种具有稳固结构的化学灌浆混料罐,包括混料罐体和稳固架,混料罐体位于左右两个稳固架之间,混料罐体的左右两侧均连接有安装架,安装架与稳固架活动连接,稳固架包括支架框和底座,支架框与底座可调节连接。本发明的安装方法,包括如下步骤:1)稳固架的安装;2)安装架的安装;3)混料罐体的放置;4)混料罐体的放置;5)混料罐体角度的调节。本发明通过稳固架实现混料罐体的安装固定,有效保证混料罐体的放置稳固性,而且通过安装架的配合对混料罐体的放置角度进行调整,同时还对混料罐体的高度进行调整,从角度和高度对混料罐体的安装位置进行调节,便于混料罐体与管道的连接、混料罐体内物料的放置或内部的检修清洗等。
本发明公开的混纺织物组分的拉曼光谱定性检测方法,通过直接测取织物的激光拉曼光谱,并结合光谱预处理技术与特征峰提取、识别与分析方法,定性地鉴别织物的组分归属。该检测方法属纯粹的光学方法,需要样品量少、无需前处理,测试时间短,测试过程对样品无损,测试结果准确,不产生化学污染物,适宜对各类混纺织物组分的定性检测。
本发明公开了一种基于分层强化学习的群体对抗系统,包括上层宏观策略网络和下层微观动作网络;所述上层宏观策略网络包括多个智能体采用的多个策略网络和混合网络,每个策略网络用于依据当前时刻的观测状态和前多个时间步的子目标计算输出当前时刻的预测子目标;混合网络用于根据全环境状态信息、各子智能体采用策略网络输出的预测子目标计算输出宏观总目标作为下一时刻各智能体的子目标;所述下层微观动作网络包含多个智能体采用的多个DQN,每个DQN用于根据当前时刻的观测状态和当前时刻的子目标计算输出决策动作。该系统中智能体能够在兼顾宏观总目标和个体子目标的情况下生成更准确决策,适用于多智能体协同博弈对抗的游戏环境中。
本发明涉及分析化学领域,公开了一种检测发酵乳中乳酸菌数的方法。该方法将发酵乳标准品用UHT乳稀释5-20倍,然后加入刃天青反应,用RGB颜色信息采集仪器记录发酵乳标准品终点R值与起始R值的R差值,并建立R差值X与乳酸菌菌落总数Y之间的标准方程;将发酵乳标准品替换为发酵乳待测样品,在相同的检测环境下,记录发酵乳待测样品的R差值并代入获得的标准方程中,检测出发酵乳待测样品中的乳酸菌数。本发明利用UHT乳对发酵乳样品进行稀释调整,使样品符合刃天青还原法的反应条件和RGB颜色信息采集原理,同时保证了样品间具有相同的稀释倍数,与标准方法检测结果无显著差异,在快速检测的基础上极大的保证了结果的准确性。
本发明提供了一种化学反应釜全自动加冰装置的控制方法。解决了人工投冰操作下,温度及冰量均无法精准掌控,造成品质不统一,成色降低的问题。本发明包括以下步骤:1)、输入各项设定的参数值;2)、感测反应温度;3)至5)、判断感测温度超出设定值,控制出冰,且冰体通过相应加工、称重及输送程序,最终投放入反应罐内参加工艺反应;6)、在加冰过程中,监控反应温度的波动,及时调整加冰速度和量值。本发明根据时刻温度值随时操控加冰时机和加冰量,从而利用机械感控及机械动作实现机械式自动化测温、加料作业,达到提高化工反应温度的精准掌控及配料比例的精准添加,进而使得批量性生产的染料品质相统一,确保产品优良成色的稳定性。
本发明公开了一种基于特异性单克隆或多克隆抗体建立的NY‑ESO‑1抗原检测方法,所述方法以NY‑ESO‑1重组蛋白为抗原制备特异性的抗NY‑ESO‑1抗体。将抗NY‑ESO‑1抗体与胶乳微球偶联制备抗体偶联物,然后将上述偶联物与外周血待测样品混合反应5‑10min,最后在检测546nm处吸光值,根据标准曲线获得样品中NY‑ESO‑1抗原浓度;本发明还提供一种化学发光检测方法,采用直接发光模式。本发明所述外周血中NY‑ESO‑1抗原的检测方法可在生化分析仪和化学发光免疫分析仪等大型自动化仪器上进行大样本自动化检测。本发明方法检测灵敏度0.01‑10ng/mL。
中冶有色为您提供最新的浙江杭州有色金属分析检测技术理论与应用信息,涵盖发明专利、权利要求、说明书、技术领域、背景技术、实用新型内容及具体实施方式等有色技术内容。打造最具专业性的有色金属技术理论与应用平台!