汽车|燃料电池汽车能量管理动态规划算法的误差累积问题及解决方法( 四 )


汽车|燃料电池汽车能量管理动态规划算法的误差累积问题及解决方法
本文插图

u k (i,1),u k (i,2),u k (i,3)为可行解,则其必须满足状态转移条件,即
汽车|燃料电池汽车能量管理动态规划算法的误差累积问题及解决方法
本文插图

同样,以s k (i+1)和s k (i-1)为初始状态到达阶段N时的最优指标值也可以得到,记为J k (i+1),J k (i-1)?当获得阶段k以所有可行的SOC为初始状态时的最优指标值后,取最小值即可获得阶段k到阶段N的最优指标值和对应的最优决策,即
计算过程中保存每阶段每个可行状态变量所对应的最优氢耗量和最优决策,便于正向生成过程调用?初始状态所对应的最优耗氢量J 1 即为逆向计算过程所得的理论最优总耗氢量?
3 离散动态规划算法的误差累积
为说明离散动态规划算法在计算过程中误差的累积,用如图8所示的5阶段决策过程来阐述?图中实线小圈表示离散的标准状态变量值,虚线小圈表示动态规划算法计算过程中得到的实际状态变量的值,A,B,C,D,E,F为6个状态,每个状态的离散标准状态变量数量如图所示?图中黑色虚线箭头表示假设的动态算法计算过程中记录下来的最优标准状态轨迹,即最优标准状态轨迹为A1→B4→C5→D4→E5→F1?灰色虚线箭头表示以C4为初始状态时的最优标准状态轨迹?黑色实线箭头表示动态规划算法在对应标准离散状态值下此阶段最优决策所引起的状态值变化过程,比如从B4出发的黑色实线箭头表示B4状态对应的最优决策所引起的状态变量的变化?点划线箭头表示逆向计算过程记录下来的最优状态轨迹,灰色实线箭头表示正向生成最优策略过程的实际最优状态轨迹,两者之间有一定的偏差,下面将介绍偏差的产生缘由?
汽车|燃料电池汽车能量管理动态规划算法的误差累积问题及解决方法
本文插图

图8 离散动态规划算法误差累积过程示意图
初始状态A1在第一阶段最优决策的作用下状态变量到达B'的位置,B'与B4的偏差为h 1 ,h 1 <0.001/2=0.0005,因此,在动态规划逆向计算过程中,算法判定状态在最优决策下状态A1转移到状态B4,而在动态规划正向生成过程中,最优决策下状态A1转移到了B'而非B4,两者的偏差为h 1 ?在第二阶段的决策过程中,逆向计算过程以B4为初始状态计算,而正向生成过程则以B'为初始状态计算,误差由此产生?逆向计算过程中状态由B4转移到C″,正向生成过程状态由B'转移到C',C″与C5的状态变量值的偏差为h 2 ,且h 2 <0.0005,因此逆向计算过程判定此阶段的最优标准状态轨迹为B4→C5,C'与C5的状态变量值偏差为累积的误差,h=h 1 +h 2 >0.0005,在这种情况下,C'与C4的偏差为Δh=0.001-h<0.0005,正向生成过程会判定下一时刻按照C4所对应的最优决策运行,对应状态变量转移为C'→D',而逆向计算过程会按照C5所对应的最优决策运行,对应状态转移为C'→D″,状态变量最优轨迹在此产生偏差?因此,如果按照逆向计算的结果,实际的最优状态变量轨迹为A1→B'→C'→D″→E″→F″,但是由于误差的积累,正向生成过程的状态变量轨迹为A1→B'→C'→D'→E'→F'?
对于离散动态规划算法误差累积的现象,可在正向生成策略时采取以下处理方法:在每一阶段根据实际的SOC值自动搜索离其最近的标准离散值,并将其所对应的最优决策作为此时的最优决策,计算下一阶段的实际SOC值,用于获取下一阶段的最优决策?所获得的最优决策序列组成最终的能量管理控制策略,可以预见的是,由于状态变量误差累积现象的存在,此方法所获得能量管理控制策略和SOC轨迹与逆向计算时所获得值有一定差别?
在以上5阶段决策过程中,采用此方法所对应的SOC轨迹为A1→B'→C'→D'→E'→F',与逆向计算所对应的轨迹实际的最优状态变量轨迹A1→B'→C'→D″→E″→F″有一定的偏差?
4 仿真分析
本文中所用车辆系863项目中某一燃料电池轿车,其整车主要参数如表2所示?


推荐阅读