电动汽车能源管理与分配方法

作者: 张光林,黄淦,赵萍 CNPIM 2020年04月07日

发明人:张光林,黄淦,赵萍
专利权人:东华大学
公开日:2020-04-07
公开号:CN110962684A
专利类别:发明公开
下载地址:见页末

摘要:本发明涉及一种电动汽车能源管理与分配方法,一个实施例的方法包括:建立电动汽车的系统模型,对汽车不同的工况进行量化,确定能源管理系统的状态空间;确定优化目标函数,使得电动汽车在一个行驶周期内的耗能最少;使用强化学习的方法对目标函数进行优化,确定马尔可夫决策过程的状态转移概率及回报函数;在多次工况运行后生成“状态-动作映射”Q矩阵,并对其不断进行更新,获得最佳的能源管理策略。本实施例方案提高了电动汽车在行驶过程中的能源利用效率。

1.一种电动汽车能源管理与分配方法,其特征在于,包括以下步骤:步骤1、将电动汽车的电力设备分为高压供电网网络、低压供电网络、充电网络三大类,其中:高压供电网络包含热管理系统和驱动系统;低压供电网络用以支持全车低压电子部件的用电;充电系统用于从电网向车载电池补充能量,建立电动汽车能源系统模型如下式(1)所示,根据现实中复杂多变的汽车运行工况,对汽车不同的工况进行量化,确定能源系统的状态空间: 式(1)中,ECR表示能源消耗率;kAC(t)表示热管理系统功率系数,表示将高压供电系统分配给热管理系统的功率占热管理系统峰值功率的比例;T表示一个行驶周期时长;Pmot(t)表示向驱动系统输出的最大功率;PHV(t)表示可被能源管理系统所分配的高压供电网络的总功率;PAC-max(t)表示电动汽车的制冷设备的峰值功率;Pdrv(t)表示电动汽车的驾驶员所期望的驱动系统实际输出功率;步骤2、根据步骤1建立的电动汽车能源系统模型确定优化目标函数,使得电动汽车在一个行驶周期内的耗能最少,将求解ECR最小化的问题转化为求解0~T时间段内电动汽车在[0,T]时间段内总电量消耗E(t)最小化的问题,E(t)如下式(2)所示: 式(2)中,是驱动系统所消耗总能量;是热管理系统所消耗的能量;是车辆低压供电网络所消耗的能量,PLV(τ)表示低压供电网络所需的总功率;Eloss(ΔT(t))是0~t时间段内电池组温度变化而耗散的能量;步骤3、使用强化学习的方法对步骤2确定的目标函数进行优化,强化学习模型采用Markov决策过程;在车辆运行过程中,使用Q-learning算法对能量分配策略进行学习和优化,Q-learning算法其Q矩阵采用以下的策略不断更新,以得到更为节能的能源分配策略使得车辆的能源管理系统拥有一个状态动作值矩阵,即Q表,Q表内的每一项Q(s,a)为状态s与动作a的映射关系,当电动汽车能源管理系统在某一状态s下进行能量分配时,Q表采用式(3)的方法进行更新:Q(s,a)t+1←Q(s,a)t+α[rt+γ maxa(t+1)Q(s,a)t+1-Q(s,a)t] (3)式(3)中,Q(s,a)t是在采取动作a之前智能体对映射(s,a)的估计;rt+γmaxa(t+1)Q(s,a)t+1是Q(s,a)的现实值;α是学习率,表示Q值的过去值和新获得奖励的加权关系;γ∈[0,1]是衰减系数,反应未来奖励对当前决策的重要性,γ越大表示智能体在采取动作a是越倾向于考虑未来奖励的影响;步骤4、当Q(s,a)t收敛于最优映射时,认为系统已经完成了学习过程,即Q-learning算法得到的最优策略为: 式(4)中,arg max是对函数求参数的函数,即求得使得策略π(s)最大的Q表映射,对于离散性的马尔可夫决策问题,这是使得系统策略最佳的必要条件,即对于环境所处的任意状态s,能量管理系统总能选择使得Q值最大的动作a*。
内容未完全展示,请下载附件查看


下载地址:限时免费下载(右键另存为)
如下载链接失效,请联系管理员。




点击加载全文

本文阅读量:

声明:本文由用户投稿,信息来源于东华大学,仅用于学习和技术交流,观点仅代表作者本人,不代表CNPIM立场。如有侵权或其他问题,请联系本站处理。

技术支持:CNPIM.COM