研究文章

基于智能网络的最优路线选择决策

表2

符号。

符号 参数

基本收入
1 矿业收入在阳光明媚的一天
2 矿业收入在炎热的一天
p 晴朗的天气的概率
1 数学期望行走的消费
的天数
t 比赛的日子
j 在地图上的位置
地图上的点的数量
状态
一个 一组动作
Psa 转移概率
R 奖励函数
Vf 值函数
π(年代,) 行动的价值功能
ω 可行域
x 决策变量
µ 这事件发生的次数
p 事件的概率发生在每一个测试