Python|Python 还能实现哪些 AI 游戏？附上代码一起来一把( 二 ) |人工智能|算法|

2、行动决策机制：
首先在程序框架中设定不同的行动作为训练对象
# 行动paddle_1(训练对象)if action[0] == 1:self.paddle_1_speed = 0elif action[1] == 1:self.paddle_1_speed = -self.paddleSpeedelif action[2] == 1:self.paddle_1_speed = self.paddleSpeedself.paddle_1_pos = self.paddle_1_pos[0], max(min(self.paddle_1_speed + self.paddle_1_pos[1], 420), 10) 接着设置一个简单的初始化决策。根据结果判断奖励和惩罚机制，即球撞到拍上奖励，撞到墙上等等惩罚：
其中代码如下：
# 行动paddle_2(设置一个简单的算法使paddle_2的表现较优, 非训练对象)if self.ball_pos[0] >= 305.:if not self.paddle_2_pos[1] == self.ball_pos[1] + 7.5:if self.paddle_2_pos[1] < self.ball_pos[1] + 7.5:self.paddle_2_speed = self.paddleSpeedself.paddle_2_pos = self.paddle_2_pos[0], max(min(self.paddle_2_pos[1] + self.paddle_2_speed, 420), 10)if self.paddle_2_pos[1] > self.ball_pos[1] - 42.5:self.paddle_2_speed = -self.paddleSpeedself.paddle_2_pos = self.paddle_2_pos[0], max(min(self.paddle_2_pos[1] + self.paddle_2_speed, 420), 10)else:self.paddle_2_pos = self.paddle_2_pos[0], max(min(self.paddle_2_pos[1] + 7.5, 420), 10)# 行动ball# 球撞拍上if self.ball_pos[0] <= self.paddle_1_pos[0] + 10.:if self.ball_pos[1] + 7.5 >= self.paddle_1_pos[1] and self.ball_pos[1] <= self.paddle_1_pos[1] + 42.5:self.ball_pos = 20., self.ball_pos[1]self.ballSpeed = -self.ballSpeed[0], self.ballSpeed[1]reward = self.hitRewardif self.ball_pos[0] + 15 >= self.paddle_2_pos[0]:if self.ball_pos[1] + 7.5 >= self.paddle_2_pos[1] and self.ball_pos[1] <= self.paddle_2_pos[1] + 42.5:self.ball_pos = 605., self.ball_pos[1]self.ballSpeed = -self.ballSpeed[0], self.ballSpeed[1]# 拍未接到球(另外一个拍得分)if self.ball_pos[0] < 5.:self.paddle_2_score += 1reward = self.loseRewardself.__resetelif self.ball_pos[0] > 620.:self.paddle_1_score += 1reward = self.winRewardself.__reset# 球撞墙上if self.ball_pos[1] <= 10.:self.ballSpeed = self.ballSpeed[0], -self.ballSpeed[1]self.ball_pos = self.ball_pos[0], 10elif self.ball_pos[1] >= 455:self.ballSpeed = self.ballSpeed[0], -self.ballSpeed[1]self.ball_pos = self.ball_pos[0], 455 3、DQN算法搭建：
为了方便整体算法的调用，我们首先定义神经网络的函数，包括卷积层损失等函数定义具体如下可见：
'''获得初始化weight权重'''def init_weight_variable(self, shape):return tf.Variable(tf.truncated_normal(shape, stddev=0.01))'''获得初始化bias权重'''def init_bias_variable(self, shape):return tf.Variable(tf.constant(0.01, shape=shape))'''卷积层'''def conv2D(self, x, W, stride):return tf.nn.conv2d(x, W, strides=[1, stride, stride, 1], padding="SAME")'''池化层'''def maxpool(self, x):return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')'''计算损失'''def compute_loss(self, q_values, action_now, target_q_values):tmp = tf.reduce_sum(tf.multiply(q_values, action_now), reduction_indices=1)loss = tf.reduce_mean(tf.square(target_q_values - tmp))return loss'''下一帧'''def next_frame(self, action_now, scene_now, gameState):x_now, reward, terminal = gameState.update_frame(action_now)x_now = cv2.cvtColor(cv2.resize(x_now, (80, 80)), cv2.COLOR_BGR2GRAY)_, x_now = cv2.threshold(x_now, 127, 255, cv2.THRESH_BINARY)x_now = np.reshape(x_now, (80, 80, 1))scene_next = np.append(x_now, scene_now[:, :, 0:3], axis=2)return scene_next, reward, terminal'''计算target_q_values'''def compute_target_q_values(self, reward_batch, q_values_batch, minibatch):target_q_values =for i in range(len(minibatch)):if minibatch[i][4]:target_q_values.append(reward_batch[i])else:target_q_values.append(reward_batch[i] + self.gamma * np.max(q_values_batch[i]))return target_q_values

Python|Python 还能实现哪些 AI 游戏？附上代码一起来一把( 二 )

推荐阅读

白萝卜煨牛腩

智慧|正元智慧：易康投资终止股份减持计划

我省|我省杨氏太极拳等3个项目成功列入联合国人类非物质文化遗产代表作名录

|如何处理无法承受的领导？

温暖|手绘玻璃杯温暖冬天

威锋网|iPhone 将采用骁龙 X60 基带，DigiTimes：5G

陈式太极拳与传统陈式太极拳为什么区别很大

rookie@LOL职业选手早期青涩采访，羞涩的Rookie，拜年装小虎，姿态认不出！

『晨张家界』向绪杰深入核心景区检查清明节森林防火及旅游接待等工作

地方美食菜谱|砍伐原始古树雪地做饭，玉米糊配野菜，尼泊尔喜马拉雅牧民的生活

粽子叶需要泡多久能好? 粽子叶需要泡多久

[西安新闻号]你有“血铠甲”，我有“金刚钻”，高转速“劈”开堵塞动脉

刺槐的花语和寓意花语比较虐心的花

两名医学生跪地救人无效遭恶评被救男子家属发声

「老夫子」S19“净化流”老夫子火了，排位无解，一打三也没问题

追热度科技123 Z1X大降价，现不到2K即可入手，网友：性价比不高，iQOO

小优妈妈|怀孕后有必要穿防辐射服吗？听听过来人怎么说

『向往的生活』《向往的生活》即将开播，节目组却突然发出“公告”，看到内容笑了

长江日报|农民摄影家郭贤乐：生在农村长在农村，一辈子拍农村

悲痛！失踪12天男孩已死亡，死因正在调查中……