一、实验题目
八数码问题,也称九宫格问题,是经典的状态空间搜索问题。
二、实验分析
因为在生成状态时,可能重复,所以该问题应当用图模型解决,即搜索建立在图上。本实验采用两种实验方法:盲目搜索算法(队列 bfs)、启发式算法(优先队列 bfs 评价函数)即a*算法。
该问题的规模为 9 ! = 362880,即有362880种可能的状态。采用盲目搜索法有的求解过程耗费时间、空间都很多,启发式算法效果比盲目搜索算法效率更高更优。
三、实验内容
1、ag真人游戏的解决方案一:盲目搜索算法
【思路】
采用bfs搜索,一边搜索结点一边生成新的子结点。将新生成的结点放入队列queue中,将访问过的结点放入集合set中。当某结点与目标状态相同时,那么最短路径长度就是该结点的长度。而最短路径可以通过存储父节点信息已经当前的操作算子得出。
有两个关键点:如何计算bfs中结点的层数(进而得出最短路径长度),如何记录最短路径。
2、ag真人游戏的解决方案二:启发式搜索算法
【思路】
启发式算法是在盲目搜索算法的改进,通过评价函数f(n) = g(n) h(n)为每个状态打分,通过放入优先队列priority_queue中,即得分低的状态结点优先访问。其他地方处理相同。其中g(n)是指到达这一状态的代价(即层数),h(n)是指棋盘上与目标状态不同的棋子数目。
但是有一个难点是如何证明或理解a算法的可行性。只要满足a条件,就能保证得到最优解。【a算法不能保证】
四、实验环境
win10,vs 2019,编程语言:c
五、实验总结
【盲目搜索算法】
1、在处理状态结点数据结构时,本来只打算简简单单地用一个二维数组来表示棋盘状态,但是在二维数组嵌套队列时,出现了问题,结构体或者类都可以替代二维数组,最终选择了类。
2、集合set嵌套结构体或者类需要重载运算符 < ,因为集合内部是需要排序,正是排序才保证set的去重功能。重载这部分比较生疏,应该多加练习。
3、在代码中,需要多次用到二维数组的比较和拷贝,本来想直接调用cstring 库中的memcpy( )和memcpy( )函数来简化代码。
4、通过代码实现,真正理解了bfs是通过队列queue实现的,而dfs是通过栈stack实现的。之前用dfs来实现回溯树,并没有通过栈来实现,而是类似于先序遍历。不过有一点可以肯定的是都不需要先全部生成树或者图,而是边生成边搜索。
【启发式搜索算法】
a*算法也有很多改进办法和其他应用。
六、完整代码
【运行截图】
1、盲目式搜索算法
#define _crt_secure_no_warnings
#include
using namespace std;
#include
#include
const int n = 20;
//要将其看作图,边生成边搜索,一旦达到最终状态,那么就是结果
//现在有两个关键点:如何计算bfs的层数;如何记录路径
//结点 每个结点都是一个状态
class state
{
//由于无需涉及权限问题,故将所有成员都设为public
public:
int board[3][3]; //记录每个状态各个位置上的数
int x; //x,y标记空格的位置
int y;
int step; //存储该状态的层数
int op[n][2]; //操作数组
//用二维数组设置棋盘上的数
void setboard(int board[3][3])
{
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
board[i][j] = board[i][j];
}
}
}
//set函数,设置op数组,复制父结点的op数组,再加上自己这一步的操作
//(i,j)表示新增的一对操作数,n表示第几层
void setop(int i, int j,int parentop[][2],int n)
{
for (int i = 0; i < n; i )
{
op[i][0] = parentop[i][0];
op[i][1] = parentop[i][1];
}
op[n][0] = i;
op[n][1] = j;
}
//打印函数
void print_board()
{
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
printf("%d ", board[i][j]);
}
printf("\n");
}
printf("\n");
}
//因为set是要排序的,那么就要重载运算符
bool operator < (const state b) const {
if (memcmp(board, b.board, sizeof(board)) == -1)
return true;
else
return false;
}
};
state start; //初始状态,全局变量
state over; //最终状态,全局变量
//四个方向向量:上下左右
int dx[4] = {
-1,1,0, 0 };
int dy[4] = {
0,0,-1,1 };
queue q; //用队列存储遍历顺序
set visited; //用集合标记访问过的结点
int stmp[3][3];
//比较两个棋盘是否相同
bool cmp(int board1[3][3], int board2[3][3]);
//state表示当前结点 (x,y)表示空格的位置
void bfs(state s)
{
//将该结点设置为已访问过
visited.insert(s);
q.pop(); //出队
//递归调用 向四个方向生成子结点
for (int i = 0; i < 4; i )
{
int nx = s.x dx[i];
int ny = s.y dy[i];
//如果结点合法且未被访问过
if (nx >= 0 && nx <= 2 && ny >= 0 && ny <= 2)
{
state tmp;
tmp.setboard(s.board); //将当前结点赋给tmp
//生成新的结点
swap(tmp.board[s.x][s.y], tmp.board[nx][ny]);
tmp.x = nx; //将空格信息也传递下去
tmp.y = ny;
tmp.step = s.step 1; //层数加1
tmp.setop(dx[i],dy[i],s.op,tmp.step);
if (visited.count(tmp) == 0)
{
//将新结点加入队列中
q.push(tmp);
// tmp.print_board(); //打印出来看看
//到达最终状态
if (cmp(tmp.board, over.board) == true)
{
//打印操作数组
// for (int j = 0; j < tmp.step; j )
// printf("%d %d\n",tmp.op[j][0],tmp.op[j][1]);
int tx = start.x;
int ty = start.y;
start.print_board();
//通过操作数组逆推
for (int j = 1; j < tmp.step; j )
{
swap(stmp[tx][ty],stmp[tx tmp.op[j][0]][ty tmp.op[j][1]]);
tx = tx tmp.op[j][0];
ty = ty tmp.op[j][1];
for (int ii = 0; ii < 3; ii )
{
for (int jj = 0; jj < 3; jj )
{
printf("%d ", stmp[ii][jj]);
}
printf("\n");
}
printf("\n");
}
over.print_board();
printf("end step: %d\n", tmp.step);
return; //这个return的意义
}
}
}
}
//开始访问下一层,访问的结点是队列的队首
bfs(q.front());
}
int main()
{
//初始状态
int s0[3][3] = {
{
2,8,3},
{
1,0,4},
{
7,6,5}
};
//最终状态
int sd[3][3] = {
{
1,2,3},
{
8,0,4},
{
7,6,5}
};
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
stmp[i][j] = s0[i][j];
}
}
int spacex = 0, spacey = 0;
//查找并记录初始状态的空格位置
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
if (s0[i][j] == 0)
{
spacex = i;
spacey = j;
break;
}
}
}
//start
start.setboard(s0); //将s0赋值给初始状态
start.x = spacex;
start.y = spacey;
start.step = 0;
q.push(start); //将初始结点加入队列中
over.setboard(sd); //将sd赋值给最终状态
bfs(start);
return 0;
}
bool cmp(int board1[3][3], int board2[3][3])
{
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
if (board1[i][j] != board2[i][j])
{
return false;
}
}
}
return true;
}
2、启发式搜索算法
#define _crt_secure_no_warnings
#include
using namespace std;
#include
#include
const int n = 20;
//启发式算法
class state
{
public:
int board[3][3]; //记录每个状态各个位置上的数
int x; //x,y标记空格的位置
int y;
int step; //存储该状态的层数,即g(n)
int h; //即使h(n)
int op[n][2]; //操作数组
//用二维数组设置棋盘上的数
void setboard(int board[3][3])
{
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
board[i][j] = board[i][j];
}
}
}
//set函数,设置op数组,复制父结点的op数组,再加上自己这一步的操作
//(i,j)表示新增的一对操作数,n表示第几层
void setop(int i, int j,int parentop[][2],int n)
{
for (int i = 0; i < n; i )
{
op[i][0] = parentop[i][0];
op[i][1] = parentop[i][1];
}
op[n][0] = i;
op[n][1] = j;
}
//打印函数
void print_board()
{
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
printf("%d ", board[i][j]);
}
printf("\n");
}
printf("\n");
}
//因为set是要排序的,那么就要重载运算符
bool operator < (const state b) const {
if (memcmp(board, b.board, sizeof(board)) == -1)
return true;
else
return false;
}
};
state start; //初始状态,全局变量
state over; //最终状态,全局变量
//四个方向向量:上下左右
int dx[4] = {
-1,1,0, 0 };
int dy[4] = {
0,0,-1,1 };
int cost(state s);
struct cmp_cost
{
bool operator() (state s1, state s2)
{
return cost(s1) > cost(s2);
}
};
priority_queue,cmp_cost> q; //用优先队列存储遍历顺序
set visited; //用集合标记访问过的结点
int stmp[3][3];
//比较两个棋盘是否相同
bool cmp(int board1[3][3], int board2[3][3]);
//state表示当前结点 (x,y)表示空格的位置
void bfs(state s)
{
//将该结点设置为已访问过
visited.insert(s);
q.pop(); //出队
//递归调用 向四个方向生成子结点
for (int i = 0; i < 4; i )
{
int nx = s.x dx[i];
int ny = s.y dy[i];
//如果结点合法且未被访问过
if (nx >= 0 && nx <= 2 && ny >= 0 && ny <= 2)
{
state tmp;
tmp.setboard(s.board); //将当前结点赋给tmp
//生成新的结点
swap(tmp.board[s.x][s.y], tmp.board[nx][ny]);
tmp.x = nx; //将空格信息也传递下去
tmp.y = ny;
tmp.step = s.step 1; //层数加1
tmp.setop(dx[i],dy[i],s.op,tmp.step);
if (visited.count(tmp) == 0)
{
//将新结点加入队列中
q.push(tmp);
// tmp.print_board(); //打印出来看看
//到达最终状态
if (cmp(tmp.board, over.board) == true)
{
//打印操作数组
// for (int j = 0; j < tmp.step; j )
// printf("%d %d\n",tmp.op[j][0],tmp.op[j][1]);
int tx = start.x;
int ty = start.y;
start.print_board();
//通过操作数组逆推
for (int j = 1; j < tmp.step; j )
{
swap(stmp[tx][ty],stmp[tx tmp.op[j][0]][ty tmp.op[j][1]]);
tx = tx tmp.op[j][0];
ty = ty tmp.op[j][1];
for (int ii = 0; ii < 3; ii )
{
for (int jj = 0; jj < 3; jj )
{
printf("%d ", stmp[ii][jj]);
}
printf("\n");
}
printf("\n");
}
over.print_board();
printf("end step: %d\n", tmp.step);
return; //这个return的意义
}
}
}
}
//开始访问下一层,访问的结点是队列的队首
bfs(q.top());
}
int main()
{
//初始状态
int s0[3][3] = {
{
2,8,3},
{
1,0,4},
{
7,6,5}
};
//最终状态
int sd[3][3] = {
{
1,2,3},
{
8,0,4},
{
7,6,5}
};
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
stmp[i][j] = s0[i][j];
}
}
int spacex = 0, spacey = 0;
//查找并记录初始状态的空格位置
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
if (s0[i][j] == 0)
{
spacex = i;
spacey = j;
break;
}
}
}
//start
start.setboard(s0); //将s0赋值给初始状态
start.x = spacex;
start.y = spacey;
start.step = 0;
q.push(start); //将初始结点加入队列中
over.setboard(sd); //将sd赋值给最终状态
bfs(start);
return 0;
}
bool cmp(int board1[3][3], int board2[3][3])
{
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
if (board1[i][j] != board2[i][j])
{
return false;
}
}
}
return true;
}
//传进来一个状态,将其与目的状态比较
int cost(state s) //评价函数,f(n) = g(n) h(n)
{
int h = 0;
for (int i = 0; i < 3; i )
{
for (int j = 0; j < 3; j )
{
if (s.board[i][j] != over.board[i][j])
h ;
}
}
//h的计算,值是与目的状态不同的棋子个数
return s.step s.h;
}