본문 바로가기
CS+PS/Algorithm

[알고리즘] BFS/DFS (feat. stack, queue)

by SolaKim 2023. 10. 11.
꼭 필요한 자료구조 기초

BFS/DFS를 들어가기에 앞서, 데이터를 표현하고 관리하기 위한 구조에 대해서 간단히 얘기해보고 넘어가자.

 

Stack
박스 쌓기에 비유할 수 있다

  • 선입후출, 후입선출
  • 파이썬에서 스택을 이용할 때에는 별도의 라이브러리를 사용할 필요가 없다.
  • 기본 리스트에서 append()와 pop() 메서드를 이용하면 스택 자료구조와 동일하기 동작한다.

 

Queue
대기줄에 비유할 수 있다.

  • 선입선출 구조
  • 파이썬으로 큐를 구현할 때는 collections 모듈에서 제공하는 deque 자료구조를 활용하자.
  • deque는 스택과 큐의 장점을 모두 채택한 것인데 데이터를 넣고 빼는 속도가 리스트 자료형에 비해 효율적이며 queue 라이브러리를 이용하는 것보다 더 간단하다.
  • 큐와 같은 경우 push_back(a)과 pop_front()를 이용하여 삽입과 삭제가 가능하다.

 

재귀함수(Recursive Function)

자기 자신을 다시 호출하는 함수를 의미한다.

def recursive_function(): 
	print('재귀 함수를 호출합니다.') 
    recursive_function()
    
recursive_function()

이 코드를 실행하면 ‘재귀 함수를 호출합니다.’라는 문자열을 무한히 출력한다.
여기서 정의한 recursive_funtion()이 자기 자신을 계속해서 추가로 불러오기 때문이다.
물론 어느 정도 출력 하다가 다음과 같은 오류 메시지를 출력하고 멈출 것이다.

RecursionError: maxinum recursion depth exceeded while pickling an object


이 오류 메시지는 재귀 Recursion의 최대 깊이를 초과했다는 내용이다.
보통 파이썬 인터프리터는 호출 횟수 제한이 있는데 이 한계를 벗어났기 때문이다. 따라서 무한대로 재귀 호출을 진행할 수는 없다.
(애초에 무한한 재귀 호출을 요구하는 문제 또한 출제되지 않을 것이다)

⭐️ 재귀함수는 내부적(컴퓨터)으로 스택 자료구조와 동일하다.

따라서 스택 자료구조를 활용해야 하는 상당수 알고리즘은 재귀함수를 이용해서 간편하게 구현될 수 있다.
DFS가 그의 대표적인 예이다.

 

그래프

  • 노드(node)와 간선(edge)으로 표현되며 이때 노드를 정점(Vertex)이라고도 말한다.
  • 그래프 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다.
  • 두 노드가 간선으로 연결되어 있다면 "두 노드는 인접하다(Adjacent)"라고 표현한다.

프로그래밍에서 그래프는 크게 2가지 방식으로 표현할 수 있다.

  • 인접 행렬(Adjacency Matrix) : 2차원 배열로 그래프의 연결 관계를 표현하는 방식
    • 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식
    • 아래와 같이 연결된 그래프를 인접 행렬로 표현할 때 파이썬에서는 2차원 리스트로 구현할 수 있다.(연결 되어있지 않은 노드끼리는 무한의 비용이라고 작성한다.)
INF = 999999999 # 무한의 비용 선언

# 2차원 리스트를 이용해 인접 행렬 표현 
graph = [
	[0, 7, 5], 
    [7, 0, INF], 
    [5, INF, 0]
]
print(graph)

 

  • 인접 리스트(Adjacency List) : 리스트로 그래프의 연결 관계를 표현하는 방식
    • 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다.
      • 인접리스트는 '연결 리스트'라는 자료구조를 이용해 구현하는데, C++나 자바와 같은 프로그래밍 언어에서는 별도로 연결 리스트 기능을 위한 표준 라이브러리를 제공한다. 하지만 파이썬은 기본 자료형인 리스트 자료형이 append()와 메소드를 제공하므로, 전통적인 프로그래밍 언어에서의 배열과 연결 리스트의 기능을 모두 기본으로 제공한다.
    • 파이썬으로 인접 리스트를 이용해 그래프를 표현하고자 할 때에도 단순히 2차원 리스트를 이용하면 된다는 점!!

출처 : 이코테 -나동빈

# 행(Row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장(노드, 거리) 
graph[0].append((1, 7)) 
graph[0].append((2, 5))

# 노드 1에 연결된 노드 정보 저장(노드, 거리) 
graph[1].append((0, 7))

# 노드 2에 연결된 노드 정보 저장(노드, 거리) 
graph[2].append((0, 5))

print(graph)

출처 : 이코테 -나동빈 (좌: 인접 리스트, 우: 인접 행렬)

 

위의 두 방식에는 어떤 차이가 있을까? 

<메모리 측면>
인접 행렬 방식은 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비된다.
인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.
하지만 인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다.(리스트 방식에서는 연결된 데이터를 하나씩 확인해야하기 때문이다.)

=> 특정한 노드와 연결된 모든 인접 노드를 순회해야 하는 경우, 인접 리스트 방식이 인접 행렬 방식에 비해 메모리 공간의 낭비가 적다.

 

 

탐색 알고리즘 DFS/BFS

DFS

  • Depth-Fisrt Search, 깊이 우선 탐색, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘
  • 특정한 경로로 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘이다.
  • 탐색을 수행함에 있어서 데이터의 개수가 N개의 경우 O(N)의 시간이 소요된다.

 

DFS스택 자료구조를 이용하며, 구체적인 동작과정은 다음과 같다.

  1. 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.
  2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다.
    방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
  3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.
  4. TIP. '방문처리'는 스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것을 의미한다. 방문 처리를 함으로써 각 노드를 한번씩만 처리할 수 있게 된다.
#DFS 메서드 정의
def dfs(graph, v, visited):
	#현재 노드를 방문 처리
    visited[v] = True
    print(v, end=' ')
    
    #현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
    	if not visited[i]:
        	dfs(graph, i, visited)
            
#각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
	[],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

#각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False]*9

#정의된 DFS 함수 호출
dfs(graph, 1, visited)

 

 

BFS

  • breadth-Fisrt Search, 너비 우선 탐색, 가까운 노드부터 탐색하는 알고리즘
  • 선입선출 방식은 큐 자료구조를 이용하는것이 정석이다.
  • 인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행하게 된다.
  • deque 라이브러리를 사용하며, 탐색을 수행함에 있어 O(N)의 시간이 소요된다.(일반적인 경우 실제 수행 시간은 DFS보다 좋은 편이다.)

BFS의 자세한 동작 방식은 다음과 같다.

  1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
  2. 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.
  3. 2번 과정을 더 이상 수행할 수 없을 때까지 반복한다.
from _collections import deque

def bfs(graph, start, visited):
    queue = deque([start]) #큐를 초기화하면서 시작 노드(start)를 큐에 넣음.
    #현재 노드를 방문 처리
    visited[start] = True

    while queue: #큐가 빌 때까지 반복
        #큐에서 하나의 원소를 뽑아 출력
        v = queue.popleft()
        print(v, end=' ')
        #해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True

graph = [
	[],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

visited = [False] * 9

bfs(graph, 1, visited)

 

 

<정리>

출처 : 이코테 -나동빈

코딩 테스트 중 2차원 배열에서의 탐색 문제를 만나면 이렇게 그래프 형태로 바꿔서 생각하면 풀이 방법을 조금 더 쉽게 떠올릴 수 있다.
그러므로 코딩테스트에서 탐색 문제를 보면 그래프 형태로 표현한 다음 풀이법을 고민하도록 하자.

 


실전문제

 

정답👇🏻👇🏻👇🏻(더보기를 눌러주세용)

더보기
#내가 푼 풀이

dx=[1,0,-1,0] #열방향으로 움직임
dy=[0,-1,0,1] #행방향으로 움직임

n,m = map(int, input().split())

arr = []

for i in range(n):
    arr.append(list(map(int, input())))

def dfs(y, x):
    if x<0 or x>=m or y<0 or y>=n: #필뚜!!
        return False
    arr[y][x] = 1 #현재 위치 방문 처리

    for i in range(4):
        nx = x + dx[i]
        ny = y + dy[i]
        if 0 <= nx < m and 0 <= ny < n :
            if arr[ny][nx]==0:
                dfs(ny, nx)
                return True

    return False

cnt =0
for i in range(n): #전체 위치에서 DFS를 돌려서,
    for j in range(m):
        #현재 위치에서 DFS 수행
        if dfs(i, j): #한 덩어리의 dfs를 다 돌면 arr에서 다 1로 바뀌어서 어차피 거기로 못감!(아슈크림이 몇 덩어리인지 셀 수 있는 발상점)
            cnt+=1

print(cnt)

 

#답지 풀이
n,m = map(int, input().split())

#2차원 리스트의 맵 정보 입력받기
graph = []
for i in range(n):
    graph.append(list(map(int, input())))

#DFS로 특정한 노드를 방문한 뒤에 연결된 모든 노드들도 방문
def dfs(x,y):
    #주어진 범위를 벗어나는 경우에는 즉시 종료
    if x<=-1 or x >=n or y<=-1 or y>=m:
        return False
    #현재 노드를 아직 방문하지 않았다면
    if graph[x][y] ==0 :
        graph[x][y] =1 #해당 노드 방문 처리
        #상하좌우의 위치도 모두 재귀적으로 호출
        dfs(x-1,y)
        dfs(x+1,y)
        dfs(x,y-1)
        dfs(x,y+1)
        return True
    return False

#모든 노드(위치)에 대하여 음료수 채우기
result = 0
for i in range(n):
    for j in range(m):
        #현재 위치에서 DFS 수행
        if dfs(i,j):
            result+=1

print(result)

풀이 과정은 다음과 같다.

  • 특정한 지점의 주변 상,하,좌,우를 살펴본 뒤에 주변 지점 중에서 값이 '0'이면서 아직 방문하지 않은 지점이 있다면 해당 지점을 방문한다.
  •  방문한 지점에서 다시 상,하,좌,우를 살펴보면서 방문을 다시 진행하면, 연결된 모든 지점을 방문할 수 있다.
  •  위의 과정을 모든 노드에 반복하며 방문하지 않은 지점의 수를 센다.

 


 

정답👇🏻👇🏻👇🏻(더보기를 눌러주세용)

더보기
# 미로 탈출
from _collections import deque

n , m =map(int, input().split())

arr = []
for i in range(n):
    arr.append(list(map(int, input())))

dx=[-1,1,0,0]
dy=[0,0,-1,1]

def bfs(y,x):
    queue = deque()
    queue.append((y,x))

    while queue:
        y,x = queue.popleft()
        #현재 위치에서 네 방향으로의 위치 확인
        for i in range(4):
            nx = x+ dx[i]
            ny = y+ dy[i]
            if nx<0 or nx>=m or ny<0 or ny>=n:
                continue
            if arr[ny][nx] == 0: #못지나감!
                continue
            #해당 노드를 처음 방문하는 경우에만 최단 거리 기록
            if arr[ny][nx] == 1:
                arr[ny][nx] = arr[y][x]+1 #최단거리를 기록하며 그래프를 탐색해나감
                queue.append((ny,nx))
    #가장 오른쪽 아래까지의 최단 거리 반환
    return arr[n-1][m-1]

print(bfs(0,0))

 

 

% 해당 글은 "이것이 코딩테스트다. (나동빈 저)" 를 공부하며 정리해놓은 게시글입니다! %

'CS+PS > Algorithm' 카테고리의 다른 글

[파이썬]빠른 입출력  (0) 2023.11.13
[알고리즘] 정렬 (선택, 삽입, 퀵정렬..)  (0) 2023.11.13
[C++] 연결리스트 (feat.바킹독)  (0) 2023.09.19
[C++] 배열 (feat. 바킹독)  (0) 2023.09.13
[알고리즘]구현  (0) 2023.09.13