잡다로그

[Python/코테] 이진 탐색 (Binary Search) 본문

Algorithm

[Python/코테] 이진 탐색 (Binary Search)

날으는다람쥐 2023. 5. 1. 23:40

이진 탐색 (Binary Search)

정렬된 리스트에서 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 방법. 탐색 범위를 지정해주어야 한다.

이진 탐색은 배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있는 알고리즘이다.

리스트에서 원소 검색할 때 보통 순차 탐색을 한다.

source: https://woodforest.tistory.com/32

시간 복잡도

단계 마다 탐색 범위를 2로 나누는 것과 동일 → $log_2N$에 비례

즉 시간 복잡도는 $O(logN)$을 보장

 

코드 구현

1) 재귀적 구현

def binary_search(array, target, start, end):
    if start > end:
        return None			# 탐색하려는 범위에 데이터가 없는 것이나 마찬가지
    mid = (start+end) // 2
    if array[mid] == target:
       return mid			# 중간점 인덱스 반환
    elif array[mid] > target:
        return binary_search(array, target, start, mid -1)	# 왼쪽 확인
    else:
        return binary_search(array, target, mid + 1, end)	# 오른쪽 확인

# 값 입력 받기
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)
if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)

2) 반복문 구현

def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        
        if array[mid] == target:
            return mid
        elif array[mid] > target:
            end = mid - 1		# 앞 부분만 잘라서 반복문 다시 수행
        else:
            start = mid + 1		# 뒷 부분만 잘라서 반복문 다시 수행
        return None

# 값 입력 받기
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)
if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)

파이썬 라이브러리

bisect_left(a, x): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 왼쪽 인덱스를 반환

bisect_right(a, x): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 오른쪽 인덱스를 반환

from bisect import disect_left, bisect_right

a = [1, 2, 4, 4, 8]
x = 4

print(bisect_left(a, x))	# 결과: 2
print(bisect_right(a, x)) 	# 결과: 4

이를 활용하여, 값이 특정 범위에 속하는 데이터 갯수를 구할 수 있다.

from bisect import bisect_left, bisect_right

# 값이 [left_value, right_value]인 데이터의 개수를 반환하는 함수
def count_by_range(a, left_value, right_value):
    right_index = bisect_right(a, right_value)
    left_index = bisect_left(a, left_value)
    return right_index - left_index

a = [1, 2, 3, 3, 3, 3, 4, 4, 8, 9]

# 값이 4인 데이터 개수 출력
print(count_by_range(a, 4, 4))		# 결과: 2
# 값이 [-1, 3] 범위에 있는 데이터 개수 출력
print(count_by_range(a, -1, 3))		# 결과: 6

파라메트릭 서치(Parametric Search)

이진 탐색을 이용하여 해결할 수 있는 문제 유형.

최적화 문제(어떤 함수의 값을 최대한 높이거나/낮추는)를 여러 번의 결정 문제('예' 혹은 '아니오')로 바꾸어 해결하는 기법


1. 떡볶이 떡 만들기

* Solution: 적절한 높이를 찾을 때까지 이진 탐색을 수행하여 높이 H를 반복해서 조정.

즉, 조건 만족 여부(H가 특정 값 일 때 잘릴 떡의 합들이 m을 만족하는가 - 예/아니오)를 따라 탐색 범위를 좁혀서 해결

문제에서 주어진 절단기의 높이 범위는 0~10억이다. 이렇게 큰 범위를 탐색해야 할 때는 이진 탐색을 떠올려야 함! 

Detail) 중간점(절단점)=시작점(0)+끝점(가장 큰 숫자)/2

n, m = map(int, input().split())
array = list(map(int, input().split()))

start = 0
end = max(array)    # 끝점은 가장 큰 원소 (인덱스x 값o)

result = 0
while(start<=end):
    total = 0
    mid = (start+end) // 2
    for x in array:
        if x > mid:     # 정렬대신 for문의 조건으로, mid보다 큰 값일때만 더하고 또 자른다.
            total += x - mid    # 한 원소(x)가 절단기에 의해 잘린 만큼(mid)을 전부 더한다
    
    if total < m:       # 양이 부족한 경우
        end = mid - 1   # 중간값을 바꿔줌으로서 탐색 범위 재설정 (=왼쪽 부분 탐색)
    else:               # 양이 넘치는 경우 = 더 적게 잘라줘도 된다.
        result = mid
        start = mid + 1 # 중간값+1 = 절단기 높이 높여준다.

print(result)

* 나다어

  • list[:end] 하면 list[end]는 빼고 잘라진다.
  • return 함수(0, 0) 이런 식으로 해주지 않으면 결과적으로 None 반환
  • 요소 자체가 int형이면, 인덱스를 사용할 것인지 값 자체를 사용할 것인지 생각해보기

2. 정렬된 배열에서 특정 수의 개수 구하기

* 선형 탐색으로는 시간 초과 판정을 받는다. 데이터가 정렬되어 있기 때문에 특정 값의 등장 첫 위치와 마지막 위치로 계산 가능. 표준 라이브러리 bisect_right와 bisect_left를 사용해서 간단하게 구현할 수도 있다.

n, k = list(map(int, input().split()))
array = list(map(int, input().split()))

from bisect import bisect_left, bisect_right

def count_by_range(array, left_value, right_value):
    right_index = bisect_right(array, right_value)
    left_index = bisect_left(array, left_value)
    return right_index - left_index

count = count_by_range(array, k, k)

if count == 0:
    print(-1)
else:
    print(count)

* 나다어

  • 라이브러리를 적극 활용하자.
  • 리스트 데이터는 인덱스 개념을 적극 활용하자. 
  • 재귀로 구현하고 싶을 때는 return 에 함수 이름을 적어주면 된다.

https://youtu.be/94RC-DsGMLo

 

Comments