정렬에 대해서 알아보자!
버블정렬, 선택정렬, 삽입정렬, 퀵정렬, 병합정렬, 기수정렬
레츠고
정렬 (sort)은, 데이터를 정해진 기준에 따라 배치하여
의미 있는 구조로 재설정하는 것을 말한다.
먼저 각 정렬 알고리즘을 살펴보는 것이 좋을 거 같다!
정렬 알고리즘 | 방식 |
버블(bubble sort) | 데이터의 인접 요소끼리 비교하고, swap 연산을 수행하며 정렬하는 방식 |
선택(selection sort) | 대상에서 가장 크거나 작은 데이터를 찾아가 선택을 반복하면서 정렬하는 방식 |
삽입(insertion sort) | 대상을 선택해 정렬된 영역에서 선택 데이터의 적절한 위치를 찾아 삽입하면서 정렬하는 방식 |
퀵(quick sort) | pivot 값을 선정해 해당 값을 기준으로 정렬하는 방식 |
병합(merge sort) | 이미 정렬된 부분 집합들을 효율적으로 병합해 전체를 정렬하는 방식 |
기수(radix) | 데이터의 자릿수를 바탕으로 비교해 데이터를 정렬하는 방식 |
1. 버블 정렬
버블 정렬 (bubble sort)는 두 인접한 데이터의 크기를 비교해서 정렬하는 방법이다.
버블이 두개 붙어있는 이미지를 생각하면 연상하기 쉽다!
간단한 정렬방식이고, 구현도 쉽지만, 시간복잡도는 O(n^2)이다. ㅎㅎ
다른 정렬 알고리즘보다 속도가 느린 편이다.
위 그림과 같이, 루프를 돌면서 인접한 두 데이터간의 크기비교를 통해 swap을 진행한다.
버블 정렬 과정은 아래와 같다.
1. 비교 연산이 필요한 반복 범위를 설정
2. 인접한 데이터 값을 비교
3. swap 조건에 부합하면 swap 진행
4. 루프 범위가 끝날때 까지 2,3을 반복
5. 정렬 영역을 설정하고, 다음 루프를 실행할 때는 지금 영역을 제외
6. 비교대상이 없을 때까지 1~5을 반복
선택 정렬
최대나 최소값을 찾고, 정렬할 부분의 가장 맨 앞에 있는 데이터와 swap하는 것이 선택 정렬의 핵심이다.
구현방법도 복잡하고, 시간복잡도도 O(n^2)으로 효율적이지 않아서 코테에서 잘 사용하지 않는다
선택 정렬의 과정은 아래와 같다.
1. 남은 정렬 부분에서 최솟값이나 최대값을 찾는다
2. 남은 정렬부분에서 가장 앞에 있는 데이터와 선택된 데이터(최솟값이나 최대값)을 swap한다.
3. 가장 앞에 있는 데이터의 위치를 변경(index++) 남은 정렬 부분의 범위를 축소한다.
4. 전체 데이터 크기만큼 index가 커지면, 즉 남은 정렬 부분이 없을때까지 이를 반복한다.
선택 정렬 자체를 묻는 문제를 코테에서 잘 출제되지 않지만,
이러한 원리를 응용하는 문제는 나올 수 있어서
선택정렬이 어떤 원리로 작동하는지 알아두자!!
삽입 정렬
삽입정렬은 선택 데이터를 현재 정렬된 데이터 범위 내의 적절한 위치에 삽입하는 것이다.
시간 복잡도는 O(n^2)이다.
위 사진에서 key값은 선택된 데이터를 말한다.
삽입 정렬 과정은 아래와 같다.
1. 현재 index(선택된 데이터)에 있는 데이터 값을 선택한다.
2. 현재 선택한 데이터가 정렬된 데이터 범위에 삽입될 위치를 탐색한다.
3. 삽입 위치부터 index에 있는 위치까지 shift 연산(한칸씩 옮긴다)을 수행한다.
4. 삽입 위치에 현재 선택한 데이터를 삽입하고 index++ 연산을 수행한다.
5. 전체 데이터의 크기만큼 index가 커질때 까지, 선택할 데이터가 없을 때 까지 반복한다.
적절한 삽입 위치를 탐색하는 부분에서
이진탐색 과 같은 탐색 알고리즘을 사용하여
시간복잡도를 줄일 수 있다!
퀵 정렬
퀵 정렬은 기준값(pivot)을 선정해서 해당값보다 작은 데이터와 큰 데이터로 분류하는 것을
반복해서 정렬하는 알고리즘이다.
기준값을 어떤걸 선정하냐에 따라서
시간복잡도에 많은 영향을 미친다
평균적인 시간복잡도는 O(nlogn)이며 최악의 경우에는 시간복잡도가 O(n^2)이다.
pivot을 중심으로 계속 데이터를 2개의 집합으로 나누면서 정렬하는 것이 퀵 정렬의 핵심이다
1. 데이터를 분할하는 pivot을 설정한다. (여기서는 맨 왼쪽을 pivot으로 설정)
2. pivot을 기준으로 아래 과정을 거져서 데이터를 2개의 집합으로 분리한다.
2-a. left가 가리키는 데이터가 pivot보다 작으면 left를 오른쪽으로 한칸 이동한다
2-b. right가 가리키는 데이터가 pivot이 가리키는 데이터보다 크면 right를 왼쪽으로 1칸이동한다.
2-c. left가 가리키는 데이터가 pivot이 가리키는 데이터보다 크고, right가 가리키는 데이터가 pivot이 가리키는 데이터보다 작으면,
left, right가 가리키는 데이터를 swap하고 left는 오른쪽, right는 왼쪽으로 1칸씩 이동한다
2-d. left와 right가 만날때 까지 a~c를 반복
2-e. left와 right가 만나면 만난 지점에서 가리키는 데이터와 pivot이 가리키는 데이터를 비교하여 pivot이 가리키는 데이터가 크면
만난 지점의 오른쪽에, 작으면 만난 지점의 왼쪽에 pivot이 가리키는 데이터를 삽입한다.
3. 분리 집합에서 각각 다시 Pivot을 선정한다.
4. 분리 집합이 1개 이하가 될 때 까지 1~3을 반복한다.
퀵 정렬의 시간 복잡도는 비교적 준수하므로 코딩 테스트에서도 종종 응용한다.
재귀 함수의 형태로 직접 구현해보는 것을 추천한다!
병합 정렬
병합 정렬은 분할 정복 방식을 사용해서
1. 데이터를 분할하고,
2. 분할한 집합을 정렬해서
3. 합치는
알고리즘 이다.
시간복잡도는 O(nlogn)이다
병합 정렬은 코테에서 정렬 관련 문제에서 자주 등장하는데
특히 2개의 그룹을 병합하는 원리는 꼭 숙지해두자!
2개의 그룹을 병합하는 과정은
투 포인터 개념을 사용한다
왼쪽과 오른쪽 포인터의 값을 비교해서 작은 값을 결과 배열에 추가하고
포인터를 오른쪽으로 1칸 이동시킨다 (코테에서 많이 사용하는 방식)
기수 정렬
기수 정렬은 값을 비교하지 않는 특이한 정렬이다
그럼 어떻게 정렬하나?
비교할 자릿수를 정한 다음, 해당 자릿수만 비교한다
시간복잡도는 O(kn) (k는 데이터의 자릿수)
이렇게만 봤을 때는 이해가 잘 되지 않는데 그림을 보고 이해하자
위 그림을 보면 기수정렬을 바로 이해할 수 있을 것이다
기수정렬은 시간복잡도가 지금까지 본 정렬중에 가장 짧다
코테에서 정렬해야할 데이터의 개수가 너무 많다면
기수정렬을 사용해보도록 하자!
계수 정렬
기수정렬과 함께 많이 사용하는 계수 정렬이 존재한다.
시간복잡도는 O(n+k)이다
계수정렬은 기수정렬보다
로직이 간단해서
잘 사용해보도록 하자!
'알고리즘 > 개념' 카테고리의 다른 글
탐색 (깊이 우선 탐색, 너비 우선 탐색, 이진 탐색) (0) | 2025.04.08 |
---|---|
자료구조 - 스택, 큐, 우선순위 큐 (2) (0) | 2025.03.04 |
자료구조 - 배열과 리스트, 구간 합 (1) (0) | 2025.02.08 |
코딩 테스트를 준비하기 위한 기초 개념 (시간복잡도, 디버깅) - 디버깅 (0) | 2024.12.31 |
코딩 테스트를 준비하기 위한 기초 개념 (시간복잡도, 디버깅) - 시간복잡도 (0) | 2024.12.31 |