티스토리 뷰
1️⃣ 버블 정렬 (Bubble)
loop를 돌면서 인접한 데이터 간의 swap 연산을 통해 정렬하는 방식
- 시간 복잡도 : O(n^2)
- 다른 정렬 알고리즘보다 속도가 느린 편
N개의 데이터를 정렬한다고 가정하면, 루프를 한번 돌때마다 맨 뒤에 데이터부터 하나씩 픽스해 나간다.
→ 루프를 한번 도는데 N번의 비교를 하니 N의 시간복잡도를 가진다.
→ 그 루프를 N번 돌아야 모든 데이터가 정렬된다.
한 번 도는데 N의 시간복잡도를 가지는 루프를 N번 도니까 버블정렬의 시간복잡도가 n^2이다.
버블 정렬 구현 과정 말로 풀어 써보기
1) 비교 연산이 필요한 루프 범위를 설정한다.
2) 인접한 데이터 값을 비교한다.
3) swap 조건에 부합하면 swap 연상을 수행한다.
4) 루프 범위가 끝날 때까지 2) ~ 3) 과정을 반복한다.
5) 정렬 영역을 설정한다. 다음 루프를 실행할 때 이 영역은 제외한다.
6) 비교 대상이 없을 때까지 1) ~ 5) 과정을 반복한다.
* 특정한 루프 전체 영역에서 swap이 한 번도 발생하지 않았다면 모두 정렬됬다는 뜻이므로 프로세스를 종료해도 된다.
2️⃣ 선택 정렬 (Selection)
대상 데이터에서 가장 크거나 작은 데이터를 찾아가 선택을 반복하면서 정렬하는 방식
- 시간 복잡도 : O(n^2)
- 최솟값 또는 최댓값을 찾고, 남은 정렬 부분의 가장 앞에 있는 데이터와 swap하는 것이 핵심
- 구현이 복잡하고 효율이 좋지 않음
N개의 데이터를 정렬한다고 가정하면, 최솟값(혹은 최댓값)을 찾기 위해 N만큼 탐색한다.
→ N만큼 탐색한 후 1개의 데이터가 정렬된다.
→ 그 다음은 N-1만큼 탐색, 또 그 다음은 N-2만큼 탐색, ... 마지막으로 N-N만큼 탐색한다.
N만큼의 탐색을 N번하니까 시간복잡도가 n^2이다.
💡 위에 버블정렬도 그렇고, 정확히 n^2이 아닌데 시간복잡도가 n^2이라고 하는 이유
→ 시간복잡도를 계산할 때는 상수를 무시한다.
이 말이 무슨 얘기냐면, 만약 10000개의 데이터(N = 10000)를 정렬한다고 했을 때 최솟값을 찾는데 10000번의 탐색이 필요하다.
이렇게 1개가 정렬되고 다음으로는 9999번의 탐색이 필요하고... 평균적으로 5000번의 탐색이 필요하다.
즉, 0.5N번의 탐색을 N번 해야하니까 0.5N^2이다. 시간복잡도에서는 0.5처럼 상수는 신경쓰지 않기 때문에 0.5N^2은 N^2이 된다.
선택 정렬 구현 과정 말로 풀어 써보기
1) 정렬되지 않은 부분에서 최솟값 또는 최댓값을 찾는다. (오름차순으로 정렬할거면 최솟값, 내림차순으로 정렬할거면 최댓값)
2) 정렬되지 않은 부분에서 가장 앞에 있는 데이터와 선택된 데이터를 swap한다.
3) 가장 앞에 있는 데이터의 위치를 변경해(index++) 남은(정렬되지 않은) 부분의 범위를 축소한다.
4) 전체 데이터 크기만큼 index가 커질 때까지, 즉 정렬되지 않은 부분이 없을 때까지 반복한다.
3️⃣ 삽입 정렬 (Insertion)
대상을 선택해 정렬된 영역에서 선택 데이터의 적절한 위치를 찾아 삽입하면서 정렬하는 방식
- 시간 복잡도 : O(n^2)
- 선택 데이터를 현재 정렬된 데이터 범위 내에서 적절한 위치에 삽입하는 것이 핵심
- 시간 복잡도는 느린 편이지만 구현하기가 쉬움
삽입 정렬 구현 과정 말로 풀어 써보기
1) 현재 index에 있는 데이터 값을 선택한다.
2) 현재 선택한 데이터가 정렬된 데이터 범위에서 어디에 삽입해야 될지 위치를 탐색한다.
3) 삽입 위치부터 index에 있는 위치까지 shift 연산을 수행한다.
4) 삽입 위치에 현재 선택한 데이터를 삽입하고 index++ 연산을 수행한다.
5) 전체 데이터의 크기만큼 index가 커질 때까지, 즉 선택할 데이터가 없을 때까지 반복한다.
* 적절한 삽입 위치를 탐색할 때 이진 탐색(binary search) 등과 같은 탐색 알고리즘을 사용하면 시간 복잡도를 줄일 수 있다.
이진 탐색을 사용한다면 삽입할 위치를 탐색할 때의 시간 복잡도가 O(N)에서 O(logN)이 된다.
하지만, 위치 탐색에서 시간 복잡도를 줄여도 전체 시간복잡도가 좋을 수 없는 이유는 데이터를 shift하는데 걸리는 시간이 오래 걸리기 때문이다.
4️⃣ 퀵 정렬 (Quick)
기준값(pivot)을 선정해 해당 값을 기준으로 작은 데이터와 큰 데이터로 분류하는 것을 반복하여 정렬하는 방식
- 평균 시간 복잡도 : O(nlogn)
- 최악의 경우 시간 복잡도는 O(n^2)
- 기준값이 어떻게 선정되는지가 시간 복잡도에 많은 영향을 미침
- pivot을 중심으로 계속 데이터를 2개의 집합으로 나누면서 정렬하는 것이 핵심
퀵 정렬 구현 과정 말로 풀어 써보기
1) 데이터를 분할하는 pivot을 설정한다.
2) pivot을 기준으로 데이터를 2개의 집합으로 분리한다.
a) start, end 데이터를 설정
b) start가 pivot보다 작으면, start를 오른쪽으로 1칸 이동
c) start가 pivot보다 크면, end를 왼쪽으로 1칸 이동
d) start가 pivot보다 크고 end가 pivot보다 작으면, start와 end를 swap하고 start는 오른쪽, end는 왼쪽으로 1칸 이동
e) start와 end가 만날 때까지 b) ~ d)를 반복
f) start와 end가 만나면 만난 지점에서 가리키는 데이터와 pivot을 비교하여 pivot이 크면 만난 지점의 오른쪽에 삽입.
pivot이 작으면 만난 지점의 왼쪽에 삽입 (삽입하거나 만난 지점의 데이터와 swap)
3) 분리 집합에서 각각 다시 pivot을 선정한다.
4) 분리 집합이 1개 이하가 될 때까지 1) ~ 3)을 반복한다.
5️⃣ 병합 정렬 (Merge)
이미 정렬된 부분 집합들을 효율적으로 병합해 전체를 정렬하는 방식
- 시간 복잡도 : O(nlogn)
- 분할 정복(divide and conquer)방식을 사용해 데이터를 분할하고 분할한 집합을 정렬하며 합치는 알고리즘
💡 시간 복잡도가 nlogn인 이유?
위 예시에서 n = 8
총 3번의 병합 과정을 거쳐 최종 정렬이 완성된다. ( 3 = log8 = logn)
각 병합 단계에서는 8번(n번)의 데이터 access가 있다.
→ n번의 데이터 엑세스가 logn만큼 일어난다.
병합 정렬의 핵심 - 2개의 그룹을 병합하는 과정
투 포인터 개념을 사용하여 2개의 그룹을 병합한다. 왼쪽 포인터와 오른쪽 포인터의 값을 비교하여 작은 값을 결과 배열에 추가하고 포인터를 오른쪽으로 1칸 이동시킨다.
6️⃣ 기수 정렬 (radix)
데이터의 자릿수를 바탕으로 비교해 데이터를 정렬하는 방식
- 시간 복잡도 : O(kn) k는 자릿수.
- 값을 비교하지 않음.
- 값을 놓고 비교할 자릿수를 정한 다음 해당 자릿수만 비교
기수 정렬 구현 과정 말로 풀어 써보기
1) 10개의 큐를 사용한다. 각 큐는 값의 자릿수를 대표한다.
2) 일의 자릿수를 기준으로 배열 원소를 큐에 넣는다.
3) 0~9번째 큐까지 순서대로 pop를 진행한다.
4) 그 결과, 일의 자릿수의 크기대로 정렬된 배열이 나온다.
5) 그 배열을 십의 자릿수를 기준으로 큐에 넣는다.
6) 마지막 자릿수를 기준으로 정렬할 때까지 2) ~ 5)의 과정을 반복한다.
📌 정렬 관련 문제들
✅ 프로그래머스 - 코딩테스트 고득점 Kit : 정렬
✅ 백준 - 정렬 관련 문제들
참고 자료
🔗 [하루코딩] 알고리즘 코딩테스트 핵심이론 강의 - 버블 정렬
🔗 [하루코딩] 알고리즘 코딩테스트 핵심이론 강의 - 선택 정렬
🔗 [하루코딩] 알고리즘 코딩테스트 핵심이론 강의 - 삽입 정렬
🔗 [하루코딩] 알고리즘 코딩테스트 핵심이론 강의 - 퀵 정렬
🔗 [하루코딩] 알고리즘 코딩테스트 핵심이론 강의 - 병합 정렬
🔗 [하루코딩] 알고리즘 코딩테스트 핵심이론 강의 - 기수 정렬
'😵 알고리즘 공부' 카테고리의 다른 글
백준 11724번 문제 파이썬 런타임 에러 (0) | 2023.05.05 |
---|---|
프로그래머스 달리기 경주 문제 시간 초과 (0) | 2023.04.28 |
구간 합 (누적 합) (0) | 2023.04.12 |
DFS(깊이 우선 탐색)과 BFS(너비 우선 탐색) (0) | 2023.03.30 |
시간복잡도 (Python) (0) | 2023.03.26 |
프론트엔드 개발자 삐롱히의 개발 & 공부 기록 블로그