티스토리 뷰
동시성과 병렬성을 헷갈리지 말자
둘 이상의 코드 조각이 실행될 때
- 동시성 (Concurrency): 동시에 실행 중인 것처럼 행동하는 것
- 병렬성 (Parallelism): 실제로 동시에 실행되는 것
동시성을 얻으려면
- 실행 중의 코드의 다른 부분으로 실행을 전환할 수 있어야 함.
- Fiber, Thread, Process 등을 이용해 구현
병렬성을 얻으려면
- 2가지 일을 동시에 할 수 있는 하드웨어가 필요함.
- 여러 개의 코어, 여러 CPU, 네트워크에 연결된 여러 대의 컴퓨터 등을 이용해 구현
모든 일엔 동시성이 있다
시스템의 규모가 어느정도 넘어가면 동시성을 고려하지 않고 코드를 작성하는 것이 거의 “불가능”함
- 코드 짤 때 이런게 잘 안보인다면, 라이브러리/프레임워크 안에 숨겨져 있는 경우일 것
- 실제 세상이 비동기적이기에 실제 세상을 다기 원한다면 동시성은 필수임
동시성/병렬성 있는 코드를 작성하는 것은 어렵다?
- 왜 그럴까? 보통 우리는 프로그래밍을 순차적 시스템으로 배우기 때문. A하고 B하자.
- 보통 프로그래밍 언어에서 순차적으로 사용할 때는 비교적으로 안전하지만, 동시에 두 가지 일이 일어날 수 있으면 골칫거리로 변한다 → 가장 큰 예는 공유상태
Topic 33. 시간적 결합 깨트리기
시간적 결합 (Temporal Coupling)
- 실행 순서가 중요하지 않은 작업 간, 순서가 강제될 때 생기는 결합
코드를 작성하며 시간에서 우리가 신경써야 할 측면 2가지
- 동시성 (동시에 일어나는 일)
- 순서 (시간의 흐름속에서 일들의 상대적인 위치)
보통 코드를 작성할 때, 두 측면 모두 특별히 신경쓰지 않는 경우가 많다.
- 보통 직선적인 사고를 하게 된다. ‘이것을 한 뒤, 저것을 하고…’, ‘A 메서드 뒤에 B 메서드 동작시키고 ...’
- 이런 식으로 생각하다보면 순서가 필요없는 작업임에도 “시간적 결합”을 만들게 된다.
- 이러한 사고 방법은 그다지 유연하지 않고, 현실과 동떨어진다.
- 이러한 시간적 결합을 끊어야 한다. → 유연성을 얻고, 아키텍처/설계/배포 같은 시간 관련 의존성을 줄일 수 있다.
동시성 찾기
활동 다이어그램 같은 표기법을 이용해 작업 흐름을 기록해보자.
순서가 필요한 작업이 어디인지, 병렬적으로 실행할 수 있는 부분이 어디인지 파악할 수 있다.
- 병렬성이 필요한 곳을 찾아 병렬성을 극대화 시킬 수 있다.
그럼 동시작업이 가능한 곳에 다 동시성을 부여해야할까?
- 리소스가 가능하다면 좋겠지만, 현실은 쉽지 않다. 즉, 동시성 설계를 할 곳을 찾아야 한다.
- 우리 코드가 아닌 곳에서 시간이 걸리는 곳이 적합하다.
- 외부 서비스 접근 (데이터베이스 접근 등), 사용자 입력 기다릴 때 등
- 이는, CPU가 쉬는 대신 좀 더 생산적인 업무를 할 수 있게 해준다.
그럼, 병렬작업은?
- 여러 개의 프로세서/코어가 필요
- 독립적인 부분의 작업이 있는 곳이 적합하다.
- 다른 부분작업을 기다릴 필요 없이, 쪼개서 병렬로 처리하고 이를 합치는 과정
- 엘릭서(Elixir) 컴파일러
- 빌드하는 프로젝트를 여러 모듈로 쪼갠 후, 각각 병렬로 컴파일
- 모듈 간 의존하는 케이스가 있다면, 선행되어야 하는 모듈 빌드 후 진행됨
- 그렇기에 빠른 컴파일이 가능하다
Topic 34. 공유 상태는 틀린 상태
가게 주문 예시
- 여러 테이블에서 동시에 애플파이 주문이 들어옴.
- 애플파이는 냉장고에 1개 남은 상태.
- 각 테이블의 종업원은 냉장고를 보고 주문을 받음.
- 한 테이블을 제외하곤 받지 못하게 될 것.
문제는 상태가 공유된 것
- 종업원들은 서로를 고려하지 않고 냉장고만 확인했다.
비-원자적 갱신
- 파이 조각을 가져오고 갱신하는 동작이 원자적(atomic)이지 않았기 때문.
- 원자적으로 어떻게 변경할 수 있을까?
세마포어 및 상호배제 방법들
세마포어(Semaphore) - 한 번에 한 사람만 가질 수 있는 무언가
- 냉장고 사용을 제어하는데 세마포어를 이용 → 세마포어를 소유한 사람만이 냉장고 상태를 바꿀 수 있게.
- 세마포어를 도깨비 인형이라고 해보자.
- 종업원은 주문을 승낙하기 전에 도깨비 인형을 가져가고 주문 승낙, 파이 전달 후 다시 도깨비 인형을 제자리로 돌려놓는다.
세마포어 이용 시, 주의 사항
- 세마포어를 소유한 쪽에서 어느 경우에도 ‘반환’이 될 수 있도록 구성되어야 한다.
- 보통 구현 시 실수를 한다. 개념을 이해한 후, 잘 만들어진 라이브러리를 활용해보자.
트랜잭션이 없는 갱신
말 그대로 기록이 없는 갱신 (기록을 알아채지 못한 갱신 이라고도 할 수 있겠다)
공유 메모리는 동시성 문제의 원인으로 많이 지목받음
- 공유 메모리까지 아니더라도 수정 가능한 리소스를 공유하는 코드 어디서나 동시성 문제는 발생함.
- ‘불규칙한 실패’는 동시성 문제인 경우가 많다. 먼저 의심해보자.
그 밖의 독점적인 접근
대부분 언어에는 공유 리소스에 독점적으로 접근하는 것을 도와주는 라이브러리가 있음
- 상호 배제(Mutual exclusion), 뮤텍스(Mutex), 세마포어(Semaphore), 모니터(Monitor)
언어 자체에 동시성 지원이 잇는 경우도 있음 → 러스트 (Rust)
- ‘소유권(Ownership)’이라는 개념 → 단 하나의 변수나 매개변수만이 데이터 조각에 접근할 수 있게 강제.
Topic 35. 액터와 프로세스
액터 - 자신만의 비공개 지역 상태(State)를 가진 독립적인 가상 처리 장치(Virtual process)
- 우편함이라고 보자. 액터가 잠자고 있을 때, 우편함에 메시지가 도착하면 액터가 깨어나면서 메시지를 처리. 우편함이 비어있으면 다시 잠든다.
- 메시지 처리할 때, 다른 액터를 생성하거나, 아는 액터에게 메시지를 보내거나, 새로운 상태를 생성할 수 있다.
액터는 언제나 동시성을 가짐
- 액터를 관리하는 것 없음. 과정 조율하는 것 없음.
- 시스템이 저장하는 것은 오직 메시지와 액터의 지역 상태.
- 메시지는 수신자가 읽어 확인하는 법 밖에 없고, 지역상태는 액터 바깥에서 접근이 불가능.
- 모든 메시지는 일방향. 답장이란 개념이 없다. 답장의 측면이 아닌 새로운 메시지를 보내는 측면으로 이해해야 함.
- 액터는 한 번에 하나의 메시지만 처리. 중간에 다른 일을 하지 않음.
액터는 아무것도 공유하지 않으면서 비동기적으로 동시에 실행됨
- 물리적인 리소스(프로세서 등)가 충분하다면 여러 액터를 동시에 돌릴 수 있을 것. 만약 프로세스가 1개라면, 액터마다 컨텍스트를 전환해가며 실행(동시성)시킬 수 있을 것.
그러므로, 액터에서는 동시성을 다루는 코드를 쓸 필요가 없다.
- 고유된 상태 자체가 없기 때문.
- “이걸 한 다음, 저걸 해” 라는 개념의 로직을 작성할 필요도 없다. 단순히 메시지를 수신/발행 만 존재할 뿐.
얼랭 언어, 런타임은 액터 구현의 좋은 사례
- 프로세스가 가벼워 수백만 개를 실행시킬 수 있고, 프로세스(액터를 프로세스라 부름)간 메시지를 통해 통신함. 프로세스 간 격리되어 있어 상태를 공유하지 않는다.
- 가장 신뢰성 높은 시스템들에 사용되며, 99.999999% 가용성을 자랑함.
- 얼랭의 후손인 Elixir도 액터의 개념을 사용하고 있고, 다양한 언어에서 구현체들이 존재함.
Java 계열(JVM)에선 다음과 같은 구현체가 있고, 많이 사용된다.
- Akka
- Vert.x
- 코루틴 액터 개념?
Topic 36. 칠판
칠판에 정보를 넣고, 누군가는 그 정보를 가져가 사용하는 프로세스.
- 정보를 가져가서 적절히 조합해 다시 칠판에 넣을 수도 있다.
- 데이터의 도착 순서를 생각할 필요 없이, 규칙 엔진을 넣어 특정 데이터가 왔을 때 규칙이 실행되도록 할 수 있음 (파이프라인)
메시징 시스템과 유사성
Kafka, NATS 같은 메시징 시스템들.
- 이벤트 로그의 형태를 영속화 함. 패턴 매칭 형태로 메시지도 가져올 수 있음.
- 즉, 메시징 시스템을 칠판으로 이용할 수도 있고액터를 실행하는 플랫폼으로 사용할 수도 있음.
간단하진 않다.
많은 동작이 간접적으로 발생 → 분석이 어렵다.
어떻게 해결할까? 어떤게 도움이 될까?
- 메시지 형식, API를 모아두는 중앙 저장소 운영
- 작업 처리시 고유한 추적 아이디(Trace id)를 추가 → 메시지/정보 추적, 재구성
'Development' 카테고리의 다른 글
딥링크, 유니버셜링크, 앱링크 싹 훑어보기 👀 (1) | 2023.10.12 |
---|---|
우리 PostgreSQL은 언제부터 이뻤나? (0) | 2023.08.11 |
git revert에 대해 (1) | 2023.04.16 |
Javascript에서의 물음표(?) 사용 (0) | 2023.02.23 |
인증(AuthN)과 인가(AuthZ)에 대한 이야기 (0) | 2022.06.12 |
- Total
- Today
- Yesterday
- boj
- 비동기
- Spring
- docker
- gradle
- Spring boot
- java
- hexagonal architecture
- python
- 백준
- tag
- k8s
- 일상
- Log
- container
- 로그
- 클린 아키텍처
- WebFlux
- Clean Architecture
- 쿠버네티스
- c++
- MySQL
- HTTP
- Istio
- Kubernetes
- 알고리즘
- Intellij
- 하루
- Algorithm
- jasync
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |