프로세스 간 통신과 분산 시스템

지금까지 독립적인 프로세스의 구조와 생명주기를 살펴보았다면, 이제는 이들 간의 협력과 통신으로 시야를 확장할 시점입니다. 현대 소프트웨어 시스템의 복잡성은 단일 프로세스로 해결할 수 없는 문제들을 지속적으로 제기하며, 이는 체계적인 프로세스 간 통신 메커니즘의 필요성을 부각시킵니다.

독립적인 프로세스에서 협력적 프로세스로의 전환은 단순한 기술적 확장이 아닙니다. 이는 시스템 설계 패러다임의 근본적 변화를 의미하며, 성능과 안정성, 모듈성과 복잡성 사이의 미묘한 균형을 요구합니다.

프로세스 협력의 근본적 동기

현대 시스템의 모듈화 요구

프로세스 협력이 필요한 이유는 세 가지 핵심 영역으로 구분됩니다. 첫째, 정보 공유입니다. 여러 응용 프로그램이 동일한 정보에 동시 접근해야 하는 상황이 빈번하게 발생합니다. 클립보드를 통한 복사-붙여넣기 기능이나 데이터베이스에 대한 동시 접근이 대표적인 예입니다.

둘째, 계산 가속화입니다. 멀티코어 환경에서 특정 작업을 서브태스크로 분할하여 병렬 처리함으로써 성능을 향상시킬 수 있습니다. 이는 프로세서 코어의 수가 증가하는 하드웨어 트렌드와 직접적으로 연관됩니다.

셋째, 모듈성입니다. 시스템 기능을 별도의 프로세스나 스레드로 분리하여 모듈식 구조를 구성할 수 있습니다. 이는 유지보수성과 확장성을 크게 개선하며, 장애 격리와 독립적인 개발을 가능하게 합니다.

통신 메커니즘의 설계 고려사항

협력적 프로세스들은 데이터를 교환할 수 있는, 즉 서로 데이터를 보내거나 받을 수 있는 프로세스 간 통신 기법이 필요합니다. 이러한 통신 메커니즘을 설계할 때는 성능, 안정성, 구현 복잡성 간의 균형을 신중히 고려해야 합니다.

통신 방식의 선택은 단순한 기술적 결정이 아닙니다. 각 접근법은 시스템의 전체적인 아키텍처와 성능 특성에 근본적인 영향을 미치며, 이후 시스템 진화의 방향을 결정하는 중요한 요소가 됩니다.

IPC 기본 모델의 근본적 차이

공유 메모리와 메시지 패싱의 대비

프로세스 간 통신에는 기본적으로 공유 메모리와 메시지 전달의 두 가지 근본적인 모델이 존재합니다. 이 두 접근법은 서로 다른 철학과 구현 원리를 기반으로 합니다.

3.11 - 통신 모델. (a) 메시지 전달 (b) 공유 메모리

공유 메모리 모델에서는 협력 프로세스들이 공유하는 메모리 영역을 구축합니다. 프로세스들은 이 영역에 데이터를 읽고 쓰는 방식으로 정보를 교환합니다. 이 방식의 핵심적인 장점은 높은 성능입니다. 공유 메모리 영역이 구축되면 모든 접근이 일반적인 메모리 접근으로 취급되어 커널의 개입 없이 처리됩니다.

메시지 전달 모델에서는 통신이 협력 프로세스들 사이에 교환되는 메시지를 통해 이루어집니다. 이 방식은 충돌 회피가 자동으로 보장되므로 적은 양의 데이터를 교환하는 데 유용합니다. 또한 분산 시스템에서 공유 메모리보다 구현하기 용이합니다.

성능과 복잡성의 트레이드오프

두 모델 간의 성능 차이는 흥미로운 분석 대상입니다. 메시지 전달 시스템은 통상 시스템 콜을 사용하여 구현되므로 커널 간섭 등의 부가적인 시간 소모가 발생합니다. 반면 공유 메모리 모델은 초기 설정 이후에는 커널의 도움 없이 직접적인 메모리 접근이 가능합니다.

그러나 성능 비교는 단순하지 않습니다. 소량의 데이터를 한 번만 교환하는 경우에는 메시지 패싱이 더 효율적일 수 있습니다. 공유 메모리는 높은 설정 비용을 가지므로, 이 비용이 상각되지 않으면 오히려 비효율적입니다.

// 성능 특성의 개념적 비교
// 공유 메모리: 높은 설정 비용, 이후 매우 낮은 접근 비용
setup_shared_memory();  // 상당한 초기 비용
for (int i = 0; i < 1000000; i++) {
    shared_data[i] = process_data(i);  // 거의 무시할 수 있는 비용
}

// 메시지 패싱: 낮은 설정 비용, 일정한 통신 비용
for (int i = 0; i < 1000000; i++) {
    send_message(process_data(i));  // 각 통신마다 일정한 오버헤드
}
C
복사

두 모델의 적용 고려사항

IPC 모델 선택에서 데이터 양이 핵심적인 요소입니다. 대량의 데이터를 지속적으로 교환해야 한다면 공유 메모리가 압도적으로 유리하며, 소량의 데이터를 간헐적으로 교환한다면 메시지 패싱이 더 적합합니다.

분산 환경 여부도 결정적입니다. 네트워크를 통해 분리된 시스템 간의 통신에서는 메시지 패싱이 유일한 선택입니다. 공유 메모리는 본질적으로 단일 시스템 내에서만 동작 가능합니다.

안전성 측면에서도 차이가 있습니다. 메시지 패싱은 각 프로세스가 독립적인 메모리 공간을 유지하므로 한 프로세스의 오류가 다른 프로세스에 직접적인 영향을 미치지 않습니다. 반면 공유 메모리에서는 한 프로세스의 메모리 오염이 모든 관련 프로세스에 파급될 수 있습니다.

공유 메모리 시스템의 체계적 구현

생산자-소비자 문제의 실제적 접근

공유 메모리를 사용하는 프로세스 간 통신을 이해하기 위해 협력하는 프로세스의 전형적인 패러다임인 생산자-소비자 문제를 살펴보겠습니다. 이는 실제 시스템에서 빈번하게 나타나는 패턴입니다.

생산자 프로세스는 정보를 생산하고 소비자 프로세스는 정보를 소비합니다. 생산자와 소비자 프로세스들이 병행으로 실행되도록 하려면, 생산자가 정보를 채워 넣고 소비자가 소모할 수 있는 항목들의 버퍼가 반드시 사용 가능해야 합니다.

유한 버퍼를 사용한 구현에서는 다음과 같은 구조를 사용합니다:

#define BUFFER_SIZE 10
typedef struct {
    // 실제 데이터 구조
} item;

item buffer[BUFFER_SIZE];
int in = 0;   // 다음 빈 슬롯 지시
int out = 0;  // 첫 번째 찬 슬롯 지시
C
복사

이 구현에서 공유 버퍼는 원형 배열로 구현됩니다. 두 개의 논리 포인터 in과 out을 가지며, in은 버퍼 내에서 다음으로 비어 있는 위치를 가리키고, out은 버퍼 내에서 첫 번째로 채워져 있는 위치를 가리킵니다. in == out일 때 버퍼는 비어 있고, ((in+1) % BUFFER_SIZE) == out이면 버퍼는 가득 찬 상태입니다.

생산자는 버퍼가 가득 찰 때까지 항목을 생산하고, 소비자는 버퍼가 빌 때까지 항목을 소비합니다:

// 생산자 프로세스
item next_produced;
while (true) {
    /* 항목 생산 */
    while (((in + 1) % BUFFER_SIZE) == out)
        ; /* 버퍼가 가득 찬 경우 대기 */

    buffer[in] = next_produced;
    in = (in + 1) % BUFFER_SIZE;
}

// 소비자 프로세스
item next_consumed;
while (true) {
    while (in == out)
        ; /* 버퍼가 빈 경우 대기 */

    next_consumed = buffer[out];
    out = (out + 1) % BUFFER_SIZE;
    /* 항목 소비 */
}
C
복사

POSIX 공유 메모리의 구체적 구현

POSIX 공유 메모리는 메모리-사상 파일을 사용하여 구현되는데, 이는 흥미로운 추상화입니다. 파일 시스템의 인터페이스를 통해 메모리를 관리하는 이 방식은 지속성과 명명된 자원 관리의 장점을 제공합니다.

구현 과정은 세 단계로 구성됩니다:

#include <sys/mman.h>
#include <sys/stat.h>
#include <fcntl.h>

// 1단계: 공유 메모리 객체 생성
fd = shm_open("OS", O_CREAT | O_RDWR, 0666);

// 2단계: 객체 크기 설정
ftruncate(fd, 4096);

// 3단계: 메모리 매핑
ptr = (char *)mmap(0, 4096, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
C
복사

생산자 프로세스는 다음과 같이 데이터를 공유 메모리에 기록합니다:

const char *message_0 = "Hello";
const char *message_1 = "World!";

sprintf(ptr, "%s", message_0);
ptr += strlen(message_0);
sprintf(ptr, "%s", message_1);
C
복사

소비자 프로세스는 해당 데이터를 읽고 정리 작업을 수행합니다:

printf("%s", (char *)ptr);
shm_unlink("OS");  // 공유 메모리 객체 제거
C
복사

동기화 문제의 근본적 중요성

공유 메모리 시스템에서 간과하기 쉬운 핵심적인 문제는 생산자와 소비자가 병행하게 공유 버퍼를 접근하는 상황에 대한 고려입니다. 앞서 제시한 예제에서는 이 문제가 명시적으로 다루어지지 않았지만, 실제 시스템에서는 이것이 가장 복잡하고 중요한 측면입니다.

경쟁 조건(race condition)과 임계 구역(critical section) 문제는 공유 메모리 통신의 본질적인 도전입니다. 세마포어, 뮤텍스, 조건 변수 등의 동기화 도구가 필수적이며, 이들의 적절한 사용이 시스템의 정확성을 결정합니다.

메시지 전달 시스템의 설계 원리

기본 프리미티브와 통신 모델

메시지 전달 방식은 동일한 주소 공간을 공유하지 않고도 프로세스들이 통신하고 동작을 동기화할 수 있도록 하는 기법을 제공합니다. 메시지 전달 시스템은 최소한 두 가지 연산을 제공해야 합니다: send(message)와 receive(message).

통신 연결의 논리적 구현에는 여러 방법이 있으며, 각각은 서로 다른 특성과 적용 영역을 가집니다.

직접 통신과 간접 통신의 비교

직접 통신에서는 통신하는 각 프로세스가 상대방의 이름을 명시해야 합니다. 대칭적 직접 통신에서는 송신자와 수신자 모두가 상대방을 명시합니다:

send(P, message);     // 프로세스 P에게 메시지 전송
receive(Q, message);  // 프로세스 Q로부터 메시지 수신
C
복사

비대칭적 직접 통신에서는 송신자만 수신자를 명시합니다:

send(P, message);     // 프로세스 P에게 메시지 전송
receive(id, message); // 임의의 프로세스로부터 수신, id에 송신자 정보 저장
C
복사

간접 통신에서는 메일박스나 포트를 통해 메시지를 교환합니다:

send(A, message);     // 메일박스 A로 메시지 전송
receive(A, message);  // 메일박스 A에서 메시지 수신
C
복사

메일박스의 실제 구현

간접 통신에서 사용되는 메일박스나 포트라는 개념이 실제로 어떻게 구현되어 있는지 살펴보는 것이 흥미로운 부분입니다. 메일박스는 단순한 개념적 설명이 아닌 구체적으로 구현되는 IPC 메커니즘입니다.

POSIX 메시지 큐는 메일박스의 실제 구현 사례입니다:

#include <mqueue.h>

// 메시지 큐 생성 (메일박스 역할)
mqd_t mq = mq_open("/my_mailbox", O_CREAT | O_WRONLY, 0644, NULL);

// 메시지 전송
mq_send(mq, "Hello", 5, 0);

// 메시지 수신
char buffer[100];
mq_receive(mq, buffer, 100, NULL);
C
복사

System V 메시지 큐도 유사한 메일박스 기능을 제공합니다:

#include <sys/msg.h>

// 메시지 큐 생성
int msgid = msgget(KEY, IPC_CREAT | 0666);

struct msg_buffer {
    long msg_type;
    char msg_text[100];
};

// 메시지 전송과 수신
msgsnd(msgid, &message, sizeof(message.msg_text), 0);
msgrcv(msgid, &message, sizeof(message.msg_text), 1, 0);
C
복사

메일박스와 포트는 서로 다른 개념입니다. 포트는 주로 네트워크 통신의 끝점을 의미하며 TCP/UDP에서 사용되는 반면, 메일박스는 프로세스 간 메시지 교환을 위한 중간 저장소 역할을 합니다.

파이프: 단순하면서도 강력한 통신 도구

파이프는 두 프로세스가 통신할 수 있게 하는 전달자로서 동작하는 친숙한 IPC 메커니즘입니다. 일상적으로 쉘에서 | 기호로 사용하는 그 파이프가 바로 이 개념의 구현입니다. 파이프는 초기 UNIX 시스템에서 제공하는 IPC 기법 중 하나였으며, 현재까지도 널리 사용되고 있습니다.

일반 파이프(anonymous pipe)는 생산자-소비자 형태로 두 프로세스 간의 통신을 허용합니다. 한쪽으로만 데이터를 전송할 수 있는 단방향 통신만 가능하며, 통상 부모 프로세스가 파이프를 생성하고 fork()로 생성한 자식 프로세스와 통신하기 위해 사용합니다.

#include <unistd.h>

int fd[2];
pipe(fd);  // fd[0]: 읽기용, fd[1]: 쓰기용

pid_t pid = fork();
if (pid == 0) {
    // 자식 프로세스
    close(fd[1]);  // 쓰기 끝 닫기
    char buffer[100];
    read(fd[0], buffer, 100);
    close(fd[0]);
} else {
    // 부모 프로세스  
    close(fd[0]);  // 읽기 끝 닫기
    write(fd[1], "Hello", 5);
    close(fd[1]);
}
C
복사

지명 파이프(named pipe)는 더 강력한 통신 도구를 제공합니다. 통신은 양방향으로 가능하며 부모-자식 관계도 필요하지 않습니다. 지명 파이프가 구축되면 여러 프로세스들이 이를 사용하여 통신할 수 있으며, 통신 프로세스가 종료하더라도 지명 파이프는 계속 존재합니다.

UNIX에서는 지명 파이프를 FIFO라고 부르며, mkfifo() 시스템 콜을 이용하여 생성되고 일반적인 open(), read(), write() 및 close() 시스템 콜로 조작됩니다. Windows에서는 CreateNamedPipe() 함수를 사용하여 생성하며, 전이중 통신을 허용하고 네트워크를 통한 분산 통신도 지원합니다.

동기화와 버퍼링 전략

메시지 전달에서 동기화는 봉쇄형과 비봉쇄형 방식으로 구분됩니다. 봉쇄형 보내기에서는 송신하는 프로세스가 메시지가 수신 프로세스에 의해 수신될 때까지 봉쇄됩니다. 비봉쇄형 보내기에서는 송신하는 프로세스가 메시지를 보내고 즉시 작업을 재시작합니다.

수신 측에서도 봉쇄형 받기는 메시지가 이용 가능할 때까지 프로세스를 봉쇄하고, 비봉쇄형 받기는 즉시 반환됩니다(유효한 메시지 또는 널 값).

버퍼링 정책도 시스템 설계의 중요한 측면입니다:

•

무용량: 큐의 최대 길이가 0으로, 직접 전달(랑데부) 방식

•

유한 용량: 큐가 유한한 길이를 가지며, 큐가 가득 차면 송신자가 대기

•

무한 용량: 큐가 잠재적으로 무한한 길이를 가지며, 송신자는 절대 봉쇄되지 않음

Windows ALPC의 고성능 통신 메커니즘

ALPC의 기본 개념

Windows의 고급 로컬 프로시저 호출(ALPC, Advanced Local Procedure Call)은 동일 기계상에 있는 두 프로세스 간의 통신에 사용되는 메시지 전달 설비입니다. 이는 널리 사용되는 표준 원격 프로시저 호출(RPC) 기법과 유사하지만, Windows에 맞게 특별히 최적화된 메커니즘입니다.

ALPC는 Mach와 유사하게 두 프로세스 간에 연결을 구축하고 유지하기 위해 포트 객체를 사용합니다. 연결 포트와 통신 포트의 두 가지 유형의 포트를 사용하여 클라이언트와 서버 간의 효율적인 통신을 가능하게 합니다.

계층적 아키텍처의 이해

ALPC의 흥미로운 점은 계층적 구조를 보여준다는 것입니다. ALPC는 운영체제 내부 구현이고, RPC는 개발자용 API라는 구조로 되어 있습니다.

┌─────────────────────────────────────┐
│    응용 프로그램 (Application)        │
├─────────────────────────────────────┤
│    RPC API (개발자 사용)             │  ← 응용 프로그래머 레벨
├─────────────────────────────────────┤
│    RPC Runtime Library              │
├─────────────────────────────────────┤
│    ALPC (Advanced LPC)              │  ← 운영체제 내부 구현
├─────────────────────────────────────┤
│    커널 (Kernel)                    │
└─────────────────────────────────────┘
Plain Text
복사

이러한 계층적 분리는 추상화와 구현의 분리를 명확히 보여줍니다. 개발자는 고수준 RPC API를 사용하지만, 실제 통신은 ALPC가 담당하는 구조입니다.

섹션 객체와 대용량 데이터 처리

ALPC 채널이 생성되면 메시지 크기에 따라 세 가지 전달 기법 중 하나가 선택됩니다. 256바이트까지의 작은 메시지는 포트의 메시지 큐를 중간 저장소로 사용하며, 대용량 메시지는 섹션 객체를 통해 전달됩니다.

학습 과정에서 궁금했던 "섹션 객체는 채널과 연관된 공유 메모리인가?"라는 질문에 대한 답은 정확합니다. 섹션 객체는 대용량 데이터 전송을 위한 공유 메모리 메커니즘입니다.

3.19 - Windows의 고급 로컬 프로시저 호출

동작 과정은 다음과 같습니다:

// 개념적 구현
struct control_message {
    void* section_pointer;    // 섹션 객체 포인터
    size_t data_size;        // 실제 데이터 크기
    int message_type;        // 메시지 타입
};

// 실제 대용량 데이터는 공유 메모리에 직접 기록
memcpy(shared_memory, large_data, large_data_size);

// 포인터 정보만 포트를 통해 전송
send_message(port, &control_message);
C
복사

이 방식의 핵심적인 장점은 복사 없는 전송입니다. 데이터를 복사하지 않고 메모리 포인터만 전달하므로 대용량 데이터 전송 시 성능이 크게 향상됩니다.

현대적 IPC의 발전 방향

ALPC는 Windows API의 일부가 아니므로 응용 프로그래머는 직접 사용할 수 없습니다. 대신 표준 원격 프로시저 호출을 사용하면 간접적으로 ALPC를 통해 처리됩니다. 이는 추상화 계층의 명확한 분리를 보여주는 좋은 사례입니다.

다른 운영체제들도 유사한 구조를 가집니다. Linux는 D-Bus(응용)와 Unix Domain Socket(내부), macOS는 XPC(응용)와 Mach IPC(내부)의 조합을 사용합니다.

네트워크 기반 통신의 체계적 접근

소켓: 분산 시스템의 기초

소켓은 통신의 극점(endpoint)으로 정의되며, 두 프로세스가 네트워크상에서 통신하려면 양 프로세스마다 하나씩 총 두 개의 소켓이 필요합니다. 각 소켓은 IP 주소와 포트 번호를 결합하여 구별됩니다.

3.26 - 소켓을 사용한 통신

소켓은 일반적으로 클라이언트-서버 구조를 사용합니다. 서버는 지정된 포트에서 클라이언트 요청을 기다리고, 요청이 수신되면 클라이언트 소켓과의 연결을 수립합니다.

간단한 Date 서버 구현을 통해 소켓 통신의 기본 원리를 살펴보겠습니다:

// 서버 측 구현
import java.net.*;
import java.io.*;

public class DateServer {
    public static void main(String[] args) {
        try {
            ServerSocket sock = new ServerSocket(6013);

            while (true) {
                Socket client = sock.accept();
                PrintWriter pout = new PrintWriter(
                    client.getOutputStream(), true);

                pout.println(new java.util.Date().toString());
                client.close();
            }
        } catch (IOException ioe) {
            System.err.println(ioe);
        }
    }
}
Java
복사

클라이언트는 서버의 포트에 연결하여 데이터를 받습니다:

// 클라이언트 측 구현
Socket socket = new Socket("127.0.0.1", 6013);
BufferedReader reader = new BufferedReader(
    new InputStreamReader(socket.getInputStream()));

String dateString = reader.readLine();
System.out.println("Date: " + dateString);
socket.close();
Java
복사

RPC: 원격 프로시저 호출의 추상화

원격 서비스와 관련한 가장 보편적인 형태 중 하나는 RPC 패러다임입니다. 이는 네트워크에 연결된 두 시스템 사이의 통신에 사용하기 위하여 프로시저 호출 기법을 추상화하는 방법으로 설계되었습니다.

학습 과정에서 궁금했던 "RPC 스텁이 정확히 무엇을 하는 것인가?"라는 질문의 답은 다음과 같습니다. 스텁은 원격 호출을 로컬 호출처럼 보이게 하는 프록시입니다.

스텁의 구현은 클라이언트 측과 서버 측으로 나뉩니다:

// 클라이언트 스텁 (컴파일러가 자동 생성)
int add(int a, int b) {
    // 매개변수 마샬링
    char buffer[1024];
    pack_int(buffer, a);
    pack_int(buffer + 4, b);

    // 네트워크 전송
    send_message(server_address, "add", buffer, 8);

    // 응답 수신 및 언마샬링
    char response[1024];
    receive_message(response);
    return unpack_int(response);
}

// 서버 스텁 (컴파일러가 자동 생성)
void server_stub_dispatcher(char* message) {
    char* function_name = extract_function_name(message);

    if (strcmp(function_name, "add") == 0) {
        int a = unpack_int(message);
        int b = unpack_int(message + 4);

        int result = real_add_function(a, b);

        char response[1024];
        pack_int(response, result);
        send_response(response, 4);
    }
}
C
복사

RPC의 핵심 설계 과제들

RPC 시스템 설계에서 가장 중요한 과제들은 다음과 같습니다:

매개변수 마샬링은 클라이언트와 서버 기기의 데이터 표현 방식 차이 문제를 해결합니다. 32비트 정수를 예로 들면, 어떤 기계는 big-endian을, 어떤 기계는 little-endian을 사용합니다. 이를 해결하기 위해 대부분의 RPC 시스템은 XDR(External Data Representation) 같은 기종 중립적인 데이터 표현 방식을 정의합니다.

호출 의미는 네트워크 오류 상황에서의 동작을 정의합니다. "정확히 한 번" 의미를 구현하려면 서버가 중복 메시지를 검사하고, 클라이언트가 응답을 받을 때까지 재전송하는 복잡한 프로토콜이 필요합니다.

바인딩은 클라이언트가 서버의 위치를 찾는 방법을 다룹니다. 고정된 포트 주소를 사용하거나, 랑데부 방식으로 동적으로 바인딩할 수 있습니다.

현대적 RPC 구현들

현대의 RPC 시스템들은 더욱 정교하고 효율적인 구현을 제공합니다. gRPC는 Protocol Buffers와 HTTP/2를 조합하여 높은 성능과 상호 운용성을 제공합니다. Apache Thrift는 다중 언어 지원에 특화되어 있으며, JSON-RPC는 웹 기반의 경량 RPC 솔루션을 제공합니다.

정리

3장을 통해 프로세스라는 개념을 단계적으로 살펴보았습니다. 프로세스의 본질과 상태 관리에서 시작해 생명주기와 스케줄링을 거쳐 프로세스 간 통신까지, 독립적인 프로세스에서 협력적 프로세스로의 확장을 이해할 수 있었습니다.

프로세스 간 통신에서 공유 메모리와 메시지 패싱이라는 두 가지 기본 모델은 각각 고유한 특성을 가집니다. POSIX 공유 메모리, 메시지 큐, Windows ALPC, 그리고 네트워크 기반 소켓과 RPC까지, 각 시스템은 서로 다른 구현 방식을 사용하지만 근본적인 설계 원리는 일관됩니다.

프로세스의 메모리 구조에서 시작해 상태 관리, 스케줄링, 그리고 통신까지, 이 모든 개념들은 서로 밀접하게 연관되어 하나의 일관된 시스템을 구성합니다. 이러한 기본 원리들의 정확한 이해는 복잡한 시스템을 설계하고 분석하는 데 필수적인 기초가 됩니다.

참고

운영체제 - 예스24

운영체제

https://www.yes24.com/product/goods/89496122