본문 바로가기

프로그래밍(TA, AA)/C C++

[시스템프로그래밍] 유닉스 시스템 프로그래밍 개요

언어와 운영체제 그리고 프로그래밍 방법론에 따라 다양한 프로그래밍 방식이 있지만, 유닉스를 기반으로 한 시스템 프로그래밍에 대해서 알아보겠습니다. 시스템 프로그래머가 되려는 사람은 필수적으로 이 책의 내용을 공부해야 합니다. 유닉스 시스템 관리자가 되려는 사람도 이 책의 내용만큼은 기본적으로 이해아혹 있어야 합니다. 시스템 관리자도 직접 프로그램을 작성해 필요한 도구를 개발하기도 하고, 소스로 배포되는 소프트웨어를 컴파일해 설치해야 할 때도 있기 때문입니다.


유닉스 시스템에서 제공하는 시스템 호출과 라이브러리 함수를 사용해 시스템 프로그램을 작성하는 방법에 대해 알아보려고 합니다. 유닉스 시스템을 다루려면 대한 기본적인 이해와 C 언어를 이용해 프로그램을 작성할 수 있는 능력이 필요합니다. 유닉스 시스템 프로그래밍에서 다루는 시스템 호출이 결국 C언어에서 함수로 사용되기 때문입니다.


저는 한빛미디어의 [유닉스 시스템 프로그래밍]으로 공부를 진행할 예정입니다. 해당 교재는 총 12장으로 되어있고, 각 장의 내용을 간략하게 설명하면 아래와 같습니다. 


1장: 유닉스 시스템 프로그래밍의 정의와 프로그래밍 표준을 살펴보고, 유닉스 시스템 프로그래밍에 필요한 기본 명령과 C 컴파일러의 사용법, make 명령 사용법을 살펴보겠습니다.


2장: 파일 입출력의 특징을 살펴보고 저수준 파일 입출력 함수와 고수준 파일 입출력 함수를 살펴보겠습니다. 임시 파일을 만들어 활용하는 방법도 다루게 됩니다.


3장: 유닉스 시스템에서 사용하는 파일의 특징을 살펴보고, 파일 정보 검색, 파일 접근 권한 변경과 관련된 함수를 다룹니다. 하드 링크와 심볼릭 링크의 개념과 관련 함수를 살펴보겠습니다. 디렉토리의 특징을 이해하고, 디렉토리 생성, 검색, 삭제 함수의 활용법을 배웁니다.


4장: 유닉스 시스템의 설정 정보를 검색하고 설정하는 함수와 사용자 관련 정보를 검색하는 함수를 살펴보겠습니다. 유닉스 시스템에서 시간 정보를 다루는 방법을 이해하고 시간 정보를 검색하는 다양한 함수를 익히게 됩니다.


5장~6장: 프로세스의 개념을 이해하고 프로세스의 정보를 검색하고 프로세스의 실행 시간을 측정하는 함수를 다룹니다. 프로세스를 생성하고 종료하는 함수와 exec 함수군을 사용해 새로운 프로세스를 실행하는 방법을 살펴봅니다. 프로세스 사이의 동기화 개념과 관련 함수를 배웁니다.


7장: 시그널은 프로세스 사이에 주고받는 간단한 메시지 입니다. 시그널의 기본 개념과 종류를 살펴보고 시그널 처리 함수의 사용법을 배웁니다.


8장~10장: 메모리 매핑, 파이프, 메시지 큐, 공유 메모리, 세마포어 등 프로세스 간 통신 방법을 배웁니다. 각 통신 방법의 기본 개념을 이해하고 다양한 시스템 호출과 함수를 사용하여 프로세스 사이에 통신하는 방법을 살펴봅니다.


11장~12장: TCP/IP 프로토콜의 기본 개념을 이해하고, 소켓 프로그래밍에 필요한 구조체와 기본 함수를 익힙니다. 소켓을 이용해 다른 시스템과의 통신 프로그래밍 방법을 배우고, 예제를 통해 TCP와 UDP를 이용한 통신 프로그램 작성 방법을 살펴봅니다.



유닉스 시스템 프로그래밍 개요


유닉스 시스템 프로그래밍은 유닉스에서 제공하는 시스템 호출을 이용해서 프로그램을 작성하는 것입니다. 시스템 호출은 유닉스 시스템이 제공하는 서비스를 프로그램에서 이용할 수 있도록 지원하는 프로그래밍 인터페이스를 의미합니다. 유닉스에서 동작하는 프로그램을 작성하려면 간단한 프로그램을 제외하고 대부분은 시스템 호출을 이용해야 합니다. 다른 프로그래머가 개발한 프로그램을 이해하기 위해서도 어떤 시스템 호출이 있고, 어떻게 사용하는지를 알고 있어야 합니다. 


유닉스 시스템에서 프로그램을 작성하려면 컴파일러가 있어야 합니다.이 책에서 사용한 GNU C 컴파일러와 프로그램을 컴파일할 때 도움을 주는 도구인 make 명령의 사용 방법을 설명합니다. 또한 유닉스 시스템 프로그래밍에서 자주 사용하는 오류 처리 함수인 perror 함수와 동적 메모리 할당 관련 함수, 명령행 인자를 처리하는 방법을 설명합니다.


아래는 유닉스 시스템에서 C로 작성한 프로그램의 호환성을 보장하기 위한 여러 가지 표준이 존재합니다. SVR4는 이러한 표준을 준수하고 있습니다. 유닉스 시스템 프로그래밍 관련 주요 표준은 다음과 같습니다.


ANSI C 표준

ANSI(American National Standards Institute)는 미국 표준 협회로, 국제적으로 영향력 있는 표준을 정의하고 있습니다. 이 ANSI에서 표준화한 C언어 명세가 ANSI C 표준으로, C언어의 문법과 라이브러리, 헤더 파일 등을 정의하고 있습니다.  ANSI C는 ANSX3.159-1989라는 이름으로 등록되었고, 이를 국제 표준 기구인 ISO가 받아들여 ISO/IEC 9899:1990으로 발표해 국제 표준이 되었습니다. 현재 ISO/IEC 9899:1999로 발전했으며 http://www.iso.org에서 비용을 지불하고 표준을 구할 수 있습니다.


POSIX

POSIX(Portable Operating System Interface)는 유닉스에 기반을 두고 있는 일련의 표준 운영체제 인터페이스입니다. 서로 다른 유닉스 시스템 사이에서 상호 이식이 가능한 응용 프로그램을 개발하기 위해 정해진 표준입니다. POSIX는 IEEE에서 정의한 규격으로 유닉스 시스템의 공통 응용 프로그래밍 인터페이스를 정리했습니다. POSIX의 마지막 글자인 'X'는 유닉스 호환 운영체제에 보통 X가 붙는 데서 유래한 것입니다.


POSIX.1은 C 언어 응용 프로그래밍 인터페이스의 표준으로 파일과 디렉토리, 프로세스 관리, 입출력 등 기본 서비스 제공을 위한 인터페이스를 정의합니다. POSIX.2는 표준 쉘과 유틸리티 프로그램 인터페이스입니다. POSIX.1은 IEEE Std 1003.1이며, POSIX.2는 IEEE Std 1003.2입니다. 또한 http://www.unix.org 사이트에서 찾을 수 있습니다. 유닉스 계열 외에 마이크로소프트 윈도우즈 NT는 POSIX 1.0에 준하는 POSIX 서브시스템을 탑재했습니다. 윈도우즈 2000까지 POSIX 서브시스템을 탑재했지만 윈도우즈 XP에서 폐지했습니다.


X/Open 가이드

X/Open은 1984년에 유럽의 유닉스 시스템 제조업체를 중심으로 설립된 단체로, 개방시스템에 관한 표준을 정의하고 보급하는 일을 목적으로 하고 있습니다. 특히, 유닉스 시스템에서 응용 프로그램의 이식성을 높이는 것이 초기 목표였습니다. 이를 위해 X/Open에서는 X/Open 이식성 가이드를 발표했습니다. XPG에는 운영체제 기본 인터페이스, 국제화, 터미널 인터페이스, 프로세스 간 통신, C 언어를 포함한 프로그래밍 언어, 데이터 관리 등에 관한 지침이 정의되어 있습니다. 


시스템 V 인터페이스 정의

유닉스 시스템 V의 인터페이스를 정의하는 SVID는 프로그램과 장치에서 이용할 수 있는 시스템 호출과 C 라이브러리에 관한 표준을 포함합니다. POSIX나 X/Open의 작업은 부분적으로 SVID에 기반을 두고 있습니다. SVID 표준을 준수하면 하드웨어에 독립적인 프로그래밍을 할 수 있습니다.


단일 유닉스 규격

단일 유닉스 규격은 컴퓨터 운영체제가 유닉스라는 이름을 사용하기 위해 지켜야 하는 표준의 총칭입니다. SUS는 IEEE와 오픈 그룹의 표준화 작업 결과물에 바탕을 두고 있으며, 오스틴 그룹이 개발 및 유지 관리를 담당하고 있습니다. SUS는 1980년대 중반부터 시작된 유닉스의 시스템 인터페이스를 표준화하기 위한 프로젝트에서 출발했습니다. 1998년에 오스틴 그룹이라고 알려진 작업 그룹에서 이전의 여러 표준을 종합해 SUSv3라는 표준을 개발하기 시작해서 2002년에 발표했습니다. SUSv3에는 C언어의 헤더 파일 규격, 쉘과 명령어 규격, 시스템 호출 규격 등이 포함되어 있습니다.



유닉스 시스템 프로그래밍이란


일반적으로 C언어를 제어문이나 데이터형, 배열, 포인터 같은 기본적인 구문과 개념 위주로 배웁니다. 기본 구문으로도 여러 응용 프로그램을 작성할 수 있지만, 많은 경우 쉽게 사용할 수 있는 형태로 제공되는 상위 레벨 함수를 사용해 프로그래밍합니다. 이 단계에서는 대부분 유닉스 시스템에서 제공하는 서비스를 직접사용하지는 않습니다.


유닉스 시스템 프로그래밍이란 일반적인 응용프로그래밍과 달리 유닉스에서 제공하는 시스템 호출(시스템 콜, 시스템 함수)을 사용해 프로그램을 작성하는 것입니다. 시스템 프로그래밍의 핵심이라고 할 수 있는 시스템 호출이 무엇인지 알아보고, 일반적인 라이브러리 함수와의 차이를 알아보겠습니다.



1) 시스템 호출과 라이브러리 함수

유닉스 시스템은 파일 시스템 접근이나 사용자 정보, 시스템 정보, 시스템 시간 정보, 네트워킹 등 다양한 서비스를 제공합니다. 유닉스 시스템이 제공하는 이러한 서비스를 이용해 프로그램을 구현할 수 있도록 제공되는 프로그래밍 인터페이스를 시스템 호출이라고 합니다. 다시 말해, 시스템 호출을 사용하면 유닉스 시스템의 서비스를 직접 이용하는 프로그램을 작성할 수 있습니다.


시스템 호출의 형태

시스템 호출은 프로그래밍 인터페이스이므로, 기본적인 형태는 C 언어의 함수와 같습니다. 함수명처럼 시스템 호출에 사용할 이름이 정의되어 있습니다. 시스템 호출의 종류에 따라 인자가 있을 수도 있고, 없을 수도 있습니다. 시스템 호출은 리턴값으로 결과값을 리턴하는 경우도 있지만, 대부분은 시스템 호출의 성공이나 실패를 알려주는 정수값을 리턴하게 됩니다.


라이브러리 함수

라이브러리는 미리 컴파일된 함수들을 묶어서 제공하는 특수한 형태의 파일입니다. C 언어는 데이터 입출력, 수학 공식, 문자열 처리 등 응용프로그램 개발에 필요한 함수들을 유형별로 분류해 라이브러리로 제공합니다. 라이브러리 함수는 라이브러리에 포함되어 있는 함수를 의미합니다. 함수들을 묶어서 라이브러리로 만드는 이유는 자주 사용하는 기능을 독립적으로 구현해둠으로써, 프로그램의 개발과 디버깅을 쉽게하고 컴파일을 좀 더 빠르게 할수 있기 때문입니다.


유닉스 시스템에서 라이브러리는 보통 /lib나 /usr/lib에 위치합니다. 라이브러리는 일반적으로 이름이 'lib'으로 시작하며, .a나 .so 형태의 확장자를 갖습니다. lib*.a는 정적 라이브러리이고, lib*.so는 공유 라이브러리입니다. 정적 라이브러리는 프로그램을 컴파일할 때 같이 적재되어 있는 실행파일을 구성합니다. 실행 파일에 라이브러리 코드가 포함되므로 크기가 그만큼 커질 수 있습니다. 공유 라이브러리는 실행 파일에 포함되지 않습니다. 공유 라이브러리를 이용해 생성한 실행 파일을 실행 시에 해당 라이브러리가 메모리에 적재 됩니다. 이렇게 적재된 라이브러리는 다른 실행 파일에서도 공유할 수 있습니다. 최근에는 메모리를 효율적으로 사용하기 위해 공유 라이브러리를 많이 사용합니다.



2) 시스템 호출과 라이브러리 함수의 비교

응용 프로그램은 라이브러리 함수나 시스템 호출을 이용해 작성할 수 있습니다. 시스템 호출은 커널의 해당 모듈을 직접 호출해 작업하고 결과를 리턴합니다. 커널, 즉 시스템을 직접호출하기 때문에 시스템 호출이라고 하는 것입니다. 그러나 라이브러리 함수는 일반적으로 커널 모듈을 직접 호출하지 않습니다. 라이브러리 함수에서 커널의 서비스를 이용할 경우에는 함수 내부에서 시스템 호출을 사용합니다. 물론 프로그래머는 라이브러리 함수가 시스템 호출을 사용하는지 알 필요가 없습니다.




유닉스 시스템에서 프로그래밍할 때 시스템 호출과 라이브러리 함수의 기본 형식과 사용 방법이 유사하기 때문에 구별하기 어려울 수 있습니다. 하지만 유닉스 시스템에서 제공하는 맨 페이지(man)의 위치와 오류 처리 방법을 잘 살펴보면 구별이 가능합니다. 그렇다고 이둘을 엄격하게 구별하느라 신경을 곤두세울 필요는 없습니다. 시스템 호출이나 라이브러리 함수의 사용방법을 확인하고, 이에 따라 프로그래밍하면 됩니다.



맨 페이지 위치

유닉스 시스템은 명령이나 함수 등 시스템이 제공하는 다양한 서비스에 대한 맨 페이지를 제공합니다. 사용자는 man 명령을 사용해 맨 페이지를 검색하고 도움을 얻을 수 있습니다. 맨 페이지는 종류에 따라 섹션이 구분되어 있습니다. 시스템 호출은 섹션 2에 속하고, 라이브러리 함수는 섹션 3에 속합니다. 유닉스에서 흔히 사용하는 일반적인 명령에 관한 설명은 섹션 1에 속합니다. man 명령으로 검색하면 해당 명령이나 함수가 어느 섹션에 속하는지 알 수 있습니다. 예를 들어, 시스템 호출 중 하나인 open에 관한 설명을 보면 다음과 같이 상단에 'System Calls'라고 나오고, 'open(2)'로 표시됩니다. 여기서 괄호 안에 있는 숫자가 섹션을 의미합니다. 


오류 처리 방법

시스템 호출은 성공적으로 수행하면 0을 리턴합니다. 한편 실패하면 -1을 리턴하고, 전역 변수 errno에 오류 코드(오류의 종류를 나타내는 코드값)를 저장합니다. 각 시스템 호출의 오류 코드는 맨 페이지를 참조하면 알 수 있습니다.

#include <unistd.h>
#include <stdio.h>

extern int errno;

int main(void) {
	if(access("unix.txt", F_OK) == -1) {
		printf("errono=%d\n", errno);
	}

	return 0;
}

<sys/errno.h> 파일에서 오류 코드 부분을 보면 상수 2가 ENOENT로 정의되어 있는데, ENOENT는 해당 파일이 존재하지 않음을 의미합니다. 이외에도 access 함수에서 발생하는 오류코드로 FACCES, EFAULT, EINTR, ELOOP, ENOLINK, ENOTDIR 등이 있습니다. man access 명령으로 access 함수에서 발생하는 오류 코드와 해당 설명을 확인해 볼수도 있습니다.


라이브러리 함수는 오류가 발생한 경우 NULL을 리턴합니다. 물론 함수의 리턴값이 int 형일 경우에는 -1을 리턴합니다. 시스템 호출과 마찬가지로 errno 변수에 오류 코드를 저장합니다. 그럼 라이브러리 함수에서 오류가 발생한 경우 리턴하는 값을 알아보겠습니다.


#include <unistd.h>
#include <stdio.h>

extern int errno;

int main(void) {
	FILE *fp;
	
	if ((fp = fopen("unix.txt", "r")) == NULL) {
		printf("errno=%d\n", errno);
		exit(1);
	}
	fclose(fp);

	return 0;
}



유닉스 시스템 도구


vi 같은 편집기를 이용해 작성한 프로그램을 실행하려면 컴파일을 거쳐야 합니다. 컴파일이란 텍스트로 작성한 프로그램을 시스템이 이해할 수 있는 기계어(machine language)로 변환하는 과정을 의미합니다. 보통 컴파일을 한다고 하면 컴파일 과정과 라이브러리 링크 과정을 하나로 묶어서 수행하는 것을 의미합니다. 아래 컴파일 과정을 나타낸 것입니다.


[test.c] ─ 컴파일 → [test.o] ─ 링크 → [test.o] + [printf.o(libC.a)] ─ 실행 파일 → [a.out]


사용자가 작성한 test.c를 컴파일하면 오브젝트 파일인 test.o가 생성되고, 이를 라이브러리 함수와 링크해 실행 파일을 생성합니다. test.c에서 printf 함수만 사용했으므로 표준 C 라이브러리인 libC.a에서 printf.o 파일을 찾아 링크하는 과정을 보여줍니다.



GNU C 컴파일러 : gcc

프로그램을 컴파일하려면 이를 수행하는 컴파일러가 설치되어 있어야 합니다. 썬 마이크로 시스템즈의 솔라리스는 기본적으로 C 컴파일러를 제공하지 않고 별도로 판매하고 있습니다. 따라서 솔라리스에서 프로그래밍을 하는 대부분의 프로그래머는 GNU C 컴파일러를 이용합니다. GNU C 컴파일러의 명령은 gcc입니다. 이 책의 모든 예제는 솔라리스 10에서 gcc로 컴파일하고 테스트 했습니다.


  [ gcc ]

기능: C 프로그램을 컴파일해 실행 파일을 생성한다.

형식: gcc [옵션] [파일명]

옵션: -c: 오브젝트 파일(.o)만 생성한다 / -o 실행 파일명: 지정한 이름으로 실행 파일을 생성한다. 기본 실행 파일명은 a.out 이다.

사용 예: gcc test.c / gcc -c test.c / gcc -o test test.c




gcc는 기본적으로 /usr/local/bin 디렉토리에 설치됩니다. 따라서 사용자 환경 설정 파일에서 /usr/local/bin 디렉토리를 경로에 추가해야 합니다. 예를 들어, 사용자가 콘 쉘(ksh) 환경일 경우 ~/.profile에 다음과 같이 경로를 설정합니다.


[root@dev-web unix_system]# vim ~/.profile

...

PATH=$PATH:/usr/local/bin

export PATH

[root@dev-web unix_system]# . ~/.profile


c로 작성한 예제 프로그램을 test.c라고 하면 다음과 같이 컴파일 하면 됩니다. 별도의 실행 파일명을 지정하지 않을 경우, a.out으로 실행파일이 생성되고, 실행파일 명을 제대로 지정하고 싶다면 -o 옵션을 사용하면 됩니다.


[root@dev-web unix_system]# gcc -o test test.c

[root@dev-web unix_system]# ls

a.out  test  test.c


실행파일명을 입력하면 프로그램이 실행됩니다. 만일 현재 디렉토리(.)가 경로에 있지 않을 경우 현재 디렉토리를 명시적으로 지정해 실행하면 됩니다.



Makefile과 make


대부분의 경우 프로그램을 작성할때 소스 파일이 하나가 아닌 여러 개로 구성되고, 컴파일 시 이를 묶어서 실행 파일을 생성하게 됩니다. 유닉스 시스템에서는 이렇게 여러 소스 파일을 컴파일하고 링크해서 실행 파일을 생성하는 데 사용할 수 있는 도구로 Makefile 설정 파일과  make 명령을 제공합니다. Makefile은 컴파일 명령, 소스 파일을 컴파일하는 방법, 링크할 파일들, 실행 파일명 등을 설정하는 파일입니다. make 명령은 Makefile을 읽고 해당 파일에서 지정한대로 컴파일을 실행하고 실행 파일을 생성합니다. 실행 파일을 한 번 생성한 후에는 변경 사항이 있는 파일만 재컴파일합니다. make 명령은 /usr/ccs/bin 디렉토리에 있으므로 사용자 환경 설정의 경로에 추가하는 것이 좋습니다.


make 명령을 사용하는 예제를 살펴보겠습니다. 소스 파일은 ex1_3_main.c와 ex1_3_addnum.c로 구성되어 있습니다. ex1_3_main.c는 main 함수에서 addnum.c에 별도로 구현되어 있는 addnum 함수를 호출하고 결과를 리턴받아 출력합니다. 아래는 두개의 파일을 컴파일해 실행 파일을 생성하기 위한 Makefile입니다.

CC=gcc
CFLAGS=-W -Wall
TARGET=exl_3_calc_exe
OBJECTS=exl_3_addnum.o exl_3_main.o

# 매크로를 참조할 때는 소괄호나 중괄호 둘러싸고 앞에 '$'를 붙입니다.
# 탭으로 시작해서는 안되고 ,:,=,#,"" 등은 매크로 이름에 사용할 수 없습니다.
# 매크로는 반드시 치환될 위치보다 먼저 정의되어야 합니다.
# 여기서 -W -WALL는 컴파일 시 컴파일이 되지 않을 정도의 오류라도 모두 출력되게 하는 옵션입니다.

exl_3_calc_exe : exl_3_addnum.o exl_3_main.o
        gcc -o exl_3_calc_exe exl_3_addnum.o exl_3_main.o

exl_3_addnum.o : ex1_3_addnum.c
        gcc -c -o exl_3_addnum.o ex1_3_addnum.c

exl_3_main.o : ex1_3_main.c
        gcc -c -o exl_3_main.o ex1_3_main.c

all : $(TARGET)

$(TARGET) : $(OBJECTS)
        $(CC) $(CFLAGS) -o $@ $^

clean :
        rm *.o exl_3_calc_exe

make 파일을 실행한 결과를 살펴보겠습니다. 아래 실행 결과에서 main.c와 addnum.c를 각각 -c 옵션으로 컴파일해 오브젝트 파일을 생성하고, 이를 다시 -o 옵션을 사용해 링크하고 실행파일을 만들고 있음을 볼수 있습니다. 실행 파일과 오브젝트 파일을 모두 삭제하려면 make clean을 수행하면 됩니다. 앞서 살펴본 Makefile의 18행에 있는 설정에 따라 실행 파일과 *.o 파일을 모두 삭제합니다.



오류 처리 함수


시스템 호출은 오류 발생 시 -1을 리턴하고, 라이브러리 함수는 NULL을 리턴한다고 배웠습니다. 또한 오류 발생 시 전역 변수 errno에 오류의 종류를 알려주는 코드값이 저장된다는 것도 살펴봤습니다. 그러나 errno에 저장되는 값은 상수이므로 이것만으로는 오류의 의미를 파악하기 힘듭니다. 각 오류가 무엇을 나타내는지 알아보려면 헤더 파일을 열고 해당 상수의 정의를 찾아봐야 합니다. 오류 코드를 메시지로 변환해 출력하는 perror, str-error 함수를 사용하면 이러한 수고를 덜 수 있습니다.


오류 메시지 출력 : perror(3)

#include <stdio.h>

void perror(const char *s);

perror 함수는 errno에 저장된 값을 읽어 이에 해당하는 메시지를 표준 오류로 출력합니다. perror 함수의 인자로 지정한 문자열과 콜론을 출력 한 후 오류 메시지를 출력합니다. 인자가 NULL일 경우 콜론을 출력하지 않고 오류 메시지만 출력합니다. 일반적으로 이 함수의 인자로는 프로그램의 이름을 지정하는 것이 좋습니다.

#include <sys/errno.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>

int main(void) {
	if (access("unix.txt", R_OK) == -1) {
		perror("unix.txt");
		exit(1);
	}
	return 0;
}


오류 메시지 출력 : strerror(3)

#include <stdio.h>

char *strerror(int errnum);

sterror 함수는 ANSI C에서 추가로 정의한 함수입니다. 함수의 인자로 errno에 저장된 값을 받아 오류 메시지를 리턴합니다. 이 경우 리턴된 오류 메시지를 사용자가 적절하게 가공할 수 있다는 장점이 있습니다.

#include <sys/errno.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <sting.h>

extern int errno;

int main(void) {
	char *err;

	if (access("unix.txt", R_OK) == -1) {
		err = strerror(errno);
		printf("오류: %s(unix.txt)\n", err);
		exit(1);
	}

	return 0;
}



동적 메모리 할당


배열은 프로그램이 시작할 때 필요한 메모리를 미리 확보합니다. 이와 달리 프로그램이 실행 도중에 필요한 메모리 공간을 할당하고 더 이상 사용하지 않을 때 해당 공간을 해제하는 것이 동적 메모리 할당입니다. 동적 메모리 할당을 활용하면 필요한 데이터양에 따라 메모리 공간을 효율적으로 사용할 수 있습니다. 메모리를 할당하는 함수로는 malloc, calloc, realloc 등이 있고, 사용을 마친 메모리를 해제하는 함수로는 free가 있습니다.


메모리 할당 : malloc(3)

#include <stdio.h>

void *malloc(size_t size);


malloc 함수는 인자로 지정한 크기의 메모리를 할당하는 데 성공하면 메모리의 시작 주소를 리턴합니다. 만약 메모리 할당에 실패하면 NULL 포인터를 리턴합니다. 인자로 지정하는 메모리 크기는 바이트 단위입니다. 할당된 메모리에는 어떤 형태의 데이터도 저장할 수 있습니다. 주의할 점이 있는데 malloc 함수는 할당된 메모리를 초기화하지 않습니다. 다음은 malloc 함수를 사용해 문자 100개를 저장할 수 있는 메모리를 할당하는 예입니다.

char *ptr
ptr=malloc(sizeof(char)*100);


메모리 할당과 초기화: calloc(3)

#include <stdio.h>

void *calloc(size_t nelem, size_t elsize);

calloc 함수는 nelem X elsize 바이트 배열을 저장할 메모리를 할당합니다. calloc 함수는 할당된 메모리를 0으로 초기화합니다. 다음은 길이가 20바이트인 요소 10개로 구성된 배열을 저장할 수 있는 메모리를 할당하는 예입니다.

char *ptr
ptr=calloc(10, 20);


메모리 추가 할당: realloc(3)

#include <stdio.h>

void *realloc(void *ptr, size_t size);

realloc 함수는 이미 할당받은 메모리에 추가로 메모리를 할당할 때 사용합니다. realloc 함수는 이전에 할당받은 메모리와 추가할 메모리를 합한 크기의 메모리를 새롭게 할당하고 주소를 리턴합니다. 이전 메모리의 내용을 새로 할당된 메모리로 복사합니다. 다음은 malloc으로 할당받은 메모리에 추가로 100바이트 메모리를 할당하는 예로, 새로운 메모리의 주소는 new 포인터에 저장됩니다. realloc 함수로 메모리를 새로 할당받으면 이전 메모리의 주소는 필요 없습니다.


char *ptr, *new;

ptr = malloc(sizeof(char)*100);
new = realloc(ptr, 100);


메모리 해제: free(3)

#include <stdio.h>

void free(void *ptr);

free 함수는 사용을 마친 메모리를 해제하고 반납합니다. fre 함수가 성공하면 ptr이 가리키던 메모리는 더이상 의미가 없습니다.



명령행 인자


명령행이란 유닉스 시스템에서 사용자가 명령을 입력하는 행을 말합니다. 다시 말해, 프롬프트가 뜨고 커서가 사용자 입력을 기다리고 있는 행입니다. 명령행 인자란 사용자가 명령행에서 명령을 실행할 때 해당 명령(실행 파일명)과 함께 지정하는 인자를 의미합니다. 명령행 인자는 일반적으로 명령의 옵션이나 옵션의 인자, 명령의 인자로 구성됩니다. 예를 들어, ls 명령을 보겠습니다. 단순히 ls만 입력할 수도 있지만 ls -l과 같이 옵션을 붙일 수도 있는데, 이때 명령 다음에 입력한 '-l'을 명령행 인자라고 합니다. 또 다른 예로 ls /tmp와 같이 사용할 수도 있습니다. 이때 '/tmp'도 명령행 인자가 됩니다.


명령행 인자의 전달

명령행 인자는 자동으로 프로그램의 main 함수에 전달됩니다. 보통 main 함수는 다음과 같이 정의합니다.


int main(void) { ... }


그러나 main 함수에서 명령행 인자를 전달받으려면 다음과 같이 정의해야 합니다.


int main(int argc, char *argv[]) { ... }


첫번째 인자인 argc는 명령과 인자를 포함한 개수로, 두번째 인자인 argv 배열의 크기입니다. 두 번째 인자인 argv는 명령과 각 인자를 담고 있는 배열입니다. 명령행 인자는 argv에 문자열 형태로 저장됩니다.


#include <stdlib.h>

int main(int argc, char *argv[]) {
	int n;
	printf("argc=%d\n", argc);
	for(n = 0; n < argc; n++)
		printf("argv[%d] = %s\n", n, argv[n]);
	return 0;
}

[root@dev-web helloMake]# ./ex1_6_exe -h 100

argc = 3

argv[0] = ./ex1_6_exe

argv[1] = -h

argv[2] = 100


명령행에서는 실행 파일명인 ./ex1_6_exe 외에 -h와 100을 인자로 입력합니다. 따라서 main 함수에 전달된 총 개수를 나타내는 argc 값은 3이 됩니다. argv[0]에 실행 파일명이 저장되고, 차례로 인자가 저장됨을 알 수 있습니다. argv로 전달되는 값들은 문자열이므로 printf 함수로 출력하려면 형식 지정자 %s를 사용해야 합니다.



옵션 처리: getopt(3)

argc와 argv를 직접 처리할 수도 있지만 argv[1]에 저장된 '-h'와 같은 옵션을 하나하나 분해해서 처리하는 일은 불편한 작업입니다. 명령행 인자로 전달된 옵션을 편리하게 처리할 수 있도록 getopt 함수가 제공됩니다. getopt 함수의 맨페이지를 보면 표준에 따라 관련 헤더 파일이 다름을 알 수 있습니다.


SVID3, XPG3
	#include <stdio.h>
	
	int getopt(int argc, char * const argv[], const char *optstring);
	extern char *optarg;
	extern int optind, opterr, optopt;

POSIX.2, XPG4, SUS, SUSv2, SUSv3
	#include <unistd.h>

	int getopt(int argc, char * const argv[], const char *optstring);
	extern char *optarg;
	extern int optind, opterr, optopt;

argc와 argv에는 main 함수에서 받은 것을 그대로 지정하면됩니다. optstring에는 해당 실행 파일에서 사용할 수 있는 옵션을 나타내는 문자를 지정합니다. 만일 옵션에 인자가 있을 경우에는 문자 뒤에 콜론(:)을 붙여서 지정합니다. 예를 들어, 사용 가능한 옵션이 -a, -b, -c일 경우에는 optstring에 "abc"로 지정하면 됩니다. 이중 -c 옵션에 '-c name'과 같이 옵션 인자가 있을 경우에는 "abc:"으로 지정하면 됩니다.


getopt 함수는 argv에 optstring에 지정된 옵션과 동일한 옵션 문자가 있으면 해당 문자를 리턴합니다. 만일 optstring에서 해당 문자에 콜론이 붙어 있다면 옵션 인자가 있는 경우로, 옵션 인자는 외부 변수인 optarg에 저장됩니다. 외부 변수 optind는 다음에 처리할 argv의 주소를 저장합니다. 초깃값은 1로 설정되어 있습니다. getopt는 옵션 문자나 옵션 인자의 지정에 오류가 있을 경우 오류 메시지를 출력하고 물음표(?)를 리턴합니다. 오류를 발생시킨 문자는 외부 변수 optopt에 저장됩니다. 오류 메시지를 출력하지 않으려면 외부 변수 opterr을 0으로 설정합니다.



유닉스 명령 기본 규칙

getopt 함수로 옵션을 처리하려면 유닉스 명령에 대한 기본 규칙을 준수해서 명령행 인자를 입력해야 합니다. 명령어에 대한 기본 규칙은 main intro로 확인할 수 있습니다. 명령에 대한 기본 규칙은 13개 항목이며, 확장 규칙은 8개 항목으로 총 21개 항목입니다. 이중 getopt 함수와 관련이 있는 항목은 3, 4, 5, 6, 7, 9, 10, 15, 16, 17, 18번 항목입니다. 각 항목을 간단하게 살펴 보겠습니다. 먼저 기본 규칙입니다.


[규칙3] 옵션의 이름은 한 글자여야 합니다.

[규칙4] 모든 옵션의 앞에는 하이픈(-)이 있어야 합니다.

[규칙5] 인자가 없는 옵션은 하나의 - 다음에 붂어서 올수 있습니다.

[규칙6] 옵션의 첫번째 인자는 공백이나 탭으로 띄고 입력해야 한다.

[규칙7] 인자가 있어야 하는 옵션에서 인자를 생략할 수 없습니다.

[규칙9] 명령행에서 모든 옵션은 명령의 인자보다 앞에 와야 합니다. 

[규칙10] 옵션의 끝을 나타내기 위해 --을 사용할 수 있습니다.


확장 규칙은 솔라리스에 개발된 것으로, 기본 규칙과 달리 긴 옵션을 사용할 수 있게 해줍니다. 긴 옵션을 사용하는 예는 다음과 같습니다.


명령어 -a --긴 옵션1 -c 옵션 인자 -f 옵션 인자 --긴 옵션2=옵션 인자 --긴 옵션3 옵션 인자 파일명



[규칙15] 긴 옵션은 -- 다음에 와야 합니다. 옵션명으로는 문자나 숫자, -만 사용할 수 있으며, -으로 연결한 1~3개 단어를 사용할 수도 있습니다.

[규칙16] '--이름=인자' 형태는 긴 옵션의 사용에서 옵션의 인자를 상세하게 지정할 때 사용해야 합니다(예에서 긴 옵션2의 경우). '--이름 인자' 형태도 가능합니다.

[규칙17] 모든 명령은 긴 옵션 --version(-V도 지원)과 --help(-?도 지원)를 표준으로 지원해야 합니다.

[규칙18] 모든 짧은 옵션에 대응하는 긴 옵션이 있어야 하고, 긴 옵션에도 대응하는 짧은 옵션이 있어야 합니다.


getopt 함수를 사용해 옵션을 처리하는 예를 살펴보겠습니다. 이 예제는 -a, -b, -c라는 세 옵션을 사용합니다. 이중 -c 옵션은 옵션 인자를 사용합니다.


[root@dev-web getopt]# ./ex1_7_exe

Current Optind : 1

[root@dev-web getopt]# ./ex1_7_exe -a

Current Optind : 1

Option : a

Next Optind : 2

[root@dev-web getopt]# ./ex1_7_exe -c

Current Optind : 1

./ex1_7_exe: option requires an argument -- 'c'

Next Optind : 2

[root@dev-web getopt]# ./ex1_7_exe -c name

Current Optind : 1

Option : c, Argument=name

Next Optind : 3

[root@dev-web getopt]# ./ex1_7_exe -x

Current Optind : 1

./ex1_7_exe: invalid option -- 'x'

Next Optind : 2




정리


유닉스 시스템 프로그래밍 관련 표준으로는 ANSI C, IEEE의 POSIX, X/Open 그룹의 XPG3, XPG4, SVID, SUS가 있습니다.


유닉스 시스템이 제공하는 파일 시스템이나 사용자 정보, 시스템 정보, 시스템 시간 정보, 네트워킹 등 다양한 서비스를 이용해 프로그램을 구현할 수 있도록 제공되는 프로그래밍 인터페이스를 시스템 호출이라고 하며, 이러한 시스템 호출을 사용해 프로그램을 작성하는 일을 유닉스 시스템 프로그래밍이라고 합니다.


시스템 호출은 기본적으로 C 언어의 함수 형태로 제공됩니다. 시스템 호출은 커널의 해당 모듈을 직접 호출해 작업을 수행하고 결과를 리턴합니다. 라이브러리 함수는 일반적으로 커널 모듈을 직접 호출하지 않습니다. 라이브러리 함수가 커널의 서비스를 이용해야 할 경우에는 시스템 호출을 사용합니다.


시스템 호출은 오류 발생시 -1을 리턴하고, 라이브러리 함수는 NULL을 리턴합니다.