35.1 문자와 문자열 포인터 알아보기

문자열은 char 포인터 형식으로 사용합니다.

  • char *변수이름 = "문자열";

다음 내용을 소스 코드 편집 창에 입력한 뒤 실행해보세요.

string_pointer.c

#include <stdio.h>

int main()
{
    char c1 = 'a';         // 변수에 문자 'a' 저장
    char *s1 = "Hello";    // 포인터에 문자열 "Hello"의 주소 저장

    printf("%c\n", c1);    // a: %c로 문자 출력
    printf("%s\n", s1);    // Hello: %s로 문자열 출력

    return 0;
}

실행 결과

a
Hello

문자(char)는 'a'처럼 글자가 하나만 있는 상태를 뜻하고 문자열(char *)은 "Hello"처럼 글자 여러 개가 계속 이어진 상태를 뜻합니다. 즉, 문자는 1바이트 크기의 char에 저장할 수 있지만 문자열은 크기가 1바이트를 넘어서므로 char에 저장할 수 없습니다. 따라서 문자열은 변수에 직접 저장하지 않고 포인터를 이용해서 저장합니다.

다음은 문자가 변수 c1에 저장된 상태와 문자열이 변수 s1에 저장된 상태를 나타냅니다.

그림 35‑1 문자와 문자열의 저장 방식

문자열은 char *s1처럼 포인터를 이용해서 저장합니다. 포인터는 메모리 주소를 저장하므로 메모리 주소를 보고 문자열이 저장된 위치로 이동하게 되죠.

참고 | 문자열의 메모리 주소 출력

printf로 문자열 대신 문자열이 저장된 메모리 주소를 출력하고 싶다면 서식 지정자로 %p를 사용하면 됩니다.

char *s1 = "Hello";

printf("%p\n", s1);    // 00A5585: %p로 문자열이 저장된 메모리 주소 출력

문자는 변수 c1 안에 그대로 저장되지만 문자열 리터럴이 변수 s1안에 저장되지 않고, 문자열이 있는 곳의 메모리 주소만 저장됩니다(소스 코드에 직접 입력한 "Hello"가 문자열 리터럴). 단, 이 문자열 리터럴이 있는 메모리 주소는 읽기 전용이므로 다른 문자열을 덮어쓸 수는 없습니다. 또한, 문자열 리터럴이 저장되는 위치는 컴파일러가 알아서 결정하므로 우리는 신경 쓰지 않아도 됩니다.

//   ↓ 변수 안에 'a'가 그대로 저장됨
char c1 = 'a';

//            ↓ 메모리에 저장되어 있음(읽기 전용)
char *s1 = "Hello";
//    ↑ 문자열 리터럴이 있는 곳의 메모리 주소만 저장

문자열을 사용할 때는 char 포인터에 " "(큰따옴표)로 묶은 문자열만 할당하면 된다는 점만 기억하세요. 그리고 printf로 문자열을 출력할 때는 서식 지정자로 %s를 사용하면 됩니다.

printf("%s\n", s1);    // Hello: %s로 문자열 출력

여기서 중요한 점은 C 언어의 문자열은 마지막에 항상 널 문자(NULL)가 붙는다는 점입니다. NULL0으로도 표현할 수 있으며 문자열의 을 나타냅니다. 그래서 printf는 문자열을 출력할 때 문자열을 계속 출력하다가 NULL에서 출력을 끝냅니다.

그림 35‑2 문자열과 널 문자

우리가 글을 쓸 때 문장 끝에 마침표(.)를 찍는 것처럼 C 언어는 문자열 끝에 널 문자를 붙이자고 정했습니다(널 문자 직전까지 문자열로 본다는 뜻). 즉, 마침표와 같은 역할이죠. 하지만 널 문자는 눈에 보이지 않아서 항상 C 언어 초보자를 괴롭힙니다.

참고 | 문자열의 앞과 뒤는 어디인가요?

보통 문자열이 시작되는 쪽을 앞, 문자열이 끝나는 쪽을 뒤라고 부릅니다.

               
"The Little Prince"

하지만 실제 메모리 주소를 다루는 포인터 연산에서는 32비트를 기준으로 낮은 주소(0x00000000)가 뒤쪽(backward), 높은 주소(0xFFFFFFFF)가 앞쪽(forward)입니다(포인터 연산은 'Unit 44 포인터 연산 사용하기'를 참조하세요).그래서 뒤쪽으로 가는 것을 역방향, 앞쪽으로 가는 것을 순방향이라고 합니다.

메모리
←뒤                  앞→
←역방향          순방향→
0x00000000 ~ 0xFFFFFFFF

여기서 문자열은 메모리의 낮은 주소부터 시작해서 높은 주소까지 저장되는데 이 상태로는 문자열이 시작되는 부분이 뒤, 끝나는 부분이 앞이 되어버립니다.

                   
                    
0x00000000 ~ 0xFFFFFFFF
"The Little Prince"

보통 사람은 문자열이 시작되는 부분을 앞으로 인식하므로 메모리 주소로 처리하는 방법과는 반대로 이해할 수 밖에 없습니다. 그래서 메모리 주소의 앞 뒤와 구분하기 위해 문자열은 왼쪽(left), 오른쪽(right) 또는 처음(first), 마지막(last)이라는 말을 자주 사용합니다.

이 책에서는 문자열을 설명할 때 왼쪽, 오른쪽, 처음, 마지막, 다음 문자 등을 사용하고, 배열의 요소 등을 설명할 때는 앞 뒤, 포인터 연산과 파일 포인터 이동을 설명할 때는 순방향과 역방향을 주로 사용하겠습니다.