Linux C语言SIGTERM信号的应对策略

Linux 信号机制概述

在 Linux 操作系统中，信号（Signal）是一种异步通知机制，用于在进程间传递事件信息。信号可以由系统内核、其他进程或用户产生，以通知目标进程发生了特定的事件。例如，当用户在终端中按下 Ctrl + C 组合键时，系统会向当前前台进程发送 SIGINT 信号，通知进程用户希望终止它。

信号的分类

Linux 系统定义了多种信号，每个信号都有一个唯一的编号和名称。常见的信号分类如下：

标准信号：这些信号在早期的 Unix 系统中就已经存在，例如 SIGINT（中断信号）、SIGTERM（终止信号）、SIGKILL（强制终止信号）等。标准信号通常有默认的处理行为，比如 SIGINT 和 SIGTERM 的默认行为是终止进程，而 SIGKILL 不能被捕获或忽略，会直接终止进程。
实时信号：实时信号是 Linux 系统后来引入的，用于处理需要更精确控制和优先级的异步事件。实时信号的编号从 SIGRTMIN 到 SIGRTMAX，它们具有与标准信号不同的特性，比如可以排队、支持更细粒度的优先级控制等。

信号的产生

信号可以通过以下几种方式产生：

用户输入：如前面提到的，用户在终端中按下特定的组合键（如 Ctrl + C、Ctrl + \ 等）会产生相应的信号发送给前台进程。
系统调用：一些系统调用函数可以向指定进程发送信号，例如 kill 函数。该函数可以由一个进程调用，向另一个进程发送指定的信号。

#include <sys/types.h>
#include <signal.h>
#include <stdio.h>
#include <stdlib.h>

int main() {
    pid_t pid = fork();
    if (pid == -1) {
        perror("fork");
        exit(EXIT_FAILURE);
    } else if (pid == 0) {
        // 子进程
        while (1) {
            printf("Child process is running...\n");
            sleep(1);
        }
    } else {
        // 父进程
        sleep(3);
        if (kill(pid, SIGTERM) == -1) {
            perror("kill");
            exit(EXIT_FAILURE);
        }
        printf("Parent process sent SIGTERM to child process.\n");
    }
    return 0;
}

在上述代码中，父进程创建一个子进程，子进程进入一个无限循环并每秒打印一条消息。父进程等待 3 秒后，使用 kill 函数向子进程发送 SIGTERM 信号。 3. 硬件异常：当进程执行过程中发生硬件错误，如除零错误、非法内存访问等，系统会产生相应的信号，如 SIGFPE（浮点异常）、SIGSEGV（段错误）等，发送给该进程。 4. 软件条件：某些系统状态变化或软件事件也可能导致信号的产生。例如，当管道的写端关闭后，读端继续读取数据时，系统会向读端进程发送 SIGPIPE 信号。

信号的处理

当进程接收到一个信号时，它可以采取以下三种处理方式之一：

默认处理：系统为每个信号定义了默认的处理行为，例如 SIGTERM 的默认行为是终止进程，SIGSTOP 的默认行为是暂停进程等。
忽略信号：进程可以选择忽略某些信号，使其接收到该信号时不做任何处理。不过，有些信号（如 SIGKILL 和 SIGSTOP）不能被忽略。
捕获信号：进程可以通过注册信号处理函数，当接收到特定信号时，执行自定义的处理逻辑。这是我们在应对 SIGTERM 信号时常用的方式。

SIGTERM 信号详解

SIGTERM 信号的定义和作用

SIGTERM 信号是一个标准信号，其编号为 15。它通常被用于请求进程正常终止。与 SIGKILL 信号不同，SIGTERM 信号可以被进程捕获和处理，这使得进程有机会在终止前进行一些清理工作，如关闭打开的文件、释放资源、保存状态等。

当系统管理员使用 kill 命令（不带 -9 选项）或者一些系统服务管理工具（如 systemd）尝试停止一个进程时，通常会发送 SIGTERM 信号给该进程。这给予了进程一定的时间来优雅地关闭，避免数据丢失或系统状态不一致的问题。

SIGTERM 信号的默认处理行为

SIGTERM 信号的默认处理行为是终止进程。也就是说，如果进程没有对 SIGTERM 信号进行自定义处理，当它接收到 SIGTERM 信号时，会直接终止运行。这种默认行为在很多情况下是合理的，比如对于一些简单的、不需要进行复杂清理工作的进程。

然而，对于一些长期运行的服务器进程，如 Web 服务器、数据库服务器等，直接终止可能会导致未完成的事务丢失、资源未正确释放等问题。因此，这些进程通常需要捕获 SIGTERM 信号，并实现自定义的处理逻辑。

SIGTERM 信号与其他终止信号的区别

与 SIGKILL 的区别：SIGKILL 信号（编号为 9）是一个强制终止信号，它不能被捕获或忽略。当进程接收到 SIGKILL 信号时，系统会立即终止该进程，不给予进程任何清理工作的机会。这在某些情况下是必要的，比如当一个进程陷入死循环或出现严重错误无法响应正常的终止请求时。而 SIGTERM 信号则是一种较为温和的终止请求，给予进程一定的自主性来决定如何终止。
与 SIGINT 的区别：SIGINT 信号（编号为 2）通常是由用户在终端中按下 Ctrl + C 组合键产生，用于向当前前台进程发送中断请求。它的作用和 SIGTERM 类似，但 SIGINT 更侧重于用户主动发起的中断操作，而 SIGTERM 更多地用于系统或其他进程请求目标进程正常终止的场景。此外，一些交互式程序可能会对 SIGINT 有特殊的处理，比如放弃当前正在执行的命令并返回交互界面。

应对 SIGTERM 信号的策略

简单清理并退出

对于一些相对简单的进程，在接收到 SIGTERM 信号时，只需要进行一些基本的清理工作，如关闭打开的文件描述符、释放动态分配的内存等，然后正常退出。以下是一个示例代码：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <fcntl.h>

void sigterm_handler(int signum) {
    printf("Received SIGTERM. Cleaning up and exiting...\n");
    // 关闭打开的文件描述符
    int fd = open("test.txt", O_WRONLY | O_CREAT, 0666);
    if (fd != -1) {
        close(fd);
    }
    // 释放动态分配的内存
    char *str = (char *)malloc(100);
    if (str != NULL) {
        free(str);
    }
    exit(EXIT_SUCCESS);
}

int main() {
    // 注册 SIGTERM 信号处理函数
    if (signal(SIGTERM, sigterm_handler) == SIG_ERR) {
        perror("signal");
        return EXIT_FAILURE;
    }
    printf("Process is running. Press Ctrl + C to send SIGTERM.\n");
    while (1) {
        sleep(1);
    }
    return 0;
}

在上述代码中，我们定义了一个 sigterm_handler 函数作为 SIGTERM 信号的处理函数。在该函数中，我们关闭了一个打开的文件描述符并释放了一块动态分配的内存，然后调用 exit 函数正常退出进程。在 main 函数中，我们使用 signal 函数注册了 sigterm_handler 作为 SIGTERM 信号的处理函数，然后进程进入一个无限循环等待信号的到来。

优雅关闭服务器

对于服务器进程，优雅关闭通常意味着不再接受新的连接，处理完当前正在处理的请求，然后关闭所有连接并退出。以下是一个基于 TCP 套接字的简单服务器示例，展示如何在接收到 SIGTERM 信号时优雅关闭：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <string.h>
#include <pthread.h>

#define PORT 8080
#define BACKLOG 10
#define BUFFER_SIZE 1024

int listen_fd;
volatile sig_atomic_t stop_server = 0;

void sigterm_handler(int signum) {
    printf("Received SIGTERM. Stopping server gracefully...\n");
    stop_server = 1;
    // 关闭监听套接字
    close(listen_fd);
}

void *handle_connection(void *arg) {
    int client_fd = *((int *)arg);
    char buffer[BUFFER_SIZE] = {0};
    int valread = read(client_fd, buffer, BUFFER_SIZE);
    if (valread > 0) {
        buffer[valread] = '\0';
        printf("Received: %s\n", buffer);
        const char *response = "Hello from server!";
        send(client_fd, response, strlen(response), 0);
    }
    close(client_fd);
    pthread_exit(NULL);
}

int main(int argc, char const *argv[]) {
    struct sockaddr_in address;
    int opt = 1;
    int addrlen = sizeof(address);

    // 创建套接字
    listen_fd = socket(AF_INET, SOCK_STREAM, 0);
    if (listen_fd == -1) {
        perror("socket");
        return EXIT_FAILURE;
    }

    // 设置套接字选项
    if (setsockopt(listen_fd, SOL_SOCKET, SO_REUSEADDR | SO_REUSEPORT, &opt, sizeof(opt))) {
        perror("setsockopt");
        close(listen_fd);
        return EXIT_FAILURE;
    }

    address.sin_family = AF_INET;
    address.sin_addr.s_addr = INADDR_ANY;
    address.sin_port = htons(PORT);

    // 绑定套接字到地址和端口
    if (bind(listen_fd, (struct sockaddr *)&address, sizeof(address)) == -1) {
        perror("bind");
        close(listen_fd);
        return EXIT_FAILURE;
    }

    // 监听连接
    if (listen(listen_fd, BACKLOG) == -1) {
        perror("listen");
        close(listen_fd);
        return EXIT_FAILURE;
    }

    // 注册 SIGTERM 信号处理函数
    if (signal(SIGTERM, sigterm_handler) == SIG_ERR) {
        perror("signal");
        close(listen_fd);
        return EXIT_FAILURE;
    }

    printf("Server is listening on port %d...\n", PORT);

    while (!stop_server) {
        int client_fd = accept(listen_fd, (struct sockaddr *)&address, (socklen_t *)&addrlen);
        if (client_fd != -1) {
            pthread_t tid;
            if (pthread_create(&tid, NULL, handle_connection, (void *)&client_fd) != 0) {
                perror("pthread_create");
                close(client_fd);
            } else {
                pthread_detach(tid);
            }
        }
    }

    printf("Server has stopped.\n");
    return 0;
}

在这个示例中，我们定义了一个简单的 TCP 服务器。sigterm_handler 函数在接收到 SIGTERM 信号时，设置 stop_server 标志并关闭监听套接字。main 函数中，在循环接受新连接的过程中，会检查 stop_server 标志，当标志被设置时，不再接受新连接。已接受的连接会由线程处理，处理完成后自动关闭。

保存状态并重启

在一些情况下，进程可能需要在接收到 SIGTERM 信号时保存当前的运行状态，以便在重启后能够恢复到之前的状态。以下是一个简单的示例，展示如何保存和恢复进程的状态：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <fcntl.h>
#include <sys/mman.h>
#include <sys/stat.h>

#define SHM_SIZE 1024

typedef struct {
    int counter;
} SharedData;

void sigterm_handler(int signum) {
    int shm_fd = shm_open("/shared_memory", O_RDWR, 0666);
    if (shm_fd == -1) {
        perror("shm_open");
        exit(EXIT_FAILURE);
    }
    SharedData *shared_data = (SharedData *)mmap(0, SHM_SIZE, PROT_READ | PROT_WRITE, MAP_SHARED, shm_fd, 0);
    if (shared_data == MAP_FAILED) {
        perror("mmap");
        close(shm_fd);
        exit(EXIT_FAILURE);
    }
    printf("Received SIGTERM. Saving state: counter = %d\n", shared_data->counter);
    // 保存状态到文件
    int fd = open("state.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    if (fd != -1) {
        char buffer[20];
        snprintf(buffer, 20, "%d", shared_data->counter);
        write(fd, buffer, strlen(buffer));
        close(fd);
    }
    // 解除映射并关闭共享内存
    if (munmap(shared_data, SHM_SIZE) == -1) {
        perror("munmap");
    }
    if (close(shm_fd) == -1) {
        perror("close");
    }
    if (shm_unlink("/shared_memory") == -1) {
        perror("shm_unlink");
    }
    exit(EXIT_SUCCESS);
}

int main() {
    // 创建共享内存对象
    int shm_fd = shm_open("/shared_memory", O_CREAT | O_RDWR, 0666);
    if (shm_fd == -1) {
        perror("shm_open");
        return EXIT_FAILURE;
    }
    // 设置共享内存大小
    if (ftruncate(shm_fd, SHM_SIZE) == -1) {
        perror("ftruncate");
        close(shm_fd);
        return EXIT_FAILURE;
    }
    SharedData *shared_data = (SharedData *)mmap(0, SHM_SIZE, PROT_READ | PROT_WRITE, MAP_SHARED, shm_fd, 0);
    if (shared_data == MAP_FAILED) {
        perror("mmap");
        close(shm_fd);
        return EXIT_FAILURE;
    }
    shared_data->counter = 0;

    // 注册 SIGTERM 信号处理函数
    if (signal(SIGTERM, sigterm_handler) == SIG_ERR) {
        perror("signal");
        // 解除映射并关闭共享内存
        if (munmap(shared_data, SHM_SIZE) == -1) {
            perror("munmap");
        }
        if (close(shm_fd) == -1) {
            perror("close");
        }
        if (shm_unlink("/shared_memory") == -1) {
            perror("shm_unlink");
        }
        return EXIT_FAILURE;
    }

    printf("Process is running. Press Ctrl + C to send SIGTERM.\n");
    while (1) {
        shared_data->counter++;
        printf("Counter: %d\n", shared_data->counter);
        sleep(1);
    }

    // 解除映射并关闭共享内存
    if (munmap(shared_data, SHM_SIZE) == -1) {
        perror("munmap");
    }
    if (close(shm_fd) == -1) {
        perror("close");
    }
    if (shm_unlink("/shared_memory") == -1) {
        perror("shm_unlink");
    }
    return 0;
}

在这个示例中，我们使用共享内存来存储一个计数器变量。当接收到 SIGTERM 信号时，sigterm_handler 函数将计数器的值保存到文件中，然后清理共享内存资源并退出。在进程重启时，可以读取保存的文件并恢复计数器的值。

信号处理中的注意事项

异步信号安全

在编写信号处理函数时，必须确保函数是异步信号安全的。这意味着信号处理函数只能调用异步信号安全的函数，并且不能访问可能被其他信号处理函数或主线程同时修改的数据结构。

例如，标准 I/O 函数（如 printf）通常不是异步信号安全的，因为它们内部使用了一些全局状态和缓冲区。在信号处理函数中调用非异步信号安全的函数可能会导致程序出现未定义行为。

异步信号安全的函数包括一些基本的系统调用，如 read、write、close、_exit 等。如果需要在信号处理函数中进行输出，可以考虑使用 write 函数直接写入标准输出或标准错误输出。

可重入性

可重入性是与异步信号安全密切相关的概念。一个可重入函数可以在其执行过程中被中断，然后再次调用，而不会导致数据损坏或其他未定义行为。

为了确保信号处理函数的可重入性，应避免在函数中使用静态或全局变量，除非这些变量是通过互斥锁等同步机制进行保护的。此外，信号处理函数不应调用不可重入的函数。

信号屏蔽与阻塞

在某些情况下，可能需要暂时屏蔽或阻塞某些信号，以避免在关键代码段执行期间接收到信号导致的问题。例如，在更新共享数据结构时，为了防止信号处理函数在更新过程中打断并访问未完成更新的数据，可以暂时阻塞相关信号。

在 Linux 中，可以使用 sigprocmask 函数来设置信号屏蔽字，从而阻塞或解除阻塞指定的信号。以下是一个简单的示例：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>

void sigterm_handler(int signum) {
    printf("Received SIGTERM.\n");
}

int main() {
    // 注册 SIGTERM 信号处理函数
    if (signal(SIGTERM, sigterm_handler) == SIG_ERR) {
        perror("signal");
        return EXIT_FAILURE;
    }

    sigset_t set;
    sigemptyset(&set);
    sigaddset(&set, SIGTERM);

    // 阻塞 SIGTERM 信号
    if (sigprocmask(SIG_BLOCK, &set, NULL) == -1) {
        perror("sigprocmask");
        return EXIT_FAILURE;
    }

    printf("SIGTERM signal is blocked. Sleeping for 5 seconds...\n");
    sleep(5);

    // 解除阻塞 SIGTERM 信号
    if (sigprocmask(SIG_UNBLOCK, &set, NULL) == -1) {
        perror("sigprocmask");
        return EXIT_FAILURE;
    }

    printf("SIGTERM signal is unblocked. Press Ctrl + C to send SIGTERM.\n");
    while (1) {
        sleep(1);
    }
    return 0;
}

在上述代码中，我们首先注册了 SIGTERM 信号的处理函数，然后使用 sigprocmask 函数阻塞 SIGTERM 信号。在阻塞期间，即使发送 SIGTERM 信号，进程也不会立即执行信号处理函数。5 秒后，我们解除对 SIGTERM 信号的阻塞。

信号处理与多线程

在多线程程序中处理信号需要特别小心。默认情况下，信号会发送到进程中的某个线程，但具体哪个线程接收信号是不确定的。

为了更好地控制信号在多线程程序中的处理，可以使用 pthread_sigmask 函数为每个线程设置信号屏蔽字，以及使用 pthread_kill 函数向指定线程发送信号。

此外，由于多线程共享进程的地址空间，在信号处理函数中访问共享资源时需要使用适当的同步机制，以避免数据竞争。

例如，以下是一个简单的多线程程序，展示如何在多线程环境中处理 SIGTERM 信号：

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <signal.h>
#include <unistd.h>

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
int shared_variable = 0;

void sigterm_handler(int signum) {
    pthread_mutex_lock(&mutex);
    printf("Received SIGTERM. Shared variable value: %d\n", shared_variable);
    pthread_mutex_unlock(&mutex);
    pthread_exit(NULL);
}

void *thread_function(void *arg) {
    // 为线程设置信号屏蔽字
    sigset_t set;
    sigemptyset(&set);
    sigaddset(&set, SIGTERM);
    if (pthread_sigmask(SIG_BLOCK, &set, NULL) != 0) {
        perror("pthread_sigmask");
        pthread_exit(NULL);
    }

    while (1) {
        pthread_mutex_lock(&mutex);
        shared_variable++;
        printf("Thread: shared variable incremented to %d\n", shared_variable);
        pthread_mutex_unlock(&mutex);
        sleep(1);
    }
    pthread_exit(NULL);
}

int main() {
    // 注册 SIGTERM 信号处理函数
    struct sigaction sa;
    sa.sa_handler = sigterm_handler;
    sigemptyset(&sa.sa_mask);
    sa.sa_flags = 0;
    if (sigaction(SIGTERM, &sa, NULL) == -1) {
        perror("sigaction");
        return EXIT_FAILURE;
    }

    pthread_t tid;
    if (pthread_create(&tid, NULL, thread_function, NULL) != 0) {
        perror("pthread_create");
        return EXIT_FAILURE;
    }

    // 主线程等待线程结束
    if (pthread_join(tid, NULL) != 0) {
        perror("pthread_join");
        return EXIT_FAILURE;
    }

    pthread_mutex_destroy(&mutex);
    return 0;
}

在这个示例中，我们创建了一个线程，线程函数中首先阻塞 SIGTERM 信号。主线程注册了 SIGTERM 信号处理函数，该函数在接收到 SIGTERM 信号时，会获取互斥锁并打印共享变量的值，然后线程退出。线程函数在循环中不断增加共享变量的值并打印。通过这种方式，我们展示了在多线程环境中如何安全地处理信号并访问共享资源。

通过合理地运用上述策略和注意事项，在 Linux C 语言程序中能够有效地应对 SIGTERM 信号，确保程序在接收到终止请求时能够优雅地关闭，避免数据丢失和资源泄漏等问题，提高程序的健壮性和可靠性。同时，深入理解信号机制和相关的处理技巧，对于编写复杂的、高性能的 Linux 应用程序和服务器程序至关重要。在实际应用中，需要根据具体的业务需求和程序特点，选择合适的应对策略，并仔细处理信号处理过程中的各种细节。