【C/C++】select、poll、epoll 实战对比:从 fd_set 到就绪事件列表

1. 为什么需要 IO 多路复用
上一篇多线程 TCP 服务端的模型是:每来一个连接,就创建一个线程阻塞在 recv() 上。这个模型好理解,但连接数一多,线程数、内存、上下文切换都会成为瓶颈。
IO 多路复用解决的是另一个问题:让一个线程同时管理多个 fd。线程不再盯着某一个连接阻塞,而是把一批 fd 交给内核,等内核告诉我们“哪些 fd 有事件”。
本项目分别实现了三个版本:
tcp_server_select.c:用fd_set管理连接。tcp_server_poll.c:用struct pollfd数组管理连接。tcp_server_epoll.c:用epoll_ctl注册事件,用epoll_wait获取就绪事件。
2. select:每一轮都要准备 fd_set
select 的核心 API 是:
int activity = select(maxfd + 1, &tempfds, NULL, NULL, NULL);
项目中的关键写法是先保存一份总集合 readfds,每次调用前复制到临时集合:
fd_set readfds;
FD_ZERO(&readfds);
FD_SET(serverfd, &readfds);
int maxfd = serverfd;
while (1)
{
fd_set tempfds = readfds;
int activity = select(maxfd + 1, &tempfds, NULL, NULL, NULL);
if (activity < 0)
{
perror("select");
continue;
}
为什么要复制?因为 select() 返回后会修改传进去的 fd 集合,只保留就绪 fd。如果下一轮继续拿同一个集合调用,就会丢失没有就绪的连接。
监听 socket 就绪表示有新连接:
if (FD_ISSET(serverfd, &tempfds))
{
struct sockaddr_in client_addr;
socklen_t client_len = sizeof(client_addr);
int clientfd = accept(serverfd, (struct sockaddr *)&client_addr, &client_len);
FD_SET(clientfd, &readfds);
if (clientfd > maxfd)
maxfd = clientfd;
}
普通客户端 fd 就绪表示可读:
for (int i = serverfd + 1; i <= maxfd; i++)
{
if (FD_ISSET(i, &tempfds))
{
char buffer[1024];
ssize_t n = recv(i, buffer, sizeof(buffer) - 1, 0);
if (n <= 0)
{
close(i);
FD_CLR(i, &readfds);
}
else
{
buffer[n] = '\0';
send(i, buffer, n, 0);
}
}
}
select 的缺点也在这段代码里体现出来了:应用层需要从小到大扫描 fd,fd 很多时会浪费大量遍历成本。
3. poll:用数组管理 fd,事件更清楚
poll 把 fd、关注事件、返回事件放在一个结构体里:
struct pollfd fds[1024];
fds[0].fd = sockfd;
fds[0].events = POLLIN;
int nfds = 1;
调用方式比 select 更直接:
int ret = poll(fds, nfds, -1);
if (ret < 0)
{
perror("poll");
continue;
}
新连接到来时,把客户端 fd 追加到数组:
if (fds[0].revents & POLLIN)
{
int clientfd = accept(sockfd, (struct sockaddr *)&client_addr, &client_len);
fds[nfds].fd = clientfd;
fds[nfds].events = POLLIN;
nfds++;
}
客户端断开时,项目里用了一个很实用的技巧:用最后一个元素覆盖当前元素,然后 nfds--。
if (n <= 0)
{
close(fds[i].fd);
fds[i] = fds[nfds - 1];
nfds--;
i--;
}
这样删除数组中间元素时不需要整体搬移。i-- 是为了重新检查被覆盖过来的新元素。
poll 相比 select 的进步:
- 不依赖
FD_SETSIZE默认大小。 events和revents分开,关注事件和实际事件更清晰。- 不需要每轮重新构造
fd_set。
但它仍然需要把整个数组传给内核,也仍然要扫描数组。
4. epoll:注册一次,等待就绪事件
epoll 的使用流程更像“先注册,再等待”:
int epollfd = epoll_create1(0);
struct epoll_event ev, events[1024];
ev.events = EPOLLIN;
ev.data.fd = sockfd;
epoll_ctl(epollfd, EPOLL_CTL_ADD, sockfd, &ev);
事件循环里直接等待就绪事件:
int nfds = epoll_wait(epollfd, events, 1024, -1);
if (nfds < 0)
{
perror("epoll_wait");
continue;
}
for (int i = 0; i < nfds; i++)
{
if (events[i].data.fd == sockfd)
{
int clientfd = accept(sockfd, (struct sockaddr *)&client_addr, &client_len);
ev.events = EPOLLIN;
ev.data.fd = clientfd;
epoll_ctl(epollfd, EPOLL_CTL_ADD, clientfd, &ev);
}
else
{
ssize_t n = recv(events[i].data.fd, buffer, sizeof(buffer) - 1, 0);
if (n <= 0)
{
close(events[i].data.fd);
epoll_ctl(epollfd, EPOLL_CTL_DEL, events[i].data.fd, NULL);
}
}
}
epoll_wait() 返回的是就绪事件数组,不需要像 select / poll 那样扫描完整连接表。这也是它适合大量连接的关键原因。
5. 三者对比表
| 模型 | fd 管理方式 | 每轮是否重建集合 | 是否扫描全部 fd | 适合场景 |
|---|---|---|---|---|
| select | fd_set 位图 | 需要 | 需要 | 入门理解、小规模 fd |
| poll | pollfd 数组 | 不需要重建,但数组要传入内核 | 需要 | 中小规模连接 |
| epoll | 内核维护兴趣集合 | 不需要 | 不需要扫描全部,只返回就绪项 | 大量长连接 |
6. 编译运行
gcc tcp_server_select.c -o select
gcc tcp_server_poll.c -o poll
gcc tcp_server_epoll.c -o epoll
分别启动:
./select
./poll
./epoll
用 nc 测试:
nc 127.0.0.1 8080
hello
需要注意的是,本项目的 select 和 poll 版本会 echo 回客户端;epoll 基础版本主要演示读事件注册和删除,收到数据后打印到服务端终端。如果希望它也 echo,在 recv() 成功分支中补一行 send(events[i].data.fd, buffer, n, 0); 即可。
7. 小结
select -> poll -> epoll 的演进,本质是 fd 管理方式的演进:
- select:应用每轮准备集合,内核返回后还要应用扫描。
- poll:数组结构更清楚,但仍要传递和扫描整张表。
- epoll:内核保存兴趣集合,应用只处理就绪事件。
理解这三者之后,再看 Reactor 模式就不会突兀。Reactor 其实就是在 epoll 事件循环上继续抽象:把不同 fd、不同事件分发给对应的回调函数。
1168

被折叠的 条评论
为什么被折叠?



