为什么在stdin流缓冲区只有1024个字节的情况下scanf可以读取超过1024个字符?

时间:2019-03-06 05:25:21

标签: c linux stdio

通过 APUE 中的代码,我可以获得stdin流缓冲区的大小和在Ubuntu下连接我的终端的缓冲区类型:

#include "apue.h" //It's merely a wrapper header

void    pr_stdio(const char *, FILE *);
int     is_unbuffered(FILE *);
int     is_linebuffered(FILE *);
int     buffer_size(FILE *);

int
main(void)
{
    FILE    *fp;

    fputs("enter any character\n", stdout);
    if (getchar() == EOF)
        err_sys("getchar error");
    fputs("one line to standard error\n", stderr);

    pr_stdio("stdin",  stdin);
    pr_stdio("stdout", stdout);
    pr_stdio("stderr", stderr);

    if ((fp = fopen("/etc/passwd", "r")) == NULL)
        err_sys("fopen error");
    if (getc(fp) == EOF)
        err_sys("getc error");
    pr_stdio("/etc/passwd", fp);
    exit(0);
}

void
pr_stdio(const char *name, FILE *fp)
{
    printf("stream = %s, ", name);
    if (is_unbuffered(fp))
        printf("unbuffered");
    else if (is_linebuffered(fp))
        printf("line buffered");
    else /* if neither of above */
        printf("fully buffered");
    printf(", buffer size = %d\n", buffer_size(fp));
}

int
is_unbuffered(FILE *fp)
{
    return(fp->_flags & _IO_UNBUFFERED);
}

int
is_linebuffered(FILE *fp)
{
    return(fp->_flags & _IO_LINE_BUF);
}

int
buffer_size(FILE *fp)
{
    return(fp->_IO_buf_end - fp->_IO_buf_base);
}

从我得到的stream = stdin, line buffered, buffer size = 1024终端上运行上面的代码。


然后我写一个测试:

#include "stdio.h"

int main(){
    char c[2048];
    c[1033] = 'a';
    scanf("%s", c); //I paste 1440 '1' into the terminal.
    printf("%c", c[1033]); //I expect it to be 'a'.
    return 0;
}

我将1440(> 1024字节)字符'1'粘贴到终端,并期望多余的输入数据将以某种方式被丢弃,因为行缓冲区大小仅为1024字节。但是最终,我在c[1033]上打印了'1'。

scanf的缓冲区大小仅为1024B时,为什么stdin可以读取超过1024个字符?

引自 APUE

  

我们可以看到,该系统的默认设置是具有标准输入和标准   将输出线连接到终端时进行缓冲。行缓冲区是1,024   个字节。 请注意,这并不限制我们使用1,024字节的输入和输出行;那只是   缓冲区的大小。将2,048字节的行写入标准输出将需要两个   编写系统调用。

或者我应该问如何?

我不太理解强调的文字。缓冲区不限制用户输入的大小吗?为什么说我可以输入多个缓冲区大小数据(每个输入 )?有人可以告诉我它如何工作吗?

1 个答案:

答案 0 :(得分:3)

如注释中所述,当scanf()到达第一个缓冲区已满时,如果仍然需要更多数据,它将返回系统以获取更多(可能很多次)。缓冲区只是一种便利和优化措施。