用户进程和异常处理

用户进程和异常处理

在文件inc/env.h中,JOS定义了Env结构体.JOS使用这个结构体来表示进程.

在Lab3,我们只会创建一个进程.在Lab4中,我们将会涉及到进程fork的问题.

正如在kern/env.c中所看到的,JOS使用三个全局变量来管理进程.

struct Env *envs = NULL;        // All environments
struct Env *curenv = NULL;        // The current env
static struct Env *env_free_list;    // Free environment list

我们来稍加解释,envs将指向一个Env数组.JOS最大支持NENV(定义在inc/env.h)个进程数.通常运行的进程远不到这个数目.在env_init()的函数中,我们将会初始化envs,在其中填充Env结构体.

JOS使用env_free_list链表来管理未使用的Env结构体.curenv则表示当前正在运行的Env结构体.在第一个进程真正运行前,curenv置NULL.

进程结构体Environment State

struct Env {
    struct Trapframe env_tf;    // Saved registers
    struct Env *env_link;        // Next free Env
    envid_t env_id;            // Unique environment identifier
    envid_t env_parent_id;        // env_id of this env's parent
    enum EnvType env_type;        // Indicates special system environments
    unsigned env_status;        // Status of the environment
    uint32_t env_runs;        // Number of times environment has run

    // Address space
    pde_t *env_pgdir;        // Kernel virtual address of page dir
};

我们来看看进程的管理结构体,下面是各字段的解释:

env_tf

struct Trapframe定义在inc/trap.h中,该结构体保存了进程的寄存器值.比如A进程不运行时,内核将在进程A的Env结构体中,保存A运行时的寄存器.当进程A需要恢复运行时,可以通过Trapframe来恢复.

env_link

前面提到JOS通过全局变量env_free_list来管理空闲的Env结构体.env_link即指向下一个空闲Env.

env_id

 +1+---------------21-----------------+--------10--------+
 |0|          Uniqueifier             |   Environment    |
 | |                                  |      Index       |
 +------------------------------------+------------------+
                                       \--- ENVX(eid) --/

如图,一个env_id主要由两部分组成,Uniqueifier和Environment Index.其中Uniqueifier每次都会发生变化,而Environment Index则代表了使用了envs数组中的index.因此即使Env结构体被重复使用,进程的env_id值也不会相同.

env_parent_id

该字段保存了进程的父进程的id.通过这种方式,进程就被组成为一个进程树.当需要判断进程是否有权限进行某个操作时,通过进程树可以进行权限判断.

env_type

该字段用于标识特殊的进程.大部分情况下,该字段为ENV_TYPE_USER.后面的实验中,将会介绍其他的进程类型

env_status

这个就是常说的进程状态了.在JOS中,进程有如下状态.

ENV_FREE 进程未激活,即Env结构体在env_free_list链表中
ENV_RUNNABLE 进程准备就绪,正等待内核调度运行
ENV_RUNNING 进程正在运行
ENV_NOT_RUNNING 进程阻塞,此时进程已激活.但是还未准备就绪.比如正在等待IO.
ENV_DYING 僵尸进程,当僵尸进程陷入内核后,将被内核释放.

env_pgdir

进程使用的页表

与Unix进程类似,JOS进程同样拥有线程和地址空间的概念.线程主要是由env_tf来定义,而地址空间则由env_pgdir来定义.为了运行一个进程,内核必须设置好env_tf和env_pgdir.

JOS中的Struct Env和xv6中的struct proc类似.区别在于xv6中每个proc都拥有自己的内核栈,多个进程可以同时陷入内核.而JOS同一时间只能有个一个进程陷入内核,因此可以共用一个内核栈.

分配进程管理数组

在Lab2中,我们通过mem_init()来初始化pages[]数组.该数组用于管理物理页内存的分配.现在我们需要修改mem_init()来分配一个相似的envs数组,来管理进程结构体.

Excercise 1

修改kern/pmap.c中的mem_init()函数来分配和初始化envs数组.数组中包含了NENV个Env结构体.和pages数组类似,envs数组同样需要映射到UENVS(定义在inc/memlayout.h),这样用户进程才能够访问这个数组.

修改完成后,代码应该可以通过check_kern_pgdir()的检查.

创建和运行进程

下面我们将完善kern/env.c以运行一个用户进程.

此时,我们还没有文件系统,因此用户进程所使用的二进制文件将被静态打包到Kernel文件中.Lab3的GNUmakefile将在obj/user目录中生成一系列二进制文件.如果我们再稍微深入一点,在kern/Makefrag中,我们看到首先定义了变量KERN_BINFILES,随后通过命令ld -b binary $(KERN_BINFILES)将这些二进制文件打包到内核文件中.我们再来看看内核文件的符号表obj/kern/kernel.sym,我们将看到如下的一些符号:

f0119356 D _binary_obj_user_hello_start
f0120b56 D _binary_obj_user_buggyhello_start
f0120b56 D _binary_obj_user_hello_end
f012835e D _binary_obj_user_buggyhello2_start
f012835e D _binary_obj_user_buggyhello_end
f012fb7e D _binary_obj_user_buggyhello2_end
f012fb7e D _binary_obj_user_evilhello_start
f0137382 D _binary_obj_user_evilhello_end
f0137382 D _binary_obj_user_testbss_start
f013eb9e D _binary_obj_user_divzero_start
f013eb9e D _binary_obj_user_testbss_end
f01463b6 D _binary_obj_user_breakpoint_start
f01463b6 D _binary_obj_user_divzero_end
f014dbbe D _binary_obj_user_breakpoint_end
f014dbbe D _binary_obj_user_softint_start
f01553c2 D _binary_obj_user_badsegment_start
f01553c2 D _binary_obj_user_softint_end
f015cbca D _binary_obj_user_badsegment_end
f015cbca D _binary_obj_user_faultread_start
f01643ce D _binary_obj_user_faultread_end
f01643ce D _binary_obj_user_faultreadkernel_start
f016bbda D _binary_obj_user_faultreadkernel_end
f016bbda D _binary_obj_user_faultwrite_start
f01733e2 D _binary_obj_user_faultwrite_end
f01733e2 D _binary_obj_user_faultwritekernel_start
f017abee D _binary_obj_user_faultwritekernel_end

正是通过这些符号,内核可以访问这些二进制文件.

Exercise 2

在kern/init.c中的i386_init()函数将会运行创建用户进程并运行二进制文件.当然此时,它们还是一个半成品,你需要完成env.c中的如下函数:

env_init() 初始化envs数组中的所有Env结构体,同时把它们加入env_free_list管理.同时,我们会调用env_init_percpu()来设置CPU的分段硬件.
env_setup_vm() 为用户进程创建一个页目录并初始化
region_alloc() 为用户进程分配和映射物理内存
load_icode() 解析ELF文件,并将其内容载入用户进程空间
env_create() 调用env_alloc创建一个用户进程,然后调用load_icode载入ELF镜像
env_run() 运行一个指定的用户进程

备注: 在完成上述编码时,使用cprintf的%e命令可以打印出错误码所对应的错误信息,这有助于我们调试代码.举例如下:

r = -E_NO_MEM;
panic("env_alloc: %e", r);

输出:
env_alloc: out of memory

用户进程调用流程

下图是用户进程调用示意图,请确保理解了下图的每个步骤.

start (kern/entry.S)
i386_init (kern/init.c)
    cons_init
    mem_init
    env_init
    trap_init (still incomplete at this point)
    env_create
    env_run
        env_pop_tf

当我们完成了Exercise 2的编码之后,我们可以通过QEMU来运行.程序将一直执行hello程序,直接该程序调用int系统调用.此时JOS还没有配置硬件中断处理,因此用户空间无法调用内核.当CPU遇到无法处理的系统调用中断时,将会产生一个通用保护异常.紧接着CPU会发现通用保护异常也无法处理,将会产生一个double fault异常,这个异常当然也无法处理.CPU最终放弃处理,并抛出triple fault.

通常此时CPU将会重置,系统将重启.对于内核开发而言,此时重启将不利于我们观察和debug,因此JOS的QEMU经过了特殊定制,此时将打印寄存器和triple fault信息.

目前我们可以通过使用gdb来判断我们是否进入了用户空间.通过make qemu-gdb命令,使用gdb来调试JOS,并在env_pop_tf设下断点.该函数是JOS进入用户空间前,最后运行的一个函数.使用命令si来单步调试,CPU在执行指令iret后,将进入用户空间.

在用户空间第一条执行的指令应该是lib/entry.S中label start中的第一条指令cmpl $USTACKTOP, %esp.现在通过命令b *0x...在hello程序的sys_cputs()函数中的int $0x30处设下断点.具体函数地址请参考obj/user/hello.asm.这个int指令是请求内核在console上显示字符.如果你无法执行到这里,说明之前的实现有问题,请返回检查并修正.

处理中断和异常

目前用户空间执行int $0x30是死路一条:如果CPU进入用户空间,目前还没有返回的办法.接下来,我们将要实现基本的异常和系统调用处理,这样内核才能从用户空间程序手中重新获得CPU的控制权.

首先,你需要熟悉x86的中断和异常机制.

Exercise 3

阅读80386 Programmer's Manual 第九章. 或者IA-32 Developer's Manual 第五章.

在本Lab中,我们使用中断,异常这些术语,它们的定义遵循了Intel的规定.但是在操作系统中,异常,陷阱,中断,错误,终止等并没有特定的含义,所以如果你在其他地方看到这些术语完全可能有不同的含义.

受保护的控制转移

异常和中断都是一种受保护的控制转移,都会引起CPU从用户模式切换到内核模式.在这个过程中用户空间的代码不会有任何机会接触到内核函数.在Intel的术语中,interrupt是指由外部异步引起的控制转移,比如外部IO设备的通知等.exception则是由当前运行的代码引起的同步控制转移,比如除0异常或者访问非法地址等.

为了保证控制转移的确处于受保护的状态,当异常中断发生时,CPU当前运行的代码完全无法影响内核接下来的处理逻辑.即中断异常的处理完全是在内核模式下提前设置好的.x86使用了下面两个机制来保证了控制转移一定是被保护的.

中断向量表

内核预先定义好了特定的入口,当中断和异常发生时,CPU将执行这些预先定义好的指令.

x86一共允许设置256个特定入口,每个入口都有一个不同的中断向量号.中断向量号是0~255的整数.通过中断向量号,我们可以知道中断的来源:

不同的设备
错误
用户程序请求
...

CPU使用中断向量号作为interrupt descriptor table(IDT)中的索引.CPU将会从表中载入如下信息:

中断处理程序的内存地址,该地址将被载入EIP寄存器.
中断处理程序的code segment,其中包含了中断处理程序将要运行的特权等级.在JOS中,所有的中断处理都处于内核模式,即特权级为0.

Task State Segment(TSS)

在处理中断前,CPU需要保存当前的寄存器值,比如当前进程的CS,EIP寄存器的值.中断处理完成后,通过之前保存的状态信息恢复运行.当然当前进程的上下文信息必须必须处于受保护的状态,以避免其他的用户进程破坏或者窃取数据.

为了达到这个目的,当x86的CPU因中断从用户态进入内核态时,不光会切换运行特权级,同样会将函数栈切换到内核内存中.TSS就保存了这个内核栈的SS和ESP值.中断处理时,CPU将当前进程的SS,ESP,EFLAGS,CS,EIP,错误号(可选)压入内核栈,然后从中断向量表中载入CS和EIP,再从TSS中载入ESP和SS.前面这些工作都是硬件直接完成的,在我们的JOS和xv6的代码中,我们是看不到相关的软件处理过程的.

TSS是比较大的,而且可以用于多种目的.JOS仅仅使用TSS保存了内核栈的地址.因为在JOS中,内核态是指特权级0,因此我们使用了TSS中的ESP0和SS字段来定义内核栈.JOS并没有使用TSS的其他字段.

中断和异常的类型

x86中所有的同步异常,中断向量号为0~31.比如page fault的中断向量号为14.大于31的中断向量号要么是由软件引发的中断,比如系统调用.要么是外部设备引发的异步中断.

在本章节,我们将扩展JOS以处理0~31号中断.在下一部分,我们将扩展JOS以处理系统调用(0x30).在Lab4,将会扩展JOS以处理设备中断,比如时钟中断.

一个栗子

下面我们通过例子来看看中断处理的流程,首先是用户空间除0的异常.

                     +--------------------+ KSTACKTOP             
                     | 0x00000 | old SS   |     " - 4
                     |      old ESP       |     " - 8
                     |     old EFLAGS     |     " - 12
                     | 0x00000 | old CS   |     " - 16
                     |      old EIP       |     " - 20 <---- ESP 
                     +--------------------+

CPU通过TSS中的字段SS0和ESP0,将函数栈从用户空间切换到内核空间.在JOS中,SS0为GD_KD,ESP0为KSTACKTOP.
CPU将当前用户进程上下文压入内核栈,即如上图所示.
除0异常的中断号为0,因此将IDT表中第0项的CS和EIP值载入CPU寄存器.
CPU跳转到相应的中断处理程序,开始中断处理.

对一些特定的x86异常而言,除了上面5个参数外,CPU还会额外压入一个error code,比如page faultException.error code的详细信息请参考80386手册.此时内核栈布局如下:

                     +--------------------+ KSTACKTOP             
                     | 0x00000 | old SS   |     " - 4
                     |      old ESP       |     " - 8
                     |     old EFLAGS     |     " - 12
                     | 0x00000 | old CS   |     " - 16
                     |      old EIP       |     " - 20
                     |     error code     |     " - 24 <---- ESP
                     +--------------------+

嵌套的中断和异常

CPU在用户态和内核态都可能发生中断异常.只有当CPU从用户态切换到内核态时,才会进行函数栈的自动切换,并且将当前进程上下文压栈,再跳转到对应的中断处理程序运行.如果CPU已经处于内核模式,此时发生中断异常,仅仅会将当前的部分寄存器压栈,再跳转到对应的中断处理程序,并不会进行进程栈的切换.正是通过这种类似函数调用的方式,内核可以优雅地处理嵌套的异常.

                     +--------------------+ <---- old ESP
                     |     old EFLAGS     |     " - 4
                     | 0x00000 | old CS   |     " - 8
                     |      old EIP       |     " - 12
                     +--------------------+

如上图所示,当CPU已处于内核态,发生嵌套异常时,不需要再将ESP和SS寄存器压栈,因此内核栈布局如上.如果异常包含error code,同上.

另外,需要说明的是,因为CPU支持嵌套的异常,因此内核栈是可能溢出的.此时CPU通常会重启.在内核设计时,必须避免这样的情况发生.

设置IDT

目前,我们已经具备了IDT的基础知识.现在我们需要设置IDT,以处理中断向量号0~31,即CPU异常.稍后,我们将处理系统调用和设备中断(32-47).

头文件inc/trap.h和kern/trap.h包含了中断异常相关的重要定义.其中kern/trap.h中的定义仅供内核使用.而inc/trap.h内核和用户空间的程序都可以使用.

注意: 0~31号异常并没有均被使用,其中一些是保留的.CPU从来不会产生这些异常,因此如何处理这些中断向量号无关紧要.怎么方便怎么来即可.

大体的处理流程如下:

      IDT                   trapentry.S         trap.c

+----------------+                        
|   &handler1    |---------> handler1:          trap (struct Trapframe *tf)
|                |             // do stuff      {
|                |             call trap          // handle the exception/interrupt
|                |             // ...           }
+----------------+
|   &handler2    |--------> handler2:
|                |            // do stuff
|                |            call trap
|                |            // ...
+----------------+
       .
       .
       .
+----------------+
|   &handlerX    |--------> handlerX:
|                |             // do stuff
|                |             call trap
|                |             // ...
+----------------+

每个异常和中断在trapentry.S中,都应该有自己对应的处理函数.trap_init()函数中需要在IDT中,设置这些中断处理函数.每个中断处理函数首先需要构建一个inc/trap.h struct Trapframe结构体,然后以struct Trapframe为参数调用trap.c trap()函数.trap()将根据中断号调用具体的中断处理逻辑.

Exercise 4

完善trapentry.S和trap.c,完成上面的Feature.宏TRAPHANDLER和TRAPHANDLER_NOEC对于定义中断处理函数很有帮助.中断号的定义在inc/trap.h中,以T_*开头.我们需要在trapentry.S中增加inc/trap.h中所定义的trap的入口函数.同时,我们需要完成_alltraps,以供TRAPHANDLER调用.最后,我们需要在trap_init()函数中设置IDT,SETGATE对完成代码有帮助.

_alltraps需要完成的功能的有:

将寄存器的值压入内核栈,以填充struct Trapframe
将值GD_KD载入ds和es寄存器
将esp寄存器作为参数,
调用trap()函数

考虑使用pushal指令来压入寄存器值,指令和struct Trapframe结构刚好一致.

测试

通过调用user目录下的一些二进制文件来进行测试.比如divzero,softinit,badsegment.

挑战

目前在trapentry.S和trap.c中,可能有大量的重复代码.重构这两个文件,修改trapentry.S中的宏,以自动生成一个数组供trap.c使用.

PartA