一  Linux的文件系统

1 我们都知道当我们安装Linux时会首先给系统分区,然后我们会把分区格式化成EXT3格式的文件系统。那么在Linux系统中还有没有其他的文件系统呢,下面我们就简单的介绍一下Linux系统中常见的几种文件系统。

(1)EXT3文件系统:ext3(第三级扩展Linux文件系统,third extended Linux filesystem)。跟EXT2文件不同之处就是增加了日志功能。

(2)EXT2和MSDOS:一般用于软盘

(3)ISO9660:光盘的文件系统

(4)GFS和GFS2:主要用于集群服务器的文件系统(SAN)

二 Linux文件系统的节点(Inodes)

1 Inode(index node )索引节点

2 首先我们要清楚地是:一个文件其实是由两部分组成:节点表和数据区。Inodes table (节点表)包含了ext2和ext3文件系统的所有属性。节点表里面主要存放文件的类型,权限,UID,GID,Link count,大小和时间戳,数据存放在磁盘的什么位置。数据区里面就是存放真正的数据。

3 一个inodes(节点号)的大小大概为128B,一个文件至少要占有1个inodes。通过tune2fs

-l /dev/sda7 可以查看这个分区的inode size,inode count,block count。

我们知道,计算机在识别一个用户是通过UID来识别的,识别一个进程是通过进程号来识别的,那么,同样,计算机识别一个文件是通过一个inode number来识别文件的。而文件名只是给人的识别的。

4 查看节点号的方法:#ls

-li

[root@localhost ~]# ls -li

total 56

533587 -rw------- 1 root root 1050 Mar 6 02:15 anaconda-ks.cfg

919063 drwxr-xr-x 2 root root 4096 Mar 6 02:43 Desktop

524290 -rw-r--r-- 1 root root 29302 Mar 6 02:15 install.log

524291 -rw-r--r-- 1 root root 3738 Mar 6 02:15 install.log.syslog

前面的一串数字就是文件的节点号,

其实我们的节点号是在分区创建的时候就已经分配好了的。

5 下面我们来学习复制,剪切,删除对文件inode的影响

(1)复制对文件inode的影响

[root@localhost ~]# cd /boot/

[root@localhost boot]# ls -li file

6030 -rw-r--r-- 1 root root 0 Mar 6 13:26 file a   

可以看到,这个文件的节点号是6030,现在我们将它复制到另外一个分区

[root@localhost boot]# cp file /var/

[root@localhost boot]# cd /var/

[root@localhost var]# ls -li file

2115361 -rw-r--r-- 1 root root 0 Mar 6 13:27 file

将这个文件复制到/var分区下面后,这个文件的inode number就改变了。

当一个文件从一个分区复制到另外一个分区的时候,系统就分配了另外一个inode给这个文件。

b     那么在同一个分区复制文件节点号会有什么改变呢

[root@localhost boot]# ls -li file

6030 -rw-r--r-- 1 root root 0 Mar 6 13:26 file

[root@localhost boot]# cp file /boot/grub/

[root@localhost boot]# cd grub/

[root@localhost grub]# ls -li file

22091 -rw-r--r-- 1 root root 0 Mar 6 13:29 file

可以看到,刚才这个文件的节点号是6030,现在就变成了22091了。

在同一个分区里面复制文件,这个文件的节点号也是会发生改变的。因为在这个分区有两份相同的文件,只是文件的内容相同,但是文件的inode属性却是不一样的。

2. 剪切对文件inode的影响

a 同一分区的剪切

[root@localhost ~]# cd /boot/

[root@localhost boot]# ls -li file

6030 -rw-r--r-- 1 root root 0 Mar 6 13:26 file

可以看到,这个文件的节点号是6030,现在我们将这个文件在同个分区里剪切一份。

[root@localhost boot]# mv file /boot/test/

[root@localhost test]# ls -li file

6030 -rw-r--r-- 1 root root 0 Mar 6 13:26 file

可以看到,这个文件节点号是没有改变的。

当在同一个分区里面移到文件,文件的节点号没有发生改变。

b 不同的分区剪切

[root@localhost ~]# cd /boot/test/

[root@localhost test]# ls -li file

6030 -rw-r--r-- 1 root

[root@localhost test]# mv /boot/test/file /var/ftp/pub/

[root@localhost test]# cd /var/ftp/pub/

[root@localhost pub]# ls -li file

325584 -rw-r--r-- 1 root root 0 Mar 6 13:26 file

可以看到,这个文件的节点号是肯定会变的。

3 删除对inode的影响

[root@localhost ~]# cd /boot/

[root@localhost boot]# ls -li file

6030 -rw-r--r-- 1 root root 0 Mar 6 13:44 file

[root@localhost boot]# rm -rf file

现在我们把file这个文件给删除了,其实我们只是将file这个文件的节点表给删除了,其实我们的数据都还在。这也就是为什么当我们删除一个文件,这个文件还可以被找回来的原因。当然如果我们在到这个分区里面写入数据,那么原来的数据就会被覆盖。

[root@localhost boot]# touch file1

[root@localhost boot]# ls -li file1

6030 -rw-r--r-- 1 root root 0 Mar 6 13:49 file1

现在我们又新建了一个文件file1,这个文件的节点号也是6030,它就已经覆盖了以前的数据的节点号。那么以前的数据就找不回来了。

4 总结

复制:在同一个分区,节点号改变。在不同的分区,节点号改变。

剪切:在同一个分区,节点号不变。在不同的分区,节点号改变。

删除:只是删除了文件的节点表,数据没有被真正删除,只有当往这个分区在写入数据的时候,才会覆盖原来的数据。


2:inode - linux文件系统的关键  

$ ls -li
 427333 drwx------      2 abao abao 4096 2009-08-12 20:19 amsn_received
 989840 -rwxrwxrwx    1 abao abao  144 2009-10-22 22:19 chroot-lfs.sh
1038353 drwxr-xr-x   13 abao abao 4096 2009-11-04 21:42 data
[注释: 上面的例子中,红色的就是inode number,蓝色的是当前文件的link count。]

inode是理解linux文件系统的核心概念。iNode的意思就是index node,就是索引的意思。linux中目录也被被看成是广义的文件,而理解inode正是理解这个广义文件的最好的办法。每个文件和目录都对应着一个inode,inode在一个分区内是唯一的。
对于文件而言,它的信息可以人为的看成三个部分,文件名,文件属性和文件内容。文件名就是我们通常使用的名字,文件属性则包括文件大小,权限设置,修改时间等。文件内容就是我们用cat命令能看到的东西。文件属性是全部保存在文件对应的inode当中的,文件内容在物理上和inode并不是存放在一起,而是放在稍微靠后的磁盘区,也可以称为数据区。在inode里面有指向数据区的指针。
对于目录而言,目录的存储也分成三个部分,也是目录名称,目录属性和目录内容这里提到的目录内容其实就是目录中包含的所有文件/子目录的对应关系(文件名-inode-关系表)。目录属性也存储在inode中,而目录内容就存储在inode所对应的数据区当中。
你可能会问,那么名字呢?文件和目录的名字跑到哪里去了呢?其实,这个名字就存储在它的父目录的内容当中。 举个例子如下。
/tmp包含了两个文件file1和file2。
那么在系统中就会有三个inode,比如说他们的inode number分别是1000(/tmp), 10001(/tmp/file1), 10002(/tmp/file2)。
那么1000#号inode中,保存了/tmp中所有的下属文件的inode和名字,已经目录自身的属性。
10001#号inode中,保存了/tmp/file1自己的文件属性,以及指向数据区的指针。
10002#号inode中,保存了/tmp/file2自己的文件属性,以及指向数据区的指针。
而/tmp这个目录名字,则是由它的父目录(也就是/)来负责管理的。
从上面的例子可以看到,名字,属性和内容,后两者是联系在一起的,名字则是归父目录去管理。当有两个目录都指向同一个inode的时候,就会出现同样的属性+内容,出现在两个不同的目录中。甚至可以以不同的名字出现在相同的目录中。这就是连接的概念,有多少个目录指向当前这个文件(或当前这个目录),这个数字就是link count。在连接中,inode number是父目录识别子体的关键信息。
注意到,每个分区(partition)都会有自己的inode列表,也就是每个分区的inode系统是独立的。那么当我们把一个分区设备装载到当前使用的分区时,两个inode系统就会重叠在一起。比如我的linux是mount在/dev/sda1上作为root的,然后我把/dev/sda2装载到/home上。就会发现/home和/的inode number都是2。这是两个分区inode表重叠在一起的表现。
如果你明白了以上的这个例子,就会能够回答如下的一些看上去很难的问题。


在上面的例子里面为什么我不能ln /home/abc/d  /file呢?因为这样去做相当于让一个/dev/sda1中的目录去连接/dev/sda2中的一个文件,这是inode系统所不允许的。
能够让ln作用在一个目录上呢?也就是ln <dir1> <dir2>呢?这样也不行,因为这样会出现<dir1>有两个父目录的情况,从直观上讲,这就是不合理的。
我用ls -li 命令,为什么看到空目录的inode link count是2呢?这是linux的系统就是这么设计的。当一个目录创建出来,它的"文件名-inode-关系表"里面就有两个元素,其一是".",表示指向自身,其二是".."指向它的父目录。而我们看到的这个2,一个是自身指向自身的link,另一个是它的父目录指向它的link(想想看"文件名-inode-关系表")。这里还有一个有意思的现象,就是这个新目录指向它的父目录,它的父目录也指向它,这种连接是双向的。
为什么我在目录里面增加一个文件,这个文件的link count是1,而它的父目录的link count却不变呢?由于一个文件可以被多次link的特性,暗示了文件不会记录它的父目录的inode,这样目录和它的子文件之间的关联是单向的。所以就会出现这样的情况。
ln -s的本质是什么?从编程的角度来看,symbolic link(符号连接)和连接从根本上不是一回事,符号连接其实就是名字的快捷方式,和windows中的快捷方式很类似。符号连接是从属于原始文件的,而连接创造出来的文件和原来文件是等同的。
ln -s的用处是什么呢?ln -s有三种主要的特性,一来它可以进行跨分区的操作,二来可以作用在目录上,三来是许多linux的脚本运行机制需要这样的符号连接。
/的inode是多少呢?我观察了几个系统,/目录的inode是2,但是目前我还没有不太了解原因。/proc /sys的inode是1,等我以后再来解释,现在我还不太明白。
如何知道一个系统能使用多少个inode呢?用如下的命令 tune2fs -l /dev/sda1,这个命令在e2fsprogs工具里面。
如果inode之间的连接出现问题,应该怎么解决?这是一个复杂的问题,简单的说,可以用e2fsck工具来进行检修,那些没有被link的inode会被挂到/lost+found目录下。

块与i节点

   linux文件系统是Linux系统的心脏部分,提供了层次结构的目录和文件。文件系统将磁盘空间划分为每1024个字节一组,称为块(也有用512字节为一块的,如:SCOXENIX)。编号从0到整个磁盘的最大块数。

     全部块可划分为四个部分,块0称为引导块,文件系统不用该块;块1称为专用块,专用块含有许多信息,其中有磁盘大小和全部块的其他两部分的大小。从块2开始是i节点表,i节点表中含有i节点,表的块数是可变的,后面将做讨论。i节点表之后是空闲存储块(数据存储块),可用于存放文件内容。

     文件的逻辑结构和物理结构是十分不同的,逻辑结构是用户敲入cat命令后所看到的文件,用户可得到表示文件内容的字符流。物理结构是文件实际上如何存放在磁盘上的存储格式。用户认为自己的文件是边疆的字符流,但实际上文件可能并不是以边疆的方式存放在磁盘上的,长于一块的文件通常将分散地存放在盘上。然而当用户存取文件时,linux文件系统将以正确的顺序取出各块,给用户提供文件的逻辑结构。

     当然,在linux系统的某处一定会有一个表,告诉文件系统如何将物理结构转换为逻辑结构。这就涉及到i节点了。i节点是一个64字节长的表,含有有关一个文件的信息,其中有文件大小、文件所有者、文件存取许可方式,以及文件为普通文件、目录文件还是特别文件等。在i节点中最重要的一项是磁盘地址表。

     该表中有13个块号。前10个块号是文件前10块的存放地址。这10个块号能给出一个至多10块长的文件的逻辑结构,文件将以块号在磁盘地址表中出现的顺序依次取得相应的块。当文件长于10块时又怎样呢?磁盘地址表中的第11项给出一个块号,这个块号指出的块中含有256个块号,至此,这种方法满足了至多长于266块的文件(272384字节)。如果文件大于266块,磁盘地址表的第12项给出一个块号,这个块号指出的块中含有256个块号,这256个块号的每一个块号又指出一块,块中含256个块号,这些块号才用于取文件的内容。磁盘地址中和第13项索引寻址方式与第12项类似,只是多一级间接索引。

     这样,在linux系统中,文件的最大长度是16842762块,即17246988288字节,有幸是Linux系统对文件的最大长度(一般为1到2M字节)加了更实际的限制,使用户不会无意中建立一个用完整个磁盘区所有块的文件。

    文件系统将文件名转换为i节点的方法实际上相当简单。一个目录实际上是一个含有目录表的文件:对于目录中的每个文件,在目录表中有一个入口项,入口项中含有文件名和与文件相应的i节点号。当用户敲入catxxx时,文件系统就在当前目录表中查找名为xxx的入口项,得到与文件xxx相应的i节点号,然后开始取含有文件xxx的内容的块。


GitHub 加速计划 / li / linux-dash
10.39 K
1.2 K
下载
A beautiful web dashboard for Linux
最近提交(Master分支:2 个月前 )
186a802e added ecosystem file for PM2 4 年前
5def40a3 Add host customization support for the NodeJS version 4 年前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐