當前位置:首頁 > 公眾號精選 > 程序喵大人
[導讀]今天我們來思考一個簡單的問題。在Linux下你用touch命令新建一個空文件: touch empty_file.txt 當操作完成後,是否要消耗掉我們的一些磁盤空間?需要的話,大概能消耗多少?嗯,是的,這個問題簡單的超乎你的想象,但是不知道你否能給你自己一個滿意的答案。

今天我們來思考一個簡單的問題。在Linux下你用touch命令新建一個空文件:

touch empty_file.txt

操作完成後,是否要消耗掉我們的一些磁盤空間?需要的話,大概能消耗多少?嗯,是的,這個問題簡單的超乎你的想象,但是不知道你否能給你自己一個滿意的答案。

我前面的幾篇文章都是介紹的磁盤物理層面的構成,但這對於理解文件相關的問題幫助可能還不夠。從今天開始讓我們從物理層往上走,到Linux文件系統原理裏去尋找答案。

1
實踐出真知

我覺得可能先丟開內核原理,直接動手操作來實驗更有意思一些。你一定知道ls這個命令你可以查看文件大小,那麼讓我們就用它來看一下。

# touch abcdefghigklmn.txt  
# ls -l  
total 0  
-rw-r--r-- 1 root root 0 Aug 17 17:49 empty.file

額,ls命令告訴我這個空文件佔用的是0。文件的大小確實是0,因為我們還沒有為該文件寫入任何內容。但是我們現在要思考的是,一個空文件是否佔用磁盤空間。所以直覺告訴我們這絕對不可能,磁盤上多出來一個文件,怎麼可能一點空間開銷都沒有!

為了解開這個謎底,還需要藉助df命令。輸入df –i

# df -i
Filesystem            Inodes   IUsed   IFree IUse% Mounted on
......
/dev/sdb1            2147361984 12785019 2134576965    1% /search

這個輸出幫我們展示了我們文件系統中inode的使用情況。注意IUsed是12785019。我們繼續新建一個空文件:

# touch empty_file2.txt
df -i
Filesystem            Inodes   IUsed   IFree IUse% Mounted on
......
/dev/sdb1            2147361984 12785020 2134576964    1% /search

這下注意IUsed變成了12785020。

哈哈,我們的一個結論就出來了。新建一個空文件會佔用一個Inode

2
細説Inode

那麼inode裏都存了哪些和文件相關的信息呢?我們再稍微看一下內核的源代碼。大家可以下載一份linux的源代碼。以ext2文件系統為例,在我下載的linux-2.6裏的文件fs/ext2/ext2.h中,可以找到內核對於inode結構體的定義。該結構體較為複雜,主要存儲除了文件內容以外的一些其他數據,我們選一些比較關鍵的截取出來:

struct ext2_inode {
       __le16  i_mode;         # 文件權限
       __le16  i_uid;          # 文件所有者ID
       __le32  i_size;         # 文件字節數大小
       __le32  i_atime;        # 文件上次被訪問的時間
       __le32  i_ctime;        # 文件創建時間
       __le32  i_mtime;        # 文件被修改的時間
       __le32  i_dtime;        # 文件被刪除的時間
       __le16  i_gid;          # 文件所屬組ID
       __le16  i_links_count;  # 此文件的inode被連接的次數
       __le32  i_blocks;       # 文件的block數量
       ......
       __le32  i_block[EXT2_N_BLOCKS]; # 指向存儲文件數據的塊的數組
       ......

可以看到和文件相關的所屬用户、訪問時間等都是存在inode中的。另外在include/linux/fs.h中,還有個VFS層面的inode的定義,這裏咱就不發散了。使用stat命令就可以直接看到文件inode中數據。

# stat test
 File: `test'
 Size: 0               Blocks: 0          IO Block: 1024   regular empty file
Device: 801h/2049d      Inode: 26          Links: 1
Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root)
Access: 2020-03-01 12:14:31.000000000 +0800
Modify: 2020-03-01 12:14:31.000000000 +0800
Change: 2020-03-01 12:14:31.000000000 +0800

每個inode到底是多大呢?dumpe2fs可以告訴你(XFS的話使用xfs_info)。

# dumpe2fs -h /dev/mapper/vgroot-lvroot
dumpe2fs 1.41.12 (17-May-2010)
......
Inode size:               256

Inode size表示每個Inode的大小。我的這台機器上,每個inode都是256字節。兩個inode的大小正好對齊到磁盤扇區的512字節。

3
文件名存到哪裏了

Inode結構體都看完了,搞了半天不知道有沒有發現一個問題,inode裏並沒有存儲文件名!!那麼,文件名到底跑哪兒去了?

fs/ext2/ext2.h中,我找到了如下文件夾相關的結構體

struct ext2_dir_entry {
        __le32  inode;                  /* Inode number */
        __le16  rec_len;                /* Directory entry length */
        __le16  name_len;               /* Name length */
        char    name[];                 /* File name, up to EXT2_NAME_LEN */
};

這個結構體就是我們司空見慣的文件夾所使用的數據結構。沒錯,文件名是存在其所屬的文件夾中的,就是其中的char name[]字段。和文件名一起,文件夾裏還記錄了該文件的inode號等信息。

4
結論
  • 1. 新建一個空文件需要消耗掉一個inode,用來保存用户、創建時間等元數據。

  • 2. 新建一個空文件還需要消耗掉其所在目錄的block中一定的空間,這些空間用來保存文件名,inode號等信息。

所以,看起來新建一個空文件而已,只要你想挖,真的能挖出很多知識的。最後分享一個我們團隊裏同學遇到的一個故障。我們的一台離線任務機直接歇菜了,重啓後排查原因是inode被消耗光了。再追查發現一個進程創建了太多的空日誌文件。雖然文件都是空文件,但是inode卻被浪費光了。後來讓負責的同學修改了創建日誌文件的邏輯,刪掉了多出來的空文件,該機器恢復正常。

往期推薦




免責聲明:本文內容由21ic獲得授權後發佈,版權歸原作者所有,本平台僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平台立場,如有問題,請聯繫我們,謝謝!

換一批

延伸閲讀

[strongerHuang] 深度掌握bin、hex、axf和elf文件格式

作者 | strongerHuang 微信公眾號 | 嵌入式專欄 在嵌入式軟件開發中,bin、hex、axf和elf這四種格式的文件很常見。 之前我...

關鍵字: 文件格式 bin 嵌入式

[嵌入式案例Show] STM32 時鐘分析

01 前言 在嵌入式系統中時鐘是其脈搏,處理器內核在時鐘驅動下完成指令執行,狀態變換等動作。外設部件在時鐘的驅動下完成各種工作,比如串口數據的發送、A/D轉換、定時器計數等等。...

關鍵字: 時鐘 STM32 嵌入式

[嵌入式ARM] 盤點STM32的國產替代者(4)

應讀者要求,嵌入式ARM將繼續介紹能夠替代STM32的國產產品。 MM32是一個全球化的MCU產品,靈動微在上海設立芯片設計及運營中心,藉助上海晶圓代工、封裝測試完整產業鏈,確保靈動MCU從研發到生...

關鍵字: 國產 STM32 嵌入式

[嵌入式雲IOT技術圈] 單片機到底是如何軟硬件結合的(深度好文)

我們通過IO和串口的軟件開發,已經體驗了嵌入式軟件開發。不知道大家有沒有疑惑,為什麼軟件能控制硬件?反正當年我學習51的時候,有這個疑惑。今天我們就暫停軟件開發,分析單片機到底是如何軟硬件結合的。並通過一個基本的程序,分析單片...

關鍵字: 單片機 IO 嵌入式

[嵌入式案例Show] 嵌入式軟件中的延時函數

1、前言 延時函數是嵌入式軟件開發中必不可少的功能函數,在每個工程裏都能找到它的蹤影。雖然看起來不起眼,但在有些時序控制的場合,使用了一點點delay,往往能解決大問...

關鍵字: 軟件 延時函數 嵌入式

技術子站

關閉