關(guān)于 PHP 的文件操作,我們也將是通過一系列的文章來進行學(xué)習(xí)。今天我們先學(xué)習(xí)的是一個很少人使用過,甚至很多人根本不知道的擴展,它與我們?nèi)粘5奈募僮饔行┰S的不同。不過這些差別并不是我們?nèi)庋鬯苤庇^看到的,主要還是在于業(yè)務(wù)的需求與性能的平衡。
什么是Direct IO
Direct IO 其實是 Linux 操作系統(tǒng)中的一個概念。它的意思是直接操作文件流,為什么說是直接呢?其實在我們的操作系統(tǒng)進行文件操作的時候,并不是馬上直接就在磁盤上進行文件的讀寫,中間還有一層頁緩存。既然是緩存,那么它當(dāng)然是會帶來一定的性能提升,但這也并不是完全絕對的。而直接操作就是忽略掉這一層的緩存操作,直接對磁盤上的文件進行讀寫。我們都知道,磁盤,即使是固態(tài)硬盤,它和 CPU 以及內(nèi)存的處理速度之間都是有著巨大的落差的,默認(rèn)的頁緩存就是用來彌補這種差距。但是頁緩存會加大 CPU 的運算操作以及占用內(nèi)存,而直接操作則不會有這種問題,但是相對來說,它的速度并不能和帶緩存的文件讀取操作相媲美。
以上是關(guān)于 Direct IO 的一個簡單的理解,更詳盡的解釋大家可以參考文末參考文檔中第二條鏈接的內(nèi)容并進行深入的學(xué)習(xí)。在 PHP 中,我們直接在 PECL 下載 Direct IO 擴展就可以按照擴展的正常安裝方式進行安裝使用。
創(chuàng)建寫入文件
既然是文件操作,那么我們首先還是來創(chuàng)建和寫入一些文件數(shù)據(jù)。
$fd = dio_open("./test", O_RDWR | O_CREAT);
echo dio_write($fd, "This is Test.I'm ZyBlog.Show me the money4i"), PHP_EOL;
// 43
print_r(dio_stat($fd));
// Array
// (
// [device] => 64768
// [inode] => 652548
// [mode] => 35432
// [nlink] => 1
// [uid] => 0
// [gid] => 0
// [device_type] => 0
// [size] => 43
// [block_size] => 4096
// [blocks] => 8
// [atime] => 1602643459
// [mtime] => 1602656963
// [ctime] => 1602656963
// )
dio_close($fd);
和 f 系列的函數(shù)類似,我們需要使用一個 dio_open() 函數(shù)來打開一個文件,O_RDWR | O_CREAT 參數(shù)的意思是打開一個可讀寫文件,并且如果文件不存在的話,創(chuàng)建它。這兩個常量是與 Linux 中相關(guān)的直接操作文件的常量對應(yīng)的,在文末的鏈接中也可以看到關(guān)于這些常量的解釋。
寫入操作也是同樣的使用一個 dio_write() 就能夠完成,它返回的內(nèi)容是寫入的內(nèi)容長度,這里我們寫入了 43 個字符。
dio_stat() 是返回當(dāng)前文件句柄的一些信息,我們可以看到設(shè)備號 device 、uid 、 gid 、 atime 、 mtime 等一些信息,它們和我們在 Linux 中能夠看到的信息類似,其實就是這個文件的一些簡單的信息。
讀取文件
讀取文件使用非常簡單的使用一個函數(shù)就可以完成。
$fd = dio_open("./test", O_RDWR | O_CREAT);
echo dio_read($fd), PHP_EOL;
// This is Test.I'm ZyBlog.Show me the money4i
dio_close($fd);
dio_read() 函數(shù)還包含另外一個參數(shù),可以按指定的字節(jié)長度讀取內(nèi)容,這個在后面我們還會看到相關(guān)的示例。
文件操作
在文件的讀取過程中,我們有可能只需要讀取一部分的內(nèi)容,或者從某一位置開始讀取文件內(nèi)容,下面的操作函數(shù)就是針對這兩個方面進行操作的。
$fd = dio_open("./test", O_RDWR | O_CREAT);
var_dump(dio_truncate ($fd , 20));
// bool(true)
echo dio_read($fd), PHP_EOL;
// This is Test.I'm ZyB
dio_seek($fd, 3);
echo dio_read($fd), PHP_EOL;
// s is Test.I'm ZyB
dio_close($fd);
其實從名稱就可以看出 dio_truncate() 就是用于截斷文件內(nèi)容的。在這里我們從第 20 個字符進行截斷,然后再使用 dio_read() 讀取的內(nèi)容就只是前 20 個字符的內(nèi)容了。
dio_seek() 則是指定從哪一個字符開始讀取內(nèi)容,我們指定開始字符位置為 3 之后,前面三個字符就不會被讀取到了。需要注意的是,dio_truncate() 會修改原始文件的內(nèi)容,而 dio_seek() 則不會修改。
其它設(shè)置
$fd = dio_open('./test', O_RDWR | O_NOCTTY | O_NONBLOCK);
dio_fcntl($fd, F_SETFL, O_SYNC);
dio_tcsetattr($fd, array(
'baud' => 9600,
'bits' => 8,
'stop' => 1,
'parity' => 0
));
while (($data = dio_read($fd, 4))!=false) {
echo $data, PHP_EOL;
}
// This
// is
// Test
// .I'm
// ZyB
dio_close($fd);
dio_fcntl() 函數(shù)是調(diào)用的 c 函數(shù)庫中的 fcntl 函數(shù),目的是對文件描述符執(zhí)行指定的一些操作,這個操作也是以一些常量進行固定的,在這里我們使用的是 F_SETFL ,它的意思是將文件描述符標(biāo)志設(shè)置為指定的值,這個 O_SYNC 表示的是如果設(shè)置了這個描述符,則對該文件的寫操盤會等到數(shù)據(jù)被寫到磁盤上才結(jié)束。當(dāng)然,這個函數(shù)還可以設(shè)置很多別的操作符,大家可以參考 PHP 的官方文檔進行深入的學(xué)習(xí)。
dio_tcsetattr() 用于設(shè)置打開文件的終端屬性和波特率。 baud 表示的就是波特率,bits 表示的是位,stop 表示的是停止位,parity 表示的是奇偶校驗位。關(guān)于這方面的內(nèi)容需要 《計算機組成原理》 及 《操作系統(tǒng)》 中的一些知識,我也并不十分地清楚,所以也就不詳細(xì)的解釋了。從這里就可以看出,大學(xué)課堂上的那些基礎(chǔ)課程真的是非常地重要,相信好好學(xué)過這些專業(yè)基礎(chǔ)課程的同學(xué)一定能馬上明白這個函數(shù)的作用。
最后,我們在 dio_read() 中使用了第二個參數(shù)來根據(jù)字節(jié)長度讀取文件內(nèi)容,可以看到讀取出來的內(nèi)容是一段一段的以 4 個字符長度為單位的輸出。
總結(jié)
函數(shù)的學(xué)習(xí)還是比較簡單的,核心的還是要知道這個擴展在什么業(yè)務(wù)場景下更適合使用。在文章開頭的介紹中我們已經(jīng)說明了直接操作文件與普通文件操作的一些區(qū)別,在自緩存應(yīng)用或者需要傳輸非常大的數(shù)據(jù)時,直接操作對于 CPU 和 內(nèi)存 更加地友好。而其它情況,我們還是使用系統(tǒng)默認(rèn)的文件操作方式就可以了。其實在大部分情況下,我們基本看不出來它們的顯著區(qū)別。所以在實際應(yīng)用中,還是那句話,結(jié)合業(yè)務(wù)實際情況,選擇最佳的方案。
測試代碼:
https://github.com/zhangyue0503/dev-blog/blob/master/php/202010/source/4.PHP中DirectIO直操作文件擴展的使用.php
參考文檔:
https://www.php.net/manual/zh/book.dio.php
https://www.ibm.com/developerworks/cn/linux/l-cn-directio/
到此這篇關(guān)于PHP中DirectIO直操作文件擴展的使用的文章就介紹到這了,更多相關(guān)php擴展的使用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- PHP獲取文件擴展名的常用方法小結(jié)【五種方式】
- php獲取文件名稱和擴展名的方法
- PHP獲取文件擴展名的4種方法
- php文件擴展名判斷及獲取文件擴展名的N種方法
- PHP中獲取文件擴展名的N種方法小結(jié)