open systemcallに対するメモ
open systemcallによって何がおきるのか?
open systemcallを発行すると、read(2),write(2),lseek(2),fcntl(2)などで使用されるファイルディスクリプタを返します。ファイルディスクリプタ自体は非負の整数で"その"プロセスが現在openしてない最小の値が返ります。これはプロセスごとに存在するファイルディスクリプタテーブルのidのようなものです。
memo
基本、こららのシステムコールはOSのバッファに対して実行を命令する物で物理媒体への書き込みを保証する物ではない。fsyncあたりがこれに当たるようだと現状の認識では考えている。この辺は確認しておきたい。
#include <fcntl.h> int main() { int fd; fd = open("test.txt", O_WRONLY); close(fd); return 0; }
実際openだけを実行しようとすると、手元のgccではコンパイルが通り実行できます。
ただし、上記の場合はopenのオプションの関係で先にtouch test.txtでファイルを作成しておく必要があります。
引数に渡す物はなにか?
int open(const char *pathname, int flags); int open(const char *pathname, int flags, mode_t mode);
第1引数でファイルパスを渡すのは割と明示的ですが、第2引数以降が割と曖昧でしたので纏めておこうかと
O_RDONLY, O_WRONLY, O_RDWR
この3つは必ずどれか一つを指定する必要があります。
O_CREAT
ファイルが存在しなかった場合において作成します。このオプションを指定することにより、事前にtouch hoge.txtなどする必要がなくなります。manを見る限りにおいて、O_CREATEが指定された場合は,第3引数のmodeを指定する必要があります。(ただ、彼方此方の動作させている例をみているとmodeを指定してこの引数を渡している物があんまり見受けられないようなので実は現在ではdefaultが効くのでいらないとか?)modeはこちらはsys/stat.hへ登録されているマクロを使用するとのこと。マクロはuser,group,othersでそれぞれ読み込み許可、書き込み許可、実行許可を設定する物がある。例えば、755だったら、S_IRWXU|S_IRGRP|S_IXGRP|S_IROTH|S_IXOTH となる。(see man 2 open)
#include <fcntl.h> int main() { int fd; fd = open("test.txt", O_CREAT|O_RDWR, S_IRWXU|S_IRGRP|S_IXGRP|S_IROTH|S_IXOTH); close(fd); return 0; }
O_DIRECT
アプリケーションが独自にキャッシュ機能を持っている場合においてOSのキャッシュ機能が邪魔になるケースがある。そういう場合においてO_DIRECTを指定することにより性能が向上する。このオプションが指定されている場合はI/Oは同期で行われ、read(2),write(2)が終了した時点でデータ転送が完了したことが保証される。ただし、アプリケーションの独自キャッシュ等が無い場合は大幅に性能が劣化する。
解説等はこちら
http://d.hatena.ne.jp/takkan_m/20071008/1191850035
検証はこちらを参考に
http://ishwat.blogspot.jp/2011/12/direct-io-write.html
正直書き込みでO_DIRECTが必要になるケースがよくわからない。読み込みケースの場合はアプリケーション側のキャッシュが有効な場合はO_DIRECTが有効になっていた方が良いであろうというのは想像できるのだが。物理的に書き込む場合はfsync system callを発行しなければならない。
http://aoking.hatenablog.jp/entry/20120921/1348220615
#include <fcntl.h> int main() { int fd; fd = open("test.txt", O_CREAT|O_RDWR|O_DIRECT, S_IRWXU|S_IRGRP|S_IXGRP|S_IROTH|S_IXOTH); close(fd); return 0; }
O_APPEND
ファイル追加モードでopenする。ファイルポインターをファイルの最後に移動させる。ファイルに対して追記をするときに使う複数のプロセスからO_APPENDで開いた場合でもwrite(2)をする直前にlseek(2)が走って末尾に行くことが保証されているのでファイルの末尾に書き込まれるようです。
memo
file pointerからKernelのファイルオブジェクトを調べる必要がある。
#include <fcntl.h> int main() { int fd; fd = open("test.txt", O_CREAT|O_RDWR|O_APPEND, S_IRWXU|S_IRGRP|S_IXGRP|S_IROTH|S_IXOTH); close(fd); return 0; }
TODO
- どれだけopenできるのか?
- 制約はどこにあるのか?
- 制約を自前で取るにはどこからとればいいのか?
参考文献
- man 2 syscalls
- man 2 open
- man 2 stat
- http://kotaroito.hatenablog.com/entry/20120108/1326030769
- [ファイルディスクリプタについて(1)~ファイルディスクリプタの概要|http://codezine.jp/article/detail/4836]
- [II-6-6. カーネルによるファイル操作|http://ossforum.jp/en/node/858]
- [読書メモ / "Advanced UNIX Programming" | http://www.glamenv-septzen.net/view/842 ]
- fsync http://aoking.hatenablog.jp/entry/20120921/1348220615
- 作者: Michael Kerrisk,千住治郎
- 出版社/メーカー: オライリージャパン
- 発売日: 2012/12/01
- メディア: 大型本
- クリック: 14回
- この商品を含むブログ (5件) を見る