cloneのヘルプ・マニュアル
日本語 英語
clone --help
man clone
CLONE(2) Linux Programmer’s Manual CLONE(2)
名前
clone, __clone2 - 子プロセスを作成する
書式
#define _GNU_SOURCE
#include
int clone(int (*fn)(void *), void *child_stack,
int flags, void *arg, ...
/* pid_t *pid, struct user_desc *tls, pid_t *ctid */ );
説明
clone() は fork(2) と同じような方法で新しいプロセスを作成する。 clone()
には、ライブラリ関数とその下層にあたる clone() システムコールが存在する
。 以 下 の 説明では、システムコールの方を sys_clone と表すこととする。
sys_clone に関する説明はこのマニュアルの最後の方にある。
fork(2) とは異なり、これらのコールでは、子プロセス (child process) と呼
び 出し元のプロセスとが、メモリ空間、ファイルディスクリプタのテーブル、
シグナル・ハンドラのテーブルなどの実行コンテキストの一部を共有できる 。
(このマニュアルにおける「呼び出し元のプロセス」は、通常は「親プロセス」
と一致する。但し、後述の CLONE_PARENT の項も参照のこと)
clone() の主要な使用法はスレッド (threads) を実装することである: 一つの
プ ログラムの中の複数のスレッドは共有されたメモリ空間で同時に実行される
。
clone() で子プロセスが作成された時に、作成された子 プ ロ セ ス は 関 数
fn(arg) を実行する。 (この点が fork(2) とは異なる。 fork(2) の場合、子
プロセスは fork(2) が呼び出された場所から実行を続ける。) fn 引き数は 、
子 プロセスが実行を始める時に子プロセスが呼び出す関数へのポインタである
。 arg 引き数はそのまま fn 関数へと渡される。
fn(arg) 関数が終了すると、子プロセスは終了する。 fn によって返された 整
数が子プロセスの終了コードとなる。子プロセスは、 exit(2) を呼んで明示的
に終了することもあるし、致命的なシグナルを受信した場合に終了すること も
ある。
child_stack 引き数は、子プロセスによって使用されるスタックの位置を指定
する。子プロセスと呼び出し元のプロセスはメモリを共有することがあるた め
、 子プロセスは呼び出し元のプロセスと同じスタックで実行することができな
い。このため、呼び出し元のプロセスは子プロセスのスタックのためのメモ リ
空間を用意して、この空間へのポインタを clone() へ渡さなければならない。
(HP PA プロセッサ以外の) Linux が動作する全てのプロセッサでは、スタック
は 下方 (アドレスが小さい方向) へと伸びる。このため、普通は child_stack
は子プロセスのスタックのために用意したメモリ空間の一番大きいアドレス を
指すようにする。
flags の下位 1 バイトは子プロセスが死んだ場合に親プロセスへと送られる
終了シグナル (termination signal) の番号を指定する。このシグナルとし て
SIGCHLD 以外が指定された場合、親プロセスは、 wait(2) で子プロセスを待つ
際に、オプションとして __WALL または __WCLONE を指定しなければならな い
。 どのシグナルも指定されなかった場合、子プロセスが終了した時に親プロセ
スにシグナルは送られない。
flags には、以下の定数のうち 0個以上をビット毎の論理和 (bitwise-or) を
と ったものを指定できる。これらの定数は呼び出し元のプロセスと子プロセス
の間で何を共有するかを指定する:
CLONE_CHILD_CLEARTID (Linux 2.5.49 以降)
子プロセスが終了したときに子プロセスのメモリ内の child_tidptr が
指 す 場所にある子プロセスのスレッド ID を消去し、そのアドレスで
futex を wake (起床) させる。このアドレス は set_tid_address(2)
システムコールで変更することができる。この機能はスレッドライブラ
リで使用される。
CLONE_CHILD_SETTID (Linux 2.5.49 以降)
子プロセスのメモリ内の child_tidptr が指す場所に子プロセスのスレ
ッド ID を格納する。
CLONE_FILES
CLONE_FILES が設定された場合、呼び出し元のプロセスと子プロセスは
ファイルディスクリプタのテーブルを共有する。呼び出し元プロセスと
その子プロセスの一方が作成したファイルディスクリプタは、もう一方
においても有効である。同じように、一方のプロセスがファイルディス
ク リプタを閉じたり、 (fcntl(2) F_SETFD 操作を使って) ディスクリ
プタに関連するフラグを変更したりすると、もう一方のプロセスにも影
響する。
CLONE_FILES が設定されていない場合、子プロセスは、 clone() が実
行された時点で、呼び出し元のプロセスがオープンしている全てのファ
イルディスクリプタのコピーを継承する (子プロセスの複製されたファ
イルディスクリプタは、対応する呼び出し元のプロセスのファイルディ
ス クリプタと同じファイル記述 (open(2) 参照) を参照する)。これ以
降に、呼び出し元のプロセスと子プロセスの一方がファイルディスクリ
プタの操作 (ファイルディスクリプタのオープン・クローズや、ファイ
ルディスクリプタ・フラグの変更) を行っても、もう一方のプロセスに
は影響を与えない。
CLONE_FS
CLONE_FS が設定された場合、呼び出し元のプロセスと子プロセスが同
じファイル・システム情報を共有する。ファイル・システム情報は、フ
ァ イル・システムのルート (root)、カレント・ワーキング・ディレク
トリ (current working directory) や umask などである。呼び出し元
の プ ロ セ ス や 子 プ ロ セスのどちらか一方によって chroot(2),
chdir(2), umask(2) が呼び出されると、もう一方のプロセスにも影 響
が及ぶ。
CLONE_FS が設定されていない場合、子プロセスは、 clone() が実行さ
れた時点での、呼び出し元のプロセスのファイル・システム情報のコピ
ーを使用する。これ以降は、呼び出し元のプロセスと子プロセスの一方
が chroot(2), chdir(2), umask(2) を呼び出しても、もう一方のプ ロ
セスには影響を与えない。
CLONE_IO (Linux 2.6.25 以降)
CLONE_IO が設定された場合、新しいプロセスは呼び出し元のプロセス
と I/O コンテキストを共有する。このフラグが設定されていない場 合
に は、 (fork(2) の場合と同様) 新しいプロセスは自分専用の I/O コ
ンテキストを持つ。
I/O コンテキストは、ディスクスケジュールの I/O スコープである (
言 い換えると、I/O コンテキストは I/O スケジューラがプロセス I/O
のスケジューリングをモデル化するのに使用される)。複数のプロセ ス
が同じ I/O コンテキストを共有する場合、これらのプロセスは I/O ス
ケジューラからは一つとして扱われる。結果として、これらのプロセス
は ディスクアクセスの時間を共有するようになる。いくつかの I/O ス
ケジューラでは、二つのプロセスが I/O コンテキストを共有してい る
場合、これらのプロセスはディスクアクセスを交互に行うことができる
。同じプロセスの複数のスレッドが I/O を実行している場合 (例え ば
aio_read(3)) 、 CLONE_IO を利用することで I/O 性能を良くすること
ができる。
カーネルの設定が CONFIG_BLOCK オプション付きでない場合、このフラ
グは何の意味も持たない。
CLONE_NEWIPC (Linux 2.4.19 以降)
CLONE_NEWIPC が設定された場合、新しい IPC 名前空間 (namespace)
でプロセスを作成する。このフラグが設定さ れ て い な い 場 合 、
(fork(2) の場合と同様) 呼び出し元のプロセスと同じ IPC 名前空間で
プロセスが作成される。このフラグは、コンテナの実装での使用を意図
して用意されたものである。
IPC 名 前 空間は、System V IPC オブジェクト用の識別子 (identi-
fiers) の集合で構成される (System V IPC オ ブ ジ ェ ク ト は
msgctl(2), semctl(2), shmctl(2) を使って作成される)。ある IPC 名
前空間に作成されたオブジェクトは、その名前空間のメンバーである他
の プロセスからも見えるが、違う IPC 名前空間のプロセスからは見え
ない。
IPC 名前空間が破棄される時 (すなわち、その名前空間のメンバーの最
後のプロセスが終了する時)、その名前空間の全ての IPC オブジェクト
は自動的に破棄される。
このフラグを使用するためには、カー ネ ル で オ プ シ ョ ン CON-
FIG_SYSVIPC と CONFIG_IPC_NS を有効になっていること、プロセスが
特権 (CAP_SYS_ADMIN) を持っていることが必要である。このフラグ は
CLONE_SYSVSEM と組み合わせて使うことはできない。
CLONE_NEWNET (Linux 2.6.24 以降)
( こ のフラグの実装はまだ完了していないが、おそらく Linux 2.6.28
あたりまでにはほぼ完成することだろう。)
CLONE_NEWNET が設定された場合、新しいネットワーク名前空間 (net-
work namaspace) でプロセスを作成する。このフラグが設定されていな
い場合、 (fork(2) の場合と同様) 呼び出し元のプロセスと同じネット
ワーク名前空間でプロセスが作成される。このフラグは、コンテナの実
装での使用を意図して用意されたものである。
ネットワーク名前空間は、分離されたネットワークスタックを提供する
ものである (ネットワークスタックとは、ネットワークデバイスインタ
フェース、IPv4 や IPv6 プロト コ ル ス タ ッ ク 、 /proc/net 、
/sys/class/net ディレクトリツリー、ソケットなどである)。物理ネッ
トワークデバイスが所属できるネットワーク名前空間は一つだけである
。仮想ネットワークデバイス ("veth") のペアによりパイプ風の抽象化
(abstraction) が実現されており、これを使うことで、ネットワーク名
前空間間のトンネルを作成したり、別の名前空間の物理ネットワークデ
バイスへのブリッジを作成したりすることができる。
ネットワーク名前空間が解放される時 (すなわち、その名前空間の最後
の プロセスが終了する時)、物理ネットワークデバイスは初期ネットワ
ーク名前空間 (initial network namespace) に戻される (親プロセ ス
のネットワーク名前空間に戻される訳ではない)。
このフラグを使用するためには、カーネルでオプション CONFIG_NET_NS
を有効になっていること、プロセスが特権 (CAP_SYS_ADMIN) を持っ て
いることが必要である。
CLONE_NEWNS (Linux 2.4.19 以降)
子 プロセスを新しいマウント名前空間 (mount namespace) で開始する
。
各プロセスはある一つのマウント名前空間中に存在する。プロセスの
名 前空間 (namespace) は、そのプロセスから見えるファイル階層を表
すデータ (mount の集合) である。 CLONE_NEWNS フラグがセットさ れ
ずに fork(2) か clone() が呼ばれると、子プロセスは親プロセスと同
じマウント名前空間に作成される。シス テ ム コ ー ル mount(2) 、
umount(2) が呼ばれると呼び出し元のプロセスのマウント名前空間が変
更され、この結果呼び出し元のプロセスと同じ名前空間にいるプロセス
はすべて影響を受けるが、異なるマウント名前空間にいるプロセスは影
響を受けない。
CLONE_NEWNS フラグがセットされて clone() が呼ばれると、clone で
作成された子プロセスは新しいマウント名前空間で開始される。新しい
名前空間は親プロセスの名前空間のコピーで初期化される。
特権プロセス (CAP_SYS_ADMIN ケーパビリティを持つプロセス) のみが
CLONE_NEWNS フラグを指定することができる。一つの clone() 呼び出
しで、 CLONE_NEWNS と CLONE_FS の両方を指定することはできない。
CLONE_NEWPID (Linux 2.6.24 以降)
CLONE_NEWPID が設定された場合、新しい PID 名前空間でプロセスを作
成 す る。このフラグが設定されていない場合、 (fork(2) の場合と同
様) 呼び出し元のプロセスと同じ PID 名前空間でプロセスが作成さ れ
る。このフラグは、コンテナの実装での使用を意図して用意されたもの
である。
PID 名前空間は、PID に関して分離された環境を提供するものである。
新しい名前空間における PID は 1 から始まり (これはスタンドアロン
のシステムと似たような感じ)、 fork(2), vfork(2), clone(2) を呼び
出すと、その名前空間で一意な PID を持ったプロセスが作成される。
新 しい名前空間で作成される最初のプロセス (つまり、 CLONE_NEWPID
フラグを使って作成されたプロセス) の PID は 1 であり、このプロセ
スはその名前空間における "init" プロセスとなる。この名前空間にお
いて孤児 (orphaned) となった子プロセスについては、 init(8) で は
なくこのプロセスが親プロセスとなる。昔ながらの init プロセスとは
違い、PID 名前空間の "init" プロセスは終了 (terminated) すること
ができ、その場合には、この名前空間の全てのプロセスが終了される。
PID 名前空間間には階層構造が形成される。新しい PID 名前空間が 作
成されると、その名前空間のプロセスは、新しい名前空間を作成したプ
ロセスの PID 名前空間で見える。同様に、親の PID 名前空間自体が別
の PID 名前空間の子供の場合には、子供の PID 名前空間と親の PID
名前空間のプロセスはどれも親の親の PID 名前空間でも見えること に
な る。反対に、「子供」の PID 名前空間のプロセスには、親の名前空
間のプロセスは見えない。名前空間に階層構造が存在するということは
、 個々のプロセスは複数の PID を持つということを意味している。そ
のプロセスが見える名前空間一つにつき PID が一つあり、それぞれ の
PID は対応する名前空間において一意である。 (getpid(2) を呼び出す
と、常にそのプロセスが存在している名前空間における PID が返さ れ
る。)
新 しい名前空間の作成後には、子プロセスにおいて、 ps(1) といった
ツールが正しく動作するように、自身の root ディレクトリを変更し、
/proc に新しい procfs インスタンスをマウントするのがよいだろう。
(flags に CLONE_NEWNS も指定されていた場合には、root ディレク ト
リ を 変 更 する必要はなく、いきなり新しい procfs インスタンスを
/proc にマウントすることができる。)
このフラグを使用するためには、カーネルでオプション CONFIG_PID_NS
を 有効になっていること、プロセスが特権 (CAP_SYS_ADMIN) を持って
いることが必要である。このフラグは CLONE_THREAD と組み合わせて使
うことはできない。
CLONE_NEWUTS (Linux 2.6.19 以降)
CLONE_NEWUTS が設定された場合、新しい UTS 名前空間でプロセスを作
成する。新しい UTS 名前空間の識別子の初期値は、呼び出し元のプ ロ
セ スの UTS 名前空間の識別子を複製したものとなる。このフラグが設
定されていない場合、 (fork(2) の場合と同様) 呼び出し元のプロセス
と 同じ UTS 名前空間でプロセスが作成される。このフラグは、コンテ
ナの実装での使用を意図して用意されたものである。
UTS 名前空間は、 uname(2) が返す識別子の集合である。識別子として
は ド メ イ ン 名 と ホ スト名があり、それぞれ setdomainname(2),
sethostname(2) で修正することができる。ある UTS 名前空間における
識 別 子の変更は同じ名前空間の他のプロセスには見えるが、別の UTS
名前空間のプロセスには見えない。
このフラグを使用するためには、カーネルでオプション CONFIG_UTS_NS
を 有効になっていること、プロセスが特権 (CAP_SYS_ADMIN) を持って
いることが必要である。
CLONE_PARENT (Linux 2.3.12 以降)
CLONE_PARENT が設定された場合、新しい子供の (getppid(2) で返され
る) 親プロセスは呼び出し元のプロセスの親プロセスと同じになる。
CLONE_PARENT が設定されていない場合、 (fork(2) と同様に) 呼び出
し元のプロセスがその子供の親になる。
子供が終了した時にシグナルが送られるのは getppid(2) が返す親プロ
セスである点に注意すること。このため CLONE_PARENT が設定された場
合、呼び出し元のプロセスではなく呼び出し元のプロセスの親プロセス
にシグナルが送られる。
CLONE_PARENT_SETTID (Linux 2.5.49 以降)
親 プロセスと子プロセスのメモリ内の parent_tidptr が指す領域に子
プロセスのスレッド ID を格納する。 (Linux 2.5.32-2.5.48 では、同
じことをする CLONE_SETTID というフラグが存在した。)
CLONE_PID (廃止予定)
CLONE_PID が設定された場合、子プロセスは呼び出し元のプロセスと同
じプロセス ID で作成される。これはシステムをハッキングするのには
便利だが、それ以外にはあまり使われない。 Linux 2.3.21 以降では、
システムのブートプロセス (PID 0) だけがこのフラグを指定できる 。
Linux 2.5.16 で削除された。
CLONE_PTRACE
CLONE_PTRACE が指定され、かつ呼び出し元のプロセスが追跡 (trace)
されていた場合、子プロセスも同様に追跡される。 (ptrace(2) を参照
のこと)
CLONE_SETTLS (Linux 2.5.32 以降)
newtls 引き数は、新しい TLS (Thread Local Storage) ディスクリプ
タである。 (set_thread_area(2) を参照のこと)
CLONE_SIGHAND
CLONE_SIGHAND が設定された場合、呼び出し元のプロセスと子プロセス
は同じシグナル・ハンドラのテーブルを共有する。呼び出し元のプロセ
スまたは子プロセスのどちらかが sigaction(2) を呼び出してシグナル
に対応する動作を変更した場合、もう一方のプロセスのシグナル動作も
変更される。但し、呼び出し元のプロセスと子プロセスは、プロセス毎
に 、シグナル・マスク (signal mask) と処理待ちシグナルの集合を持
っている。このため、あるプロセスは、 sigprocmask(2) を使用して、
も う一方のプロセスに影響を与えずにシグナルを禁止 (block) したり
許可 (unblock) したりできる。
CLONE_SIGHAND が設定されていない場合、子プロセスは clone() が 実
行された時点での、呼び出し元のプロセスのシグナル・ハンドラのコピ
ーを継承する。これ以降は、一方のプロセスが sigaction(2) を呼び出
しても、もう一方のプロセスには影響を与えない。
Linux 2.6.0-test6 以 降 では、 CLONE_SIGHAND を指定する場合、
CLONE_VM も flags に含めなければならない。
CLONE_STOPPED (Linux 2.6.0-test2 以降)
CLONE_STOPPED が設定されると、子プロセスは最初 (SIGSTOP シグナル
を送られたかのように) 停止した状態となる。子プロセスを再開させる
には SIGCONT シグナルを送信しなければならない。
Linux 2.6.25 以降、このフラグは非推奨である。このフラグを使い た
いと思うことは決してないだろうし、確実に使わないようにすべきであ
る。このフラグは近いうちになくなることだろう。
CLONE_SYSVSEM (Linux 2.5.10 以降)
CLONE_SYSVSEM がセットされると、子プロセスと呼び出し元プロセスは
一 つの System V セマフォのアンドゥ値リスト (semop(2) 参照) を共
有する。このフラグがセットされていなければ、子プロセスは独自のア
ンドゥリストを持つ (リストの初期値は空である)。
CLONE_THREAD (Linux 2.4.0-test8以降)
CLONE_THREAD が設定された場合、子プロセスは呼び出し元のプロセス
と同じスレッド・グループに置かれる。 CLONE_THREAD についての以降
の議論を読みやすくするため、「スレッド」という用語はスレッド・グ
ループの中のプロセスを参照するのに使うこととする。
スレッド・グループは、 スレッド集合で一つの PID を共有するという
POSIX スレッドの概念をサポートするために Linux 2.4 に加えられた
機能であった。内部的には、この共有 PID はいわゆるそのスレッド グ
ル ープのスレッド・グループ識別子 (TGID) である。 Linux 2.4 以降
では、 getpid(2) の呼び出しではそのプロセスのスレッド・グルー プ
ID を返す。
あ る グループに属するスレッドは (システム全体で) 一意なスレッド
ID (TID) で区別できる。新しいスレッドの TID は clone() の呼び 出
し 元 へ関数の結果として返され、スレッドは自分自身の TID を get-
tid(2) で取得できる。
CLONE_THREAD を指定せずに clone() の呼び出しが行われると、生成さ
れ たスレッドはそのスレッドの TID と同じ値の TGID を持つ新しいス
レッド・グループに置かれる。このスレッドは新しいスレッド・グルー
プの「リーダー」である。
CLONE_THREAD を指定して作成された新しいスレッドは、 (CLONE_PAR-
ENT の場合と同様に) clone() を呼び出し元と同じ親プロセスを持つ。
そのため、 getppid(2) を呼ぶと、一つのスレッド・グループに属すス
レッドは全て同じ値を返す。 CLONE_THREAD で作られたスレッドが終了
し た 際に、そのスレッドを clone(2) を使って生成したスレッドには
SIGCHLD (もしくは他の終了シグナル) は送信さ れ な い 。 ま た 、
wait(2) を使って終了したスレッドの状態を取得することもできない (
そのようなスレッドは detached (分離された) といわれる)。
スレッド・グループに属す全てのスレッドが終了した後、そのスレッド
・グループの親プロセスに SIGCHLD (もしくは他の終了シグナル) が送
られる。
スレッド・グループに属すいずれかのスレッドが execve(2) を実行 す
ると、スレッド・グループ・リーダー以外の全てのスレッドは終了され
、新しいプロセスがそのスレッド・グループ・リーダーの下で実行され
る。
ス レッド・グループに属すスレッドの一つが fork(2) を使って子プロ
セスを作成した場合、スレッド・グループのどのスレッドであってもそ
の子供を wait(2) できる。
Linux 2.5.35 以降では、 CLONE_THREAD を指定する場合、 flags に
CLONE_SIGHAND も含まれていなければならない。
kill(2) を使ってスレッド・グループ全体 (つまり TGID) にシグナ ル
を 送ることもできれば、 tgkill(2) を使って特定のスレッド (つまり
TID) にシグナルを送ることもできる。
シグナルの配送と処理はプロセス全体に影響する: ハンドラを設定して
いないシグナルがあるスレッドに配送されると、そのシグナルはスレッ
ド・グループの全メンバーに影響を及ぼす (終了したり、停止したり、
動作を継続したり、無視されたりする)。
各 々 の ス レ ッドは独自のシグナルマスクを持っており、 sigproc-
mask(2) で設定できる。だが、処理待ちのシグナルには、 kill(2) で
送信されるプロセス全体に対するもの (つまり、スレッド・グループの
どのメンバーにも配送できるもの) と、 tgkill(2) で送信される個 々
の スレッドに対するものがありえる。 sigpending(2) を呼び出すと、
プロセス全体に対する処理待ちシグナルと呼び出し元のスレッドに対す
る処理待ちシグナルを結合したシグナル集合が返される。
kill(2) を使ってスレッド・グループにシグナルが送られた場合で、そ
のスレッド・グループがそのシグナルに対するシグナル・ハンドラが登
録されていたときには、シグナル・ハンドラはスレッド・グループのメ
ンバーのうち、ただ一つのスレッドでだけ起動される。ハンドラが起動
さ れるスレッドは、そのシグナルを禁止 (block) していないメンバー
の中から一つだけが勝手に (arbitrarily) 選ばれる。スレッド・グ ル
ープに属す複数のスレッドが sigwaitinfo(2) を使って同じシグナルを
待っている場合、これらのスレッドの中から一つをカーネルが勝手に選
択し、そのスレッドが kill (2) を使って送信されたシグナルを受信す
る。
CLONE_UNTRACED (Linux 2.5.46 以降)
CLONE_UNTRACED が指定されると、 trace を行っているプロセスはこの
子プロセスに CLONE_PTRACE を適用することができない。
CLONE_VFORK
CLONE_VFORK が設定された場合、 (vfork(2) と同様に) 子プロセスが
execve(2) または _exit(2) によって仮想メモリを解放するまで、呼び
出し元のプロセスの実行は停止される。
CLONE_VFORK が設定されていない場合、 clone() 呼び出し後は、呼び
出し元のプロセスと子プロセスの両方がスケジュール対象となり、アプ
リケーションはこれらのプロセスの実行順序に依存しないようにすべき
である。
CLONE_VM
CLONE_VM が設定された場合、呼び出し元のプロセスと子プロセスは 同
じメモリ空間で実行される。特に、呼び出し元のプロセスや子プロセス
の一方がメモリに書き込んだ内容はもう一方のプロセスからも見ること
が で き る 。 さ らに、子プロセスや呼び出し元のプロセスの一方が
mmap(2) や munmap(2) を使ってメモリをマップしたりアンマップし た
場合、もう一方のプロセスにも影響が及ぶ。
CLONE_VM が設定されていない場合、子プロセスは clone() が実行され
た時点での、親プロセスのメモリ空間をコピーした別のメモリ空間で実
行される。一方のプロセスが行ったメモリへの書き込みやファイルのマ
ップ/アンマップは、 fork(2) の場合と同様、もう一方のプロセスには
影響しない。
sys_clone
sys_clone システムコールは、より fork(2) に近いかたちになっており、子プ
ロセスの実行が呼び出しが行われた場所から続け ら れ る 。 そ の た め 、
sys_clone が必要とする引き数は flags と child_stack だけであり、それら
は clone() と同じ意味を持つ (これらの引き数の順番は clone() とは異な る
ことに注意せよ)。
sys_clone のもう一つの違いは、 child_stack 引き数がゼロでも良いことであ
る。この場合には、どちらかのプロセスがスタックを変更した時に、書き込 み
時コピー (copy-on-write) 方式により子プロセスがスタック・ページの独立し
たコピーを得られることが保証される。この場合、正常に動作させるために は
、 CLONE_VM オプションを指定してはならない。
Linux 2.5.49 以降では、 sys_clone システムコールは 5つの引き数をとる。
新たに追加された 2つの引き数は、 parent_tidptr と child_tidptr である。
parent_tidptr は、 CLONE_PARENT_SETTID が指定された場合に、子プロセスの
スレッドIDが書き込まれる (親プロセスと子プロセスのメモリ内の) 場所を 指
す 。 child_tidptr は、 CLONE_CHILD_SETTID が指定された場合に、子プロセ
スのスレッドIDが書き込まれる (子プロセスのメモリ内の) 場所を指す。
返り値
成功した場合、呼び出し元の実行スレッドには子プロセスのスレッドID が返さ
れる。失敗した場合、 呼び出し元のコンテキストには -1 が返され、子プロセ
スは作成されず、 errno が適切に設定される。
エラー
EAGAIN すでに実行中のプロセスが多すぎる。
EINVAL CLONE_SIGHAND が指定されていたが、 CLONE_VM が指定されていなかっ
た。 (Linux 2.6.0-test6 以降)
EINVAL CLONE_THREAD が指定されていたが、 CLONE_SIGHAND が指定されていな
かった。 (Linux 2.5.35 以降)
EINVAL CLONE_FS と CLONE_NEWNS の両方が flags に指定された。
EINVAL CLONE_NEWIPC と CLONE_SYSVSEM の両方が flags に指定された。
EINVAL CLONE_NEWPID と CLONE_THREAD の両方が flags に指定された。
EINVAL child_stack にゼロを指定した場合に clone() が返す。
EINVAL flags に CLONE_NEWIPC が指定されたが、カーネルでオプション CON-
FIG_SYSVIPC と CONFIG_IPC_NS が有効になっていなかった。
EINVAL flags に CLONE_NEWNET が指定されたが、カーネルでオプション CON-
FIG_NET_NS が有効になっていなかった。
EINVAL flags に CLONE_NEWPID が指定されたが、カーネルでオプション CON-
FIG_PID_NS が有効になっていなかった。
EINVAL flags に CLONE_NEWUTS が指定されたが、カーネルでオプション CON-
FIG_UTS が有効になっていなかった。
ENOMEM 子プロセスのために確保すべきタスク構造体や、呼び出し元のコンテキ
ストの一部をコピーするのに必要なメモリを十分に割り当てることがで
きない。
EPERM root 以外のプロセス (CAP_SYS_ADMIN を持たな い プ ロ セ ス) が
CLONE_NEWIPC, CLONE_NEWNET, CLONE_NEWNS, CLONE_NEWPID,
CLONE_NEWUTS を指定した。
EPERM PID が 0 以外のプロセスによって CLONE_PID が指定された。
バージョン
libc5 には clone() はない。glibc2 では clone() が提供されており、このマ
ニュアルページに記載の通りである。
準拠
clone() と sys_clone コールは Linux 特有であり、移植を考慮したプログラ
ムでは使用すべきではない。
注意
カーネル 2.4.x 系列では、一般的には CLONE_THREAD フラグを指定しても新し
い スレッドの親を呼び出し元プロセスの親と同じにはしない。しかし、バージ
ョン 2.4.7〜2.4.18 のカーネルでは、 (カーネル 2.6 と 同 じ よ う に)
CLONE_THREAD フラグを指定すると、暗黙のうちに CLONE_PARENT フラグを指定
したことになる。
CLONE_DETACHED というフラグが、2.5.32 で導入されて以来しばらくの間存 在
し た。このフラグは親プロセスが子プロセス終了のシグナルを必要としないこ
とを表すものである。 2.6.2 で、 CLONE_DETATCHED を CLONE_THREAD と一 緒
に 指定する必要はなくなった。このフラグはまだ定義されているが、何の効果
もない。
i386 上では、 clone() は vsyscall 経由ではなく、直接 int $0x80 経由で呼
び出すべきである。
ia64 では、別のシステムコールが使用される:
int __clone2(int (*fn)(void *),
void *child_stack_base, size_t stack_size,
int flags, void *arg, ...
/* pid_t *pid, struct user_desc *tls, pid_t *ctid */ );
__clone2() システムコールは clone() と同じように動作するが、以下の点が
異なる: child_stack_base は子プロセスのスタックエリアの最小のアドレスを
指 し、 stack_size は child_stack_base が指し示すスタックエリアの大きさ
を示す。
バグ
NPTL スレッド・ライブラリを含んでいる GNU C ライブラリのいくつかのバ ー
ジョンには、 getpid(2) のラッパー関数が含まれており、このラッパー関数は
PID をキャッシュする。このキャッシュ処理が正しく動作するためには glibc
の clone(2) のラッパー関数での助けが必要だが、現状の実装では、ある状況
下においてキャッシュが最新とならない可能性がある。特に、 clone() の呼び
出 し直後にシグナルが子プロセスに配送された場合に、そのシグナルに対する
ハンドラ内で getpid() を呼び出すと、それまでに clone のラッパー関数が子
プロセスの PID キャッシュを更新する機会が得られていなければ、呼び出し元
プロセス ("親プロセス") の PID が返される可能性がある。 (この議論では、
子 プロセスが CLONE_THREAD を使って作成された場合のことは無視している。
子プロセスが CLONE_THREAD を作って作成された場合には、呼び出し元と子 プ
ロ セ ス は 同 じスレッド・グループに属すので、 getpid() は子プロセスと
clone() を呼び出したプロセスで同じ値を返すのが「正しい」。キャッシュ が
最 新とならない問題 (stale-cache problem) は、 flags に CLONE_VM が含ま
れている場合にも発生しない。) 本当の値を得るためには、次のようなコー ド
を使う必要があるかもしれない。
#include
pid_t mypid;
mypid = syscall(SYS_getpid);
関連項目
fork(2), futex(2), getpid(2), gettid(2), set_thread_area(2),
set_tid_address(2), tkill(2), unshare(2), wait(2), capabilities(7),
pthreads(7)
Linux 2008-11-25 CLONE(2)
CLONE(2) Linux Programmer’s Manual CLONE(2)
NAME
clone, __clone2 - create a child process
SYNOPSIS
#define _GNU_SOURCE
#include
int clone(int (*fn)(void *), void *child_stack,
int flags, void *arg, ...
/* pid_t *ptid, struct user_desc *tls, pid_t *ctid */ );
DESCRIPTION
clone() creates a new process, in a manner similar to fork(2). It is
actually a library function layered on top of the underlying clone()
system call, hereinafter referred to as sys_clone. A description of
sys_clone is given towards the end of this page.
Unlike fork(2), these calls allow the child process to share parts of
its execution context with the calling process, such as the memory
space, the table of file descriptors, and the table of signal handlers.
(Note that on this manual page, "calling process" normally corresponds
to "parent process". But see the description of CLONE_PARENT below.)
The main use of clone() is to implement threads: multiple threads of
control in a program that run concurrently in a shared memory space.
When the child process is created with clone(), it executes the func-
tion application fn(arg). (This differs from fork(2), where execution
continues in the child from the point of the fork(2) call.) The fn
argument is a pointer to a function that is called by the child process
at the beginning of its execution. The arg argument is passed to the
fn function.
When the fn(arg) function application returns, the child process termi-
nates. The integer returned by fn is the exit code for the child pro-
cess. The child process may also terminate explicitly by calling
exit(2) or after receiving a fatal signal.
The child_stack argument specifies the location of the stack used by
the child process. Since the child and calling process may share mem-
ory, it is not possible for the child process to execute in the same
stack as the calling process. The calling process must therefore set
up memory space for the child stack and pass a pointer to this space to
clone(). Stacks grow downwards on all processors that run Linux
(except the HP PA processors), so child_stack usually points to the
topmost address of the memory space set up for the child stack.
The low byte of flags contains the number of the termination signal
sent to the parent when the child dies. If this signal is specified as
anything other than SIGCHLD, then the parent process must specify the
__WALL or __WCLONE options when waiting for the child with wait(2). If
no signal is specified, then the parent process is not signaled when
the child terminates.
flags may also be bitwise-or’ed with zero or more of the following con-
stants, in order to specify what is shared between the calling process
and the child process:
CLONE_CHILD_CLEARTID (since Linux 2.5.49)
Erase child thread ID at location ctid in child memory when the
child exits, and do a wakeup on the futex at that address. The
address involved may be changed by the set_tid_address(2) system
call. This is used by threading libraries.
CLONE_CHILD_SETTID (since Linux 2.5.49)
Store child thread ID at location ctid in child memory.
CLONE_FILES
If CLONE_FILES is set, the calling process and the child process
share the same file descriptor table. Any file descriptor cre-
ated by the calling process or by the child process is also
valid in the other process. Similarly, if one of the processes
closes a file descriptor, or changes its associated flags (using
the fcntl(2) F_SETFD operation), the other process is also
affected.
If CLONE_FILES is not set, the child process inherits a copy of
all file descriptors opened in the calling process at the time
of clone(). (The duplicated file descriptors in the child refer
to the same open file descriptions (see open(2)) as the corre-
sponding file descriptors in the calling process.) Subsequent
operations that open or close file descriptors, or change file
descriptor flags, performed by either the calling process or the
child process do not affect the other process.
CLONE_FS
If CLONE_FS is set, the caller and the child process share the
same file system information. This includes the root of the
file system, the current working directory, and the umask. Any
call to chroot(2), chdir(2), or umask(2) performed by the call-
ing process or the child process also affects the other process.
If CLONE_FS is not set, the child process works on a copy of the
file system information of the calling process at the time of
the clone() call. Calls to chroot(2), chdir(2), umask(2) per-
formed later by one of the processes do not affect the other
process.
CLONE_IO (since Linux 2.6.25)
If CLONE_IO is set, then the new process shares an I/O context
with the calling process. If this flag is not set, then (as
with fork(2)) the new process has its own I/O context.
The I/O context is the I/O scope of the disk scheduler (i.e,
what the I/O scheduler uses to model scheduling of a process’s
I/O). If processes share the same I/O context, they are treated
as one by the I/O scheduler. As a consequence, they get to
share disk time. For some I/O schedulers, if two processes
share an I/O context, they will be allowed to interleave their
disk access. If several threads are doing I/O on behalf of the
same process (aio_read(3), for instance), they should employ
CLONE_IO to get better I/O performance.
If the kernel is not configured with the CONFIG_BLOCK option,
this flag is a no-op.
CLONE_NEWIPC (since Linux 2.6.19)
If CLONE_NEWIPC is set, then create the process in a new IPC
namespace. If this flag is not set, then (as with fork(2)), the
process is created in the same IPC namespace as the calling pro-
cess. This flag is intended for the implementation of contain-
ers.
An IPC namespace consists of the set of identifiers for System V
IPC objects. (These objects are created using msgctl(2), sem-
ctl(2), and shmctl(2)). Objects created in an IPC namespace are
visible to other processes that are members of that namespace,
but are not visible to processes in other IPC namespaces.
When an IPC namespace is destroyed (i.e, when the last process
that is a member of the namespace terminates), all IPC objects
in the namespace are automatically destroyed.
Use of this flag requires: a kernel configured with the CON-
FIG_SYSVIPC and CONFIG_IPC_NS options and that the process be
privileged (CAP_SYS_ADMIN). This flag can’t be specified in
conjunction with CLONE_SYSVSEM.
CLONE_NEWNET (since Linux 2.6.24)
(The implementation of this flag is not yet complete, but proba-
bly will be mostly complete by about Linux 2.6.28.)
If CLONE_NEWNET is set, then create the process in a new network
namespace. If this flag is not set, then (as with fork(2)), the
process is created in the same network namespace as the calling
process. This flag is intended for the implementation of con-
tainers.
A network namespace provides an isolated view of the networking
stack (network device interfaces, IPv4 and IPv6 protocol stacks,
IP routing tables, firewall rules, the /proc/net and
/sys/class/net directory trees, sockets, etc.). A physical net-
work device can live in exactly one network namespace. A vir-
tual network device ("veth") pair provides a pipe-like abstrac-
tion that can be used to create tunnels between network names-
paces, and can be used to create a bridge to a physical network
device in another namespace.
When a network namespace is freed (i.e., when the last process
in the namespace terminates), its physical network devices are
moved back to the initial network namespace (not to the parent
of the process).
Use of this flag requires: a kernel configured with the CON-
FIG_NET_NS option and that the process be privileged
(CAP_SYS_ADMIN).
CLONE_NEWNS (since Linux 2.4.19)
Start the child in a new mount namespace.
Every process lives in a mount namespace. The namespace of a
process is the data (the set of mounts) describing the file
hierarchy as seen by that process. After a fork(2) or clone()
where the CLONE_NEWNS flag is not set, the child lives in the
same mount namespace as the parent. The system calls mount(2)
and umount(2) change the mount namespace of the calling process,
and hence affect all processes that live in the same namespace,
but do not affect processes in a different mount namespace.
After a clone() where the CLONE_NEWNS flag is set, the cloned
child is started in a new mount namespace, initialized with a
copy of the namespace of the parent.
Only a privileged process (one having the CAP_SYS_ADMIN capabil-
ity) may specify the CLONE_NEWNS flag. It is not permitted to
specify both CLONE_NEWNS and CLONE_FS in the same clone() call.
CLONE_NEWPID (since Linux 2.6.24)
If CLONE_NEWPID is set, then create the process in a new PID
namespace. If this flag is not set, then (as with fork(2)), the
process is created in the same PID namespace as the calling pro-
cess. This flag is intended for the implementation of contain-
ers.
A PID namespace provides an isolated environment for PIDs: PIDs
in a new namespace start at 1, somewhat like a standalone sys-
tem, and calls to fork(2), vfork(2), or clone(2) will produce
processes with PIDs that are unique within the namespace.
The first process created in a new namespace (i.e., the process
created using the CLONE_NEWPID flag) has the PID 1, and is the
"init" process for the namespace. Children that are orphaned
within the namespace will be reparented to this process rather
than init(8). Unlike the traditional init process, the "init"
process of a PID namespace can terminate, and if it does, all of
the processes in the namespace are terminated.
PID namespaces form a hierarchy. When a PID new namespace is
created, the processes in that namespace are visible in the PID
namespace of the process that created the new namespace; analo-
gously, if the parent PID namespace is itself the child of
another PID namespace, then processes in the child and parent
PID namespaces will both be visible in the grandparent PID
namespace. Conversely, the processes in the "child" PID names-
pace do not see the processes in the parent namespace. The
existence of a namespace hierarchy means that each process may
now have multiple PIDs: one for each namespace in which it is
visible; each of these PIDs is unique within the corresponding
namespace. (A call to getpid(2) always returns the PID associ-
ated with the namespace in which the process lives.)
After creating the new namespace, it is useful for the child to
change its root directory and mount a new procfs instance at
/proc so that tools such as ps(1) work correctly. (If
CLONE_NEWNS is also included in flags, then it isn’t necessary
to change the root directory: a new procfs instance can be
mounted directly over /proc.)
Use of this flag requires: a kernel configured with the CON-
FIG_PID_NS option and that the process be privileged
(CAP_SYS_ADMIN). This flag can’t be specified in conjunction
with CLONE_THREAD.
CLONE_NEWUTS (since Linux 2.6.19)
If CLONE_NEWUTS is set, then create the process in a new UTS
namespace, whose identifiers are initialized by duplicating the
identifiers from the UTS namespace of the calling process. If
this flag is not set, then (as with fork(2)), the process is
created in the same UTS namespace as the calling process. This
flag is intended for the implementation of containers.
A UTS namespace is the set of identifiers returned by uname(2);
among these, the domain name and the host name can be modified
by setdomainname(2) and sethostname(2), respectively. Changes
made to these identifiers in one UTS namespace are visible to
other processes in the same namespace, but are not visible to
processes in other UTS namespaces.
Use of this flag requires: a kernel configured with the CON-
FIG_UTS_NS option and that the process be privileged
(CAP_SYS_ADMIN).
CLONE_PARENT (since Linux 2.3.12)
If CLONE_PARENT is set, then the parent of the new child (as
returned by getppid(2)) will be the same as that of the calling
process.
If CLONE_PARENT is not set, then (as with fork(2)) the child’s
parent is the calling process.
Note that it is the parent process, as returned by getppid(2),
which is signaled when the child terminates, so that if
CLONE_PARENT is set, then the parent of the calling process,
rather than the calling process itself, will be signaled.
CLONE_PARENT_SETTID (since Linux 2.5.49)
Store child thread ID at location ptid in parent and child mem-
ory. (In Linux 2.5.32-2.5.48 there was a flag CLONE_SETTID that
did this.)
CLONE_PID (obsolete)
If CLONE_PID is set, the child process is created with the same
process ID as the calling process. This is good for hacking the
system, but otherwise of not much use. Since 2.3.21 this flag
can be specified only by the system boot process (PID 0). It
disappeared in Linux 2.5.16.
CLONE_PTRACE
If CLONE_PTRACE is specified, and the calling process is being
traced, then trace the child also (see ptrace(2)).
CLONE_SETTLS (since Linux 2.5.32)
The newtls argument is the new TLS (Thread Local Storage)
descriptor. (See set_thread_area(2).)
CLONE_SIGHAND
If CLONE_SIGHAND is set, the calling process and the child pro-
cess share the same table of signal handlers. If the calling
process or child process calls sigaction(2) to change the behav-
ior associated with a signal, the behavior is changed in the
other process as well. However, the calling process and child
processes still have distinct signal masks and sets of pending
signals. So, one of them may block or unblock some signals
using sigprocmask(2) without affecting the other process.
If CLONE_SIGHAND is not set, the child process inherits a copy
of the signal handlers of the calling process at the time
clone() is called. Calls to sigaction(2) performed later by one
of the processes have no effect on the other process.
Since Linux 2.6.0-test6, flags must also include CLONE_VM if
CLONE_SIGHAND is specified
CLONE_STOPPED (since Linux 2.6.0-test2)
If CLONE_STOPPED is set, then the child is initially stopped (as
though it was sent a SIGSTOP signal), and must be resumed by
sending it a SIGCONT signal.
From Linux 2.6.25 this flag is deprecated. You probably never
wanted to use it, you certainly shouldn’t be using it, and soon
it will go away.
CLONE_SYSVSEM (since Linux 2.5.10)
If CLONE_SYSVSEM is set, then the child and the calling process
share a single list of System V semaphore undo values (see
semop(2)). If this flag is not set, then the child has a sepa-
rate undo list, which is initially empty.
CLONE_THREAD (since Linux 2.4.0-test8)
If CLONE_THREAD is set, the child is placed in the same thread
group as the calling process. To make the remainder of the dis-
cussion of CLONE_THREAD more readable, the term "thread" is used
to refer to the processes within a thread group.
Thread groups were a feature added in Linux 2.4 to support the
POSIX threads notion of a set of threads that share a single
PID. Internally, this shared PID is the so-called thread group
identifier (TGID) for the thread group. Since Linux 2.4, calls
to getpid(2) return the TGID of the caller.
The threads within a group can be distinguished by their (sys-
tem-wide) unique thread IDs (TID). A new thread’s TID is avail-
able as the function result returned to the caller of clone(),
and a thread can obtain its own TID using gettid(2).
When a call is made to clone() without specifying CLONE_THREAD,
then the resulting thread is placed in a new thread group whose
TGID is the same as the thread’s TID. This thread is the leader
of the new thread group.
A new thread created with CLONE_THREAD has the same parent pro-
cess as the caller of clone() (i.e., like CLONE_PARENT), so that
calls to getppid(2) return the same value for all of the threads
in a thread group. When a CLONE_THREAD thread terminates, the
thread that created it using clone() is not sent a SIGCHLD (or
other termination) signal; nor can the status of such a thread
be obtained using wait(2). (The thread is said to be detached.)
After all of the threads in a thread group terminate the parent
process of the thread group is sent a SIGCHLD (or other termina-
tion) signal.
If any of the threads in a thread group performs an execve(2),
then all threads other than the thread group leader are termi-
nated, and the new program is executed in the thread group
leader.
If one of the threads in a thread group creates a child using
fork(2), then any thread in the group can wait(2) for that
child.
Since Linux 2.5.35, flags must also include CLONE_SIGHAND if
CLONE_THREAD is specified.
Signals may be sent to a thread group as a whole (i.e., a TGID)
using kill(2), or to a specific thread (i.e., TID) using
tgkill(2).
Signal dispositions and actions are process-wide: if an unhan-
dled signal is delivered to a thread, then it will affect (ter-
minate, stop, continue, be ignored in) all members of the thread
group.
Each thread has its own signal mask, as set by sigprocmask(2),
but signals can be pending either: for the whole process (i.e.,
deliverable to any member of the thread group), when sent with
kill(2); or for an individual thread, when sent with tgkill(2).
A call to sigpending(2) returns a signal set that is the union
of the signals pending for the whole process and the signals
that are pending for the calling thread.
If kill(2) is used to send a signal to a thread group, and the
thread group has installed a handler for the signal, then the
handler will be invoked in exactly one, arbitrarily selected
member of the thread group that has not blocked the signal. If
multiple threads in a group are waiting to accept the same sig-
nal using sigwaitinfo(2), the kernel will arbitrarily select one
of these threads to receive a signal sent using kill(2).
CLONE_UNTRACED (since Linux 2.5.46)
If CLONE_UNTRACED is specified, then a tracing process cannot
force CLONE_PTRACE on this child process.
CLONE_VFORK
If CLONE_VFORK is set, the execution of the calling process is
suspended until the child releases its virtual memory resources
via a call to execve(2) or _exit(2) (as with vfork(2)).
If CLONE_VFORK is not set then both the calling process and the
child are schedulable after the call, and an application should
not rely on execution occurring in any particular order.
CLONE_VM
If CLONE_VM is set, the calling process and the child process
run in the same memory space. In particular, memory writes per-
formed by the calling process or by the child process are also
visible in the other process. Moreover, any memory mapping or
unmapping performed with mmap(2) or munmap(2) by the child or
calling process also affects the other process.
If CLONE_VM is not set, the child process runs in a separate
copy of the memory space of the calling process at the time of
clone(). Memory writes or file mappings/unmappings performed by
one of the processes do not affect the other, as with fork(2).
sys_clone
The sys_clone system call corresponds more closely to fork(2) in that
execution in the child continues from the point of the call. Thus,
sys_clone only requires the flags and child_stack arguments, which have
the same meaning as for clone(). (Note that the order of these argu-
ments differs from clone().)
Another difference for sys_clone is that the child_stack argument may
be zero, in which case copy-on-write semantics ensure that the child
gets separate copies of stack pages when either process modifies the
stack. In this case, for correct operation, the CLONE_VM option should
not be specified.
In Linux 2.4 and earlier, clone() does not take arguments ptid, tls,
and
RETURN VALUE
On success, the thread ID of the child process is returned in the
caller’s thread of execution. On failure, -1 is returned in the
caller’s context, no child process will be created, and errno will be
set appropriately.
ERRORS
EAGAIN Too many processes are already running.
EINVAL CLONE_SIGHAND was specified, but CLONE_VM was not. (Since Linux
2.6.0-test6.)
EINVAL CLONE_THREAD was specified, but CLONE_SIGHAND was not. (Since
Linux 2.5.35.)
EINVAL Both CLONE_FS and CLONE_NEWNS were specified in flags.
EINVAL Both CLONE_NEWIPC and CLONE_SYSVSEM were specified in flags.
EINVAL Both CLONE_NEWPID and CLONE_THREAD were specified in flags.
EINVAL Returned by clone() when a zero value is specified for
child_stack.
EINVAL CLONE_NEWIPC was specified in flags, but the kernel was not con-
figured with the CONFIG_SYSVIPC and CONFIG_IPC_NS options.
EINVAL CLONE_NEWNET was specified in flags, but the kernel was not con-
figured with the CONFIG_NET_NS option.
EINVAL CLONE_NEWPID was specified in flags, but the kernel was not con-
figured with the CONFIG_PID_NS option.
EINVAL CLONE_NEWUTS was specified in flags, but the kernel was not con-
figured with the CONFIG_UTS option.
ENOMEM Cannot allocate sufficient memory to allocate a task structure
for the child, or to copy those parts of the caller’s context
that need to be copied.
EPERM CLONE_NEWIPC, CLONE_NEWNET, CLONE_NEWNS, CLONE_NEWPID, or
CLONE_NEWUTS was specified by a non-root process (process with-
out CAP_SYS_ADMIN).
EPERM CLONE_PID was specified by a process other than process 0.
VERSIONS
There is no entry for clone() in libc5. glibc2 provides clone() as
described in this manual page.
CONFORMING TO
The clone() and sys_clone calls are Linux-specific and should not be
used in programs intended to be portable.
NOTES
In the kernel 2.4.x series, CLONE_THREAD generally does not make the
parent of the new thread the same as the parent of the calling process.
However, for kernel versions 2.4.7 to 2.4.18 the CLONE_THREAD flag
implied the CLONE_PARENT flag (as in kernel 2.6).
For a while there was CLONE_DETACHED (introduced in 2.5.32): parent
wants no child-exit signal. In 2.6.2 the need to give this together
with CLONE_THREAD disappeared. This flag is still defined, but has no
effect.
On i386, clone() should not be called through vsyscall, but directly
through int $0x80.
On ia64, a different system call is used:
int __clone2(int (*fn)(void *),
void *child_stack_base, size_t stack_size,
int flags, void *arg, ...
/* pid_t *ptid, struct user_desc *tls, pid_t *ctid */ );
The __clone2() system call operates in the same way as clone(), except
that child_stack_base points to the lowest address of the child’s stack
area, and stack_size specifies the size of the stack pointed to by
child_stack_base.
BUGS
Versions of the GNU C library that include the NPTL threading library
contain a wrapper function for getpid(2) that performs caching of PIDs.
This caching relies on support in the glibc wrapper for clone(), but as
currently implemented, the cache may not be up to date in some circum-
stances. In particular, if a signal is delivered to the child immedi-
ately after the clone() call, then a call to getpid() in a handler for
the signal may return the PID of the calling process ("the parent"), if
the clone wrapper has not yet had a chance to update the PID cache in
the child. (This discussion ignores the case where the child was cre-
ated using CLONE_THREAD, when getpid() should return the same value in
the child and in the process that called clone(), since the caller and
the child are in the same thread group. The stale-cache problem also
does not occur if the flags argument includes CLONE_VM.) To get the
truth, it may be necessary to use code such as the following:
#include
pid_t mypid;
mypid = syscall(SYS_getpid);
SEE ALSO
fork(2), futex(2), getpid(2), gettid(2), set_thread_area(2),
set_tid_address(2), tkill(2), unshare(2), wait(2), capabilities(7),
pthreads(7)
COLOPHON
This page is part of release 3.22 of the Linux man-pages project. A
description of the project, and information about reporting bugs, can
be found at http://www.kernel.org/doc/man-pages/.
Linux 2009-07-18 CLONE(2)