wc -wオプションの使い方を完全ガイド!初心者でもわかるLinuxで単語数を数える方法
生徒
「Linuxで文章の単語数を調べたいんですが、そんなことってできますか?」
先生
「できますよ。wcコマンドの-wオプションを使うと、単語の数を数えられます。」
生徒
「単語って、英語みたいなスペース区切りのことですか?」
先生
「その通りです。では、パソコンを触ったことがない人でもわかるように、最初から説明しますね。」
1. wcコマンドとは?
wcコマンドは、Linuxで文字数・単語数・行数を数えるための基本コマンドです。wcは「word count(ワードカウント)」の略で、日本語にすると「数を数える」という意味になります。
黒い画面(ターミナル)に文字を入力して使うのが特徴で、ファイルの中身を調べたいときによく使われます。レポート作成、ログ確認、文章量のチェックなど、さまざまな場面で役立ちます。
2. wc -wオプションの役割
-wオプションは、単語数だけを数えるための指定です。単語とは、基本的に「スペース(空白)で区切られた文字のかたまり」を指します。
たとえば英語の文章では、「I」「love」「Linux」のように、空白ごとに1単語として数えられます。日本語の場合は少し注意が必要ですが、その点は後ほど説明します。
3. wc -wの基本的な使い方
まずは、一番シンプルな使い方を見てみましょう。次の例では、sample.txtというファイルの単語数を数えています。
wc -w sample.txt
15 sample.txt
結果の「15」は単語の数を表しています。その後ろに表示されているのが、対象となったファイル名です。とてもシンプルで覚えやすいですね。
4. 標準入力とwc -w
wc -wは、ファイルだけでなく、コマンドの結果をそのまま数えることもできます。これを標準入力と呼びます。難しそうに聞こえますが、「結果をそのまま渡す」くらいの理解で大丈夫です。
echo "I love Linux command line" | wc -w
5
この例では、文章を直接渡して単語数を数えています。ちょっとした文章量チェックに便利な使い方です。
5. 日本語ファイルでの注意点
日本語の文章は、英語のようにスペースで区切られていないことが多いため、wc -wでは思った通りの単語数にならない場合があります。
wc -w japanese.txt
1 japanese.txt
このように、文章全体が1単語として数えられることもあります。日本語の文字数を知りたい場合は、-mオプション(文字数)を使う方が向いています。
6. 他のwcオプションとの違い
wcコマンドには、他にもよく使われるオプションがあります。
- -l:行数を数える
- -w:単語数を数える
- -c:バイト数を数える
wc -lwc sample.txt
3 15 120 sample.txt
このように組み合わせて使うことで、1回のコマンドで複数の情報を確認できます。
7. wc -wが役立つ場面
wc -wは、英語の文章量チェック、技術ドキュメントの確認、ログ内の単語数調査などで活躍します。特に英語中心の環境では、単語数が重要な指標になることも多いです。
黒い画面に慣れていない人でも、決まった形で入力するだけなので、安心して使えます。
8. 初心者がつまずきやすいポイント
よくある間違いとして、「文字数と単語数を混同してしまう」ことがあります。-wはあくまで単語数専用です。日本語の文字数を知りたいときは、目的に合ったオプションを選ぶことが大切です。
最初は結果の意味を一つずつ確認しながら使っていくと、自然と理解できるようになります。