wc -cオプションの使い方を完全ガイド!初心者でもわかるLinuxでバイト数を数える方法
生徒
「Linuxでファイルの大きさを知りたいんですが、どうやって調べればいいんですか?」
先生
「そんなときはwcコマンドの-cオプションを使うと、バイト数を簡単に数えられますよ。」
生徒
「バイト数って、ファイルのサイズみたいなものですか?」
先生
「その通りです。難しく考えなくて大丈夫なので、順番に見ていきましょう。」
1. wcコマンドとは?
wcコマンドは、Linuxで文字数・行数・バイト数などを数えるための基本的なコマンドです。名前は「word count(ワードカウント)」の略で、文章やファイルの量を調べたいときによく使われます。
パソコンを触ったことがない人でも、「このファイルはどれくらいの情報量があるのか」を数字で確認できる便利な道具だと考えてください。
2. -cオプションでできること
-cオプションは、バイト数を数えるための指定です。バイトとは、パソコンが文字やデータを保存するときの最小単位のようなものです。
たとえば、ノートに文字を書いていくとページ数が増えていくように、ファイルも中身が増えるほどバイト数が大きくなります。wc -cは、その「ページ数」を数えてくれるイメージです。
3. 基本的な使い方(ファイルのバイト数を数える)
まずは、一番シンプルな使い方を見てみましょう。次の例では、sample.txtというファイルのバイト数を調べています。
wc -c sample.txt
128 sample.txt
数字の「128」がバイト数です。つまり、このファイルは128バイト分の大きさがあるという意味になります。
4. 文字を直接入力してバイト数を数える
ファイルがなくても、文字を直接入力してバイト数を調べることもできます。これにはパイプ(|)という仕組みを使います。
echo hello | wc -c
6
「hello」は5文字ですが、最後に改行が入るため、結果は6バイトになります。改行もデータとして数えられる点がポイントです。
5. 日本語と英語でバイト数が違う理由
実は、日本語と英語では1文字あたりのバイト数が違います。英語のアルファベットは1文字1バイトですが、日本語は複数バイトになることが多いです。
echo あ | wc -c
4
「あ」は1文字ですが、結果は4バイトになります。これは日本語がパソコン内部で特別な形で保存されているためです。
6. wc -cとwc -mの違い
wcには似たオプションとして-mがあります。-mは文字数を数えるオプションです。
日本語を扱う場合、「文字の数」を知りたいなら-m、「データ量」を知りたいなら-cを使う、と覚えると混乱しません。
7. 複数ファイルのバイト数をまとめて確認する
複数のファイルを同時に指定すると、それぞれのバイト数を一気に確認できます。
wc -c file1.txt file2.txt
64 file1.txt
256 file2.txt
320 total
最後の「total」は合計のバイト数です。たくさんのファイルを管理するときに便利です。
8. バイト数を調べる場面の具体例
wc -cは、ログファイルの大きさ確認、メール本文のサイズ確認、アップロード制限のチェックなど、さまざまな場面で使われます。
「ファイルが重すぎないか」「送信できるサイズか」を数字で確認できるため、トラブル防止にも役立ちます。