まくまくLinux/Shellノート
Linuxコマンド: ファイルやディレクトリを検索する (find, grep)
2022-05-08

find と grep の基本

指定した拡張子のファイルを検索する (find)

次のようにすると、カレントディレクトリ (.) を起点にして、拡張子 .txt を持つファイルを検索して一覧表示することができます。

$ find . -name '*.txt'

ファイル内の文字列を検索する (grep)

次のようにすると、指定したテキストファイル内の文字列を検索することができます。

$ grep '検索文字列' hello.txt

find で見つけたファイルの中身を grep 検索する

find で検索した結果のファイルそれぞれに対して、grep コマンドを実行するには、xargs を組み合わせて使用します。

例: 拡張子に txt を持つファイルを grep

$ find . -type f -name '*.txt' | xargs grep '検索文字列'

拡張子などを絞り込まず、単純にそのディレクトリ以下のすべてのテキストファイルを検索するだけでよいのであれば、find を使わず、grep の再帰オプション (-r) を使った方が簡単です。 念のため、テキストファイルのみを grep 対象にするために -I オプション (--binary-files-without-match) も一緒に指定しておきます。

例: すべてのテキストファイルを grep

$ grep -r -I '検索文字列' .

grep で NOT、AND、OR 検索する

NOT 検索

grep-v オプションを指定すると、指定した 文字列を含まない 行だけを抽出できます。

例: TODO という文字列を含まない行を検索する

$ grep -v 'TODO' file.txt

AND 検索

grep で AND 検索したいときは、grep の検索結果をパイプで繋いでさらに grep 検索してしまうのが簡単です。

例: すべての .txt ファイルから AAA と BBB の両方を含む行を検索する

$ find . -name '*.txt' | xargs grep AAA | grep BBB

例: すべての .html ファイルから http: を含む行(ただし http://localhost ではない)を検索する

$ find . -name '*.html' | xargs grep 'http:' | grep -v 'http://localhost'

OR 検索

grep で OR 検索したいときは、検索した文字列を -e オプションで複数回指定します。

例: AAA あるいは BBB を含む行を検索する

$ grep -e AAA -e BBB file.txt

別の方法として、正規表現(-E オプション)を使用して OR 検索する方法もあります。

$ grep -E 'AAA|BBB' file.txt
$ egrep 'AAA|BBB' file.txt

find のオプションいろいろ

ファイル名で OR 検索する

find でファイル名の OR 検索をするときは、-o オプションで -name などの検索オプションを繋ぎます。

例: .py ファイルと .rb ファイルを検索する

$ find . -name '*.py' -o -name '*.rb'

ファイル名の大文字と小文字を区別しない (-iname)

-name オプションの代わりに -iname オプションを使用すると、ファイル名の大文字と小文字を区別せずにファイル検索することができます。

例: カレントディレクトリ以下の foo.txt や FOO.TXT や Foo.Txt などを検索

$ find . -iname foo.txt

特定のディレクトリを検索対象外にする (-not -path)

-not -path あるいは ! -path で検索対象外にするパスのパターンを指定できます。

例: node_modules ディレクトリを検索対象外にする

$ find . -name '*.md' -not -path '*/node_modules/*'
$ find . -name '*.md' ! -path '*/node_modules/*'

空のファイル/ディレクトリを検索する (-empty)

$ find . -type f -empty  # サイズが 0 のファイルを検索する
$ find . -type d -empty  # 空っぽのディレクトリを検索する
2022-05-08