uniqコマンドについて詳しくまとめました【Linuxコマンド集】

uniqはファイルから重複する行を削除するコマンドだ。

uniqはカタカナではユニークで、「唯一の」「１つしかない」という意味だ。

コンピュータの世界では「ユニークなデータ」は「重複していないデータ」を意味する。

1 uniqコマンドの基本
- 1.1 コマンドの基本動作
2 uniqコマンドのオプションたち
3 uniq関連コマンド
- 3.1 sortコマンド
- 3.2 cutコマンド

uniqコマンドの基本

コマンドの基本動作

uniqコマンドで処理するファイルは、あらかじめ並べ替えされていなければならないので、sortコマンドなどで並べ替えをしておこう。

使い方は、次のとおりだ。

$ uniq 元ファイル名

ファイルs.datから重複行を削除する場合は、次のコマンドだ。

$ uniq s1.dat

ファイルs1.datから重複行が削除された内容が表示された。

出力ファイル名を指定して、結果を別ファイルに書き出すことも可能だ。

$ uniq 元ファイル名出力先ファイル名

ファイルs.datから重複行を削除した結果をファイルs2.datに出力する場合は、次のコマンドだ。

$ uniq s1.txt s2.dat

ファイルs1.datから重複行が削除されたファイルがs2.datに記録され、その内容が表示された。

uniqコマンドのオプションたち

オプションの一覧

後から詳細をご紹介するが、まずは一覧で見てみよう。

オプション -c（オプション--count）

重複した行数も表示する。

オプション -d（オプション--repeated）

重複した行を表示する。

オプション -D（オプション--all-repeated）

重複した行をすべて表示する。

オプション -u（オプション--unique）

重複した行は一切表示しない。

オプション -f（オプション--skip-fields=N）

指定した項目以降で重複を判断する。

オプション -w（オプション--check-chars=N）

指定した文字数までで重複を判断する。

では一つずつ見ていこう。

-cオプション：（--countオプション）：重複した行数も表示する

重複行を削除し、重複した行数も表示する書式は次のとおりだ。

$ uniq -c 元ファイル名

ファイルs1.datの重複行を削除し、重複した行数も表示する場合は、次のコマンドだ。

$ uniq -c s1.dat

ファイルs1.datの重複行が削除され、重複した行数が表示された。

-dオプション（--repeatedオプション）：重複した行を表示する

重複した行のみを表示するオプションで書式は次の通りだ。

$ uniq -d 元ファイル名

ファイルs1.datの重複した行のみを表示する場合は、次のコマンドだ。

$ uniq -d s1.dat

ファイルs1.datの重複した行のみが表示された。

-Dオプション（--all-repeatedオプション）：重複した行をすべて表示する

重複した行を1行だけではなく、すべての行を表示するオプションで、書式は次の通りだ。

$ uniq -D 元ファイル名

ファイルs1.datの重複した行をすべて表示する場合は、次のコマンドだ。

$ uniq -D s1.dat

ファイルs1.datの重複した行をすべてが表示された。

-uオプション（--uniqueオプション）：重複した行は一切表示しない

重複した行は表示せず、重複しなかった行のみを表示するオプションで書式は次の通りだ。

$ uniq -u 元ファイル名

ファイルs1.txtの重複しなかった行のみを表示する場合は、次のコマンドだ。

ファイルs1.txtの重複しなかった行のみを表示した。

-fオプション（--skip-fields=Nオプション）：指定した項目以降で重複を判断する

行全体ではなく、スペースやタブ文字で区切られた項目で重複を判断する。

書式は次の通りだ。

$ uniq -f 項目の位置元ファイル名

１項目めは番号、２項目めは商品名、３項目めは単価、４項目めに売上個数が入力されているテキストファイルがある。

項目の位置は１少ない数字となり、１項目めなら0、３項目めなら２だ。

ファイルn1.txtの３項目め以降が重複していたら、重複行を削除するコマンドは次の通りだ。

$ uniq -f 2 n1.txt

ファイルn1.txtの３項目め以降が２行目と重複している３行目が削除された。

-wオプション（--check-chars=Nオプション）：指定した文字数までで重複を判断する

-fオプションと併用して使うのが一般的だが、指定した文字数までで重複を判断する。

書式は次の通りだ。

$ uniq -f 項目の位置 -w 文字数元ファイル名

文字数は指定したい文字数よりも１多い数字となる。

ファイルn1.txtの３項目めの１文字が重複していたら、重複行を削除するコマンドは次の通りだ。

$ uniq -f 2 -w 2 n1.txt

ファイルn1.txtの３項目めの１文字以降が１という文字で２行目と重複している３行め、４行めを削除した。

uniq関連コマンド

最後にuniqコマンドに関連して、基本的なテキスト処理のコマンドも紹介しておく。

sortコマンド

テキストファイルを並べ替えする。

cutコマンド

文字列を分離する。

まとめ

このページでは、uniqコマンドを使ったテキストファイルから重複行を削除のする方法を解説した。

ログやデータベースのデータを整理する時に活用できる。

簡単なコマンドなので覚えて活用しよう。

uniqコマンドについて詳しくまとめました【Linuxコマンド集】

uniqコマンドの基本

コマンドの基本動作

uniqコマンドのオプションたち

オプションの一覧

オプション -c（オプション--count）

オプション -d（オプション--repeated）

オプション -D（オプション--all-repeated）

オプション -u（オプション--unique）

オプション -f（オプション--skip-fields=N）

オプション -w（オプション--check-chars=N）

-cオプション：（--countオプション）：重複した行数も表示する

-dオプション（--repeatedオプション）：重複した行を表示する

-Dオプション（--all-repeatedオプション）：重複した行をすべて表示する

-uオプション（--uniqueオプション）：重複した行は一切表示しない

-fオプション（--skip-fields=Nオプション）：指定した項目以降で重複を判断する

-wオプション（--check-chars=Nオプション）：指定した文字数までで重複を判断する

uniq関連コマンド

sortコマンド

cutコマンド

まとめ

IT講師に興味はありませんか？

コメント

コメントを残すコメントをキャンセル

リスキルテクノロジー

RANKING

最近の投稿

各種ページ

リンク情報

未経験からの育成制度も充実
IT講師に興味はありませんか？

uniqコマンドの基本

コマンドの基本動作

uniqコマンドのオプションたち

オプションの一覧

オプション -c（オプション--count）

オプション -d（オプション--repeated）

オプション -D（オプション--all-repeated）

オプション -u（オプション--unique）

オプション -f（オプション--skip-fields=N）

オプション -w（オプション--check-chars=N）

-cオプション：（--countオプション）：重複した行数も表示する

-dオプション（--repeatedオプション）：重複した行を表示する

-Dオプション（--all-repeatedオプション）：重複した行をすべて表示する

-uオプション（--uniqueオプション）：重複した行は一切表示しない

-fオプション（--skip-fields=Nオプション）：指定した項目以降で重複を判断する

-wオプション（--check-chars=Nオプション）：指定した文字数までで重複を判断する

uniq関連コマンド

sortコマンド

cutコマンド

まとめ

IT講師に興味はありませんか？

SNSでもご購読できます。

コメント

コメントを残す コメントをキャンセル

リスキルテクノロジー

RANKING

最近の投稿

各種ページ

リンク情報

未経験からの育成制度も充実IT講師に興味はありませんか？

コメントを残すコメントをキャンセル

未経験からの育成制度も充実
IT講師に興味はありませんか？