Text Processing

알찬돌삐 2012. 8. 10. 16:12

 * sort
o sort 명령은 알파벳순으로 정렬을 시켜 출력한다.
o 기본적으로 숫자는 정렬되지 않는다. 숫자로 정렬하려면 다른 옵션을 사용해야 한다.
o sort 명령은 다음과 같은 옵션을 갖는다.
+ -d : Sorts in phone-directory order
+ -f : Sorts lowercase letters in the same manners as uppercase letters
+ -i : Ignotes any characters outside the ASCII range
+ -n : Sorts in numerical order instead of alphabetical
+ -r : Reverses the order of the output

* wc
o wc는 "word count"로 파일의 라인수, 워드수, 문자수를 출력한다

wc fileone
14 14 58 fileone

+ -c : Shows only the number of bytes or characters
+ -l : Shows only the number of lines
+ -w : Shows only the number of words

wc -w fileone
14 fileone

* fmt
o 지정된 너비로 출력 결과를 조정한다. 디폴트 width는 75 characters이다. -w 옵션을 통해 너비를 조정할 수 있다.

fmt fileone
seoul 1111 incheon 2222 pusan 3333 taegu 4444 daejeon 5555

fmt -w10 fileone

* 기본 옵션은 -w이다. 따라서 fmt -w10옵션과 fmt -10은 같은 결과를 보인다.

* tr
o tr(translate)는 문자셋을 다른 것으로 변경할 수 있다. 예를 들어 모든 소문자를 대문자로 바꾸려면

tr '[a-z]' [A-Z]' < filetwo
2222 LA
33333 BOSTON
4444 SAN

cf) tr은 반드시 두개의 charcter sets만을 받아들이며 파일명은 사용하지 않는다. 따라서 반듣시 파일의 이름은 리다이렉트 입력기호를 사용하거나 파이프를 사용해야 한다.

o lower : All lowercase
o uppper : All uppercase characters
o print : All printable characters
o punct : Punctuation characters
o space : All white space
o alnum : Alpha characters and numbers
o digit : Numbers only
o cntrl : characters control
o alpha : Letters only
o graph : Printable characters but not white space

예를 들어 위에서 사용한 명령은 다음과 같이 내릴 수도 있다.

tr '[:lower:]' [:upper:]' < filetwo

Associated Utilities

* expand - Allows you to expand tab characters into spaces. The default number of spaces per tab is eight. but you can change that using the -t option
* file - Looks at an entry's signature and reports what type of file it is
* more - Display only one screen of output at a time
* split - Chops a single file into multiple files. The default is that a new file is created for every 1,000 lines of the original file. Using the -b option, you can avoid the 1,000 line splitting and specity a number of bytes to be put into each output file, or you use -l to specify a number of lines
* uniq - Examines entries in a file, comparing the current line with the one directly preceding it, to fild lines ar unique.
* vi - One of the greatest file editors.

이 글은 스프링노트에서 작성되었습니다.


'Computer > LINUX' 카테고리의 다른 글

vi tip  (0) 2012.08.10
UCC 를 위한 ffmpeg 설치  (0) 2012.08.10
Text Processing  (0) 2012.08.10
SSH키를 이용한 RSYNC 백업법  (0) 2012.08.10
ssh 접속 공격 막기  (0) 2012.08.10
snort  (0) 2012.08.10