Programming/Shell

쉘 특정 컬럼 더하기

쌍쌍바나나 2017. 11. 6. 21:13
반응형

쉘(shell)에서 특정 컬럼 더하기

데이터 분석을 하다 보면 특정 컬럼의 값을 더할 때가 있다.
예를 들어서 positive/negative의 비율(ratio)을 확인할 때,
label의 값이 0 또는 1의 값이면, 1의 값을 모두 더하면 positive의 개수를 알 수 있다.
전체 positive의 개수를 확인하고, 파일의 line수를 계산하면 쉽게 알 수 있다.

shell $ cat data | wc -l

데이터

1 2 3 4 5 6 7 8 9

명령어

shell $ cat data | awk '{sum+=$2 ; print $0} END{print "sum=",sum}'

출력 결과

1 2 3 4 5 6 7 8 9 sum= 15

반응형