안녕하세요! 📊 복잡한 데이터를 다루다 보면, 단순히 숫자를 나열하는 것만으로는 데이터의 숨겨진 패턴이나 경향성을 파악하기 어려울 때가 많습니다. 특히 특정 범위 내에 데이터가 얼마나 많이 분포되어 있는지 알고 싶을 때가 있는데요. 이때 엑셀의 FREQUENCY
함수가 그야말로 ‘빛과 소금’ 같은 역할을 해줍니다! ✨
오늘은 FREQUENCY
함수가 무엇인지, 어떻게 사용하는지, 그리고 실생활 예시를 통해 데이터 분포를 명확하게 분석하는 방법을 자세히 알아보겠습니다.
📈 FREQUENCY 함수란 무엇인가요?
FREQUENCY
함수는 특정 구간(Bin)에 해당하는 값들의 빈도수(개수)를 계산하여 배열 형태로 반환하는 엑셀의 통계 함수입니다. 즉, 데이터 셋에서 값이 특정 범위(구간) 안에 몇 개 포함되는지를 세어주는 것이죠.
예를 들어, 학생들의 시험 점수 데이터를 가지고 있을 때 60점대는 몇 명인지, 70점대는 몇 명인지, 80점대는 몇 명인지 등 점수 구간별로 학생 수를 파악하고 싶을 때 유용하게 사용할 수 있습니다.
핵심: FREQUENCY
함수는 배열 수식으로 입력해야 한다는 점을 기억해 주세요! (Ctrl + Shift + Enter)
💡 FREQUENCY 함수 문법
FREQUENCY
함수의 문법은 다음과 같습니다:
=FREQUENCY(데이터_배열, 구간_배열)
데이터_배열
(Data_array): 빈도를 계산할 대상이 되는 숫자 데이터 집합입니다. (예: 학생들의 시험 점수 목록)구간_배열
(Bins_array): 각 구간의 상한 값을 지정하는 숫자 배열입니다.FREQUENCY
함수는 이 구간_배열을 기준으로 데이터를 분류합니다.- 중요:
구간_배열
에 지정된 값은 각 구간의 “포함되는 상한선”을 의미합니다. 예를 들어,구간_배열
에[60, 70, 80]
이 있다면,- 첫 번째 구간:
60 이하
- 두 번째 구간:
60 초과 ~ 70 이하
- 세 번째 구간:
70 초과 ~ 80 이하
- 네 번째 구간:
80 초과
(구간_배열의 마지막 값보다 큰 모든 값) 로 분류됩니다.
- 첫 번째 구간:
- 중요:
📝 FREQUENCY 함수 단계별 사용법
FREQUENCY
함수는 배열 수식이므로 일반 함수와는 입력 방식이 조금 다릅니다. 다음 단계를 따라해 보세요!
- 데이터 준비: 빈도를 분석할 원본 데이터(숫자)를 준비합니다.
- 구간(Bins) 준비: 데이터를 분류할 구간의 상한 값들을 별도의 셀 범위에 입력합니다. 이 범위가
구간_배열
이 됩니다. - 결과가 표시될 범위 선택:
FREQUENCY
함수는 배열을 반환하므로, 결과를 표시할 셀 범위를 미리 선택해야 합니다. 선택할 셀의 개수는구간_배열
의 셀 개수보다 하나 더 많아야 합니다. (구간_배열
의 마지막 값보다 큰 값을 위한 추가 공간) - 함수 입력: 선택된 범위의 첫 번째 셀에
FREQUENCY
함수를 입력합니다.- 예:
=FREQUENCY(데이터_범위, 구간_범위)
- 예:
- 배열 수식 확정: 함수 입력을 마쳤다면, 일반적인
Enter
키 대신Ctrl
+Shift
+Enter
키를 동시에 누릅니다. 그러면 수식 양쪽에 중괄호{}
가 자동으로 붙는 것을 볼 수 있습니다. (예:{=FREQUENCY(A1:A10, B1:B3)}
) - 결과 해석: 각 구간에 해당하는 데이터의 빈도수가 선택한 범위에 순서대로 표시됩니다.
🎓 예시 1: 시험 점수 분포 분석
학생들의 시험 점수 데이터가 있다고 가정해 봅시다. 📝 이 점수들을 구간별로 나눠서 각 점수대에 몇 명의 학생이 있는지 알아보고 싶습니다.
학생 | 점수 |
---|---|
A | 85 |
B | 72 |
C | 90 |
D | 68 |
E | 75 |
F | 92 |
G | 88 |
H | 60 |
I | 70 |
J | 80 |
K | 95 |
L | 55 |
M | 78 |
N | 82 |
O | 65 |
목표: 60점 이하, 61~70점, 71~80점, 81~90점, 91점 이상 구간별 학생 수 파악
- 데이터 준비: 위 점수 데이터를
B2:B16
범위에 입력합니다. - 구간(Bins) 준비: 각 구간의 상한 값을 별도의 셀에 입력합니다.
D2
: 60 (60점 이하)D3
: 70 (70점 이하)D4
: 80 (80점 이하)D5
: 90 (90점 이하)D6
: 100 (100점 이하)- (실제로는 90점 초과부터는 마지막 구간으로 자동 포함되므로 100은 필수는 아니지만, 명확성을 위해 포함했습니다.)
- 결과가 표시될 범위 선택: 구간이 5개이므로, 결과를 표시할 셀 6개 (예:
E2:E7
)를 선택합니다.E2
: ~60점E3
: 61~70점E4
: 71~80점E5
: 81~90점E6
: 91~100점E7
: 100점 초과 (구간_배열의 마지막 값보다 큰 값)
- 함수 입력 및 배열 수식 확정:
E2:E7
범위를 모두 선택한 상태에서 수식 입력줄에 다음을 입력합니다.=FREQUENCY(B2:B16, D2:D6)
그리고
Ctrl
+Shift
+Enter
키를 누릅니다. -
결과 해석: 구간 빈도수 ~60 2 61~70 4 71~80 4 81~90 3 91~100 2 100 초과 0 이 결과를 통해 시험 점수의 분포를 한눈에 파악할 수 있습니다. 61~80점대 학생이 가장 많고, 60점 이하 및 91점 이상 학생은 비교적 적다는 것을 알 수 있죠. 이 데이터를 바탕으로 히스토그램 차트를 만들면 더욱 시각적으로 명확한 분석이 가능합니다! 📈
👥 예시 2: 고객 연령대별 분포 분석
쇼핑몰 고객들의 연령대별 분포를 알아보고 싶다고 가정해 봅시다.
고객 ID | 연령 |
---|---|
C001 | 25 |
C002 | 32 |
C003 | 18 |
C004 | 45 |
C005 | 29 |
C006 | 50 |
C007 | 38 |
C008 | 62 |
C009 | 22 |
C010 | 35 |
목표: 10대, 20대, 30대, 40대, 50대, 60대 이상 고객 수 파악
- 데이터 준비: 위 연령 데이터를
B2:B11
범위에 입력합니다. - 구간(Bins) 준비: 각 연령대의 상한 값을 입력합니다.
D2
: 19 (19세 이하)D3
: 29 (20~29세)D4
: 39 (30~39세)D5
: 49 (40~49세)D6
: 59 (50~59세)D7
: 69 (60~69세)
- 결과가 표시될 범위 선택: 구간이 6개이므로, 결과를 표시할 셀 7개 (예:
E2:E8
)를 선택합니다. - 함수 입력 및 배열 수식 확정:
E2:E8
범위를 모두 선택한 상태에서 수식 입력줄에 다음을 입력합니다.=FREQUENCY(B2:B11, D2:D7)
그리고
Ctrl
+Shift
+Enter
키를 누릅니다. -
결과 해석: 연령대 빈도수 ~19세 1 20~29세 3 30~39세 3 40~49세 1 50~59세 1 60~69세 1 70세 이상 0 이 결과를 통해 20대와 30대 고객이 가장 많다는 것을 알 수 있습니다. 이는 마케팅 전략을 수립하는 데 중요한 정보가 될 수 있습니다. 🎯
⚠️ 주의사항 및 꿀팁!
- 배열 수식: 가장 중요합니다!
Ctrl
+Shift
+Enter
를 잊지 마세요. 만약 이 키 조합을 사용하지 않고Enter
만 누르면 첫 번째 셀에만 결과가 나타나거나 오류가 발생할 수 있습니다. - 구간_배열의 의미:
구간_배열
의 각 값은 해당 구간의 최대값을 의미합니다. 그 값을 포함하여 그 이하의 값들이 해당 구간에 속하게 됩니다. - 마지막 구간:
FREQUENCY
함수는구간_배열
의 마지막 값보다 큰 모든 값을 담는 추가적인 빈도수 셀을 항상 반환합니다. 따라서 결과 셀 범위는구간_배열
셀 개수보다 하나 더 많아야 합니다. - 빈 셀 및 텍스트 값:
데이터_배열
내의 빈 셀이나 텍스트 값은 계산에서 무시됩니다. - 결과 배열의 크기:
FREQUENCY
함수는구간_배열
의 항목 수보다 하나 더 많은 배열을 반환합니다. 이 점을 고려하여 결과가 표시될 셀 범위를 정확히 선택해야 합니다. - 다른 대안: 단순 빈도수 계산이라면
COUNTIF
또는COUNTIFS
함수를 여러 번 사용하여 구현할 수도 있지만,FREQUENCY
함수는 한 번의 작업으로 배열 전체의 빈도를 계산해주므로 훨씬 효율적입니다. 대규모 데이터나 다양한 범위를 분석할 때는 피벗 테이블도 강력한 대안이 될 수 있습니다. 💡
✅ 결론
FREQUENCY
함수는 엑셀에서 데이터의 분포를 분석하고 시각화하는 데 매우 강력하고 효율적인 도구입니다. 단순히 숫자를 세는 것을 넘어, 데이터가 어떤 범위에 집중되어 있는지, 혹은 어떤 범위에 부족한지 등의 패턴을 파악하는 데 큰 도움을 줍니다.
처음에는 배열 수식 입력 방식이 조금 낯설게 느껴질 수 있지만, 몇 번 연습하다 보면 금방 익숙해질 것입니다. 오늘 배운 내용을 바탕으로 여러분의 데이터를 더욱 심층적으로 분석해 보세요! 🚀 D