[프로그래머스] 동물 수 구하기, 중복 제거하기
프로그래머스의 SQL Kit에 있는 SUM, MAX, MIN 문제들 중
- 동물 수 구하기
- 중복 제거하기
문제입니다.
- 등장하는 개념
- COUNT 활용하기
- DISTINCT 활용하기
1. 동물 수 구하기
ANIMAL_INS 테이블에 동물들의 정보가 담겨 있습니다. 각 테이블에는 다음과 같은 column들이 있습니다.
NAME | TYPE | NULLABLE |
---|---|---|
ANIMAL_ID | VARCHAR(N) | FALSE |
ANIMAL_TYPE | VARCHAR(N) | FALSE |
DATETIME | DATETIME | FALSE |
INTAKE_CONDITION | VARCHAR(N) | FALSE |
NAME | VARCHAR(N) | TRUE |
SEX_UPON_INTAKE | VARCHAR(N) | FALSE |
이 데이터들 중에서 가장 먼저 들어온 동물의 이름을 조회해야 합니다.
- 조회 : SELECT 를 활용합니다.
- 수량 세기 : COUNT 를 활용합니다.
동물이 몇 마리 들어왔는지 조회하기 위해, ANIMAL_ID 값을 기준으로 카운트를 해 보겠습니다.
- COUNT 는 SQL 문법에 존재하는 집계함수입니다.
- 함수 내에 들어간 컬럼에 존재하는 데이터의 갯수를 출력합니다.
1
2
SELECT COUNT(ANIMAL ID)
FROM ANIMAL_INS
2. 중복 제거하기
위 테이블 데이터를 토대로, 동물 보호소에 들어온 동물의 이름이 몇 개인지 조회하는 SQL문을 작성해야 합니다.
- 단, 동물의 이름이 중복되는 경우 하나로 칩니다.
- 동물의 이름이 NULL인 경우는 집계하지 않습니다.
동물의 이름 갯수를 조회하는 것이므로, NAME에 COUNT 함수를 적용할 것입니다.
- 컬럼 내 같은 데이터가 존재하면, 중복을 제거하기 위해 DISTINCT를 사용합니다.
- 중복 데이터를 제거하고자 하는 열은 NAME 이므로, 옆에 DISTINCT 키워드를 붙입니다.
- NULL 값이 아닌 것을 비교하는 방법은 IS NOT NULL 을 붙입니다.
1
2
3
SELECT COUNT(DISTINCT NAME)
FROM ANIMAL_INS
WHERE NAME IS NOT NULL
[DISTINCT 사용 시 주의할 점]
DISTINCT 키워드는 옆에 온 모든 컬럼을 고려하여 중복 제거를 진행합니다.
즉, SELECT DISTINCT COL1, COL2 …를 진행할 경우
- COL1과 COL2 값이 모두 동일한 row들을 1개로 칩니다.
다시 말하면, DISTINCT 는 SELECT 구문에 여러 컬럼명이 올 때, 그 중 한 개에 대해서만 적용할 수 없다는 말이 됩니다.
SELECT (DISTINCT COL1), COL2 FROM …는 오류입니다.
COL1 의 중복된 데이터를 제거한 뒤 COL2를 가져와야 할 텐데, 이 중 어떤 COL2 값을 가져와야 하는지 알 수 없기 때문입니다.
COL1 COL2 A 1 A 2 B 3 C 4 위에서 COL1에 대해서만 DISTINCT를 한다고 예를 들어 보겠습니다.
A는 중복이 제거되어 A 하나만 보여져야 할 것입니다.
그러나, 테이블에 열은 2개가 존재합니다.
COL1 열 하나에 대해서 중복제거를 하면, COL2 에 있는 값인 1과 2 중 어느 것을 출력해야 하는지 모호합니다.
그러므로 DISTINCT 는 모든 컬럼을 고려하여 진행할 수 밖에 없습니다.
출처: 프로그래머스 코딩 테스트 연습, https://programmers.co.kr/learn/challenges