Posts [프로그래머스] 동물 수 구하기, 중복 제거하기 (DISTINCT)
Post
Cancel

[프로그래머스] 동물 수 구하기, 중복 제거하기 (DISTINCT)

[프로그래머스] 동물 수 구하기, 중복 제거하기


프로그래머스의 SQL Kit에 있는 SUM, MAX, MIN 문제들 중

  1. 동물 수 구하기
  2. 중복 제거하기

문제입니다.


  • 등장하는 개념
    • COUNT 활용하기
    • DISTINCT 활용하기

1. 동물 수 구하기

ANIMAL_INS 테이블에 동물들의 정보가 담겨 있습니다. 각 테이블에는 다음과 같은 column들이 있습니다.

NAMETYPENULLABLE
ANIMAL_IDVARCHAR(N)FALSE
ANIMAL_TYPEVARCHAR(N)FALSE
DATETIMEDATETIMEFALSE
INTAKE_CONDITIONVARCHAR(N)FALSE
NAMEVARCHAR(N)TRUE
SEX_UPON_INTAKEVARCHAR(N)FALSE

이 데이터들 중에서 가장 먼저 들어온 동물의 이름을 조회해야 합니다.


  • 조회 : SELECT 를 활용합니다.
  • 수량 세기 : COUNT 를 활용합니다.

동물이 몇 마리 들어왔는지 조회하기 위해, ANIMAL_ID 값을 기준으로 카운트를 해 보겠습니다.

  • COUNT 는 SQL 문법에 존재하는 집계함수입니다.
  • 함수 내에 들어간 컬럼에 존재하는 데이터의 갯수를 출력합니다.
1
2
SELECT COUNT(ANIMAL ID)
FROM ANIMAL_INS

2. 중복 제거하기

위 테이블 데이터를 토대로, 동물 보호소에 들어온 동물의 이름이 몇 개인지 조회하는 SQL문을 작성해야 합니다.

  • 단, 동물의 이름이 중복되는 경우 하나로 칩니다.
  • 동물의 이름이 NULL인 경우는 집계하지 않습니다.

  • 동물의 이름 갯수를 조회하는 것이므로, NAME에 COUNT 함수를 적용할 것입니다.

  • 컬럼 내 같은 데이터가 존재하면, 중복을 제거하기 위해 DISTINCT를 사용합니다.
  • 중복 데이터를 제거하고자 하는 열은 NAME 이므로, 옆에 DISTINCT 키워드를 붙입니다.
  • NULL 값이 아닌 것을 비교하는 방법IS NOT NULL 을 붙입니다.
1
2
3
SELECT COUNT(DISTINCT NAME)
FROM ANIMAL_INS
WHERE NAME IS NOT NULL

[DISTINCT 사용 시 주의할 점]

  • DISTINCT 키워드는 옆에 온 모든 컬럼을 고려하여 중복 제거를 진행합니다.

  • 즉, SELECT DISTINCT COL1, COL2 …를 진행할 경우

    • COL1과 COL2 값이 모두 동일한 row들을 1개로 칩니다.
  • 다시 말하면, DISTINCT 는 SELECT 구문에 여러 컬럼명이 올 때, 그 중 한 개에 대해서만 적용할 수 없다는 말이 됩니다.

    • SELECT (DISTINCT COL1), COL2 FROM …는 오류입니다.

    • COL1 의 중복된 데이터를 제거한 뒤 COL2를 가져와야 할 텐데, 이 중 어떤 COL2 값을 가져와야 하는지 알 수 없기 때문입니다.

    • COL1COL2
      A1
      A2
      B3
      C4

      위에서 COL1에 대해서만 DISTINCT를 한다고 예를 들어 보겠습니다.

      A는 중복이 제거되어 A 하나만 보여져야 할 것입니다.

      그러나, 테이블에 열은 2개가 존재합니다.

      COL1 열 하나에 대해서 중복제거를 하면, COL2 에 있는 값인 1과 2 중 어느 것을 출력해야 하는지 모호합니다.

      그러므로 DISTINCT 는 모든 컬럼을 고려하여 진행할 수 밖에 없습니다.


출처: 프로그래머스 코딩 테스트 연습, https://programmers.co.kr/learn/challenges

[프로그래머스] 상위 n개 레코드

[프로그래머스] 고양이와 개는 몇 마리 있을까, 동명 동물 수 찾기 (GROUP BY, HAVING)