다음은 어느 의류 쇼핑몰의 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.
| Column name | Type | Nullable |
|---|---|---|
| ONLINE_SALE_ID | INTEGER | FALSE |
| USER_ID | INTEGER | FALSE |
| PRODUCT_ID | INTEGER | FALSE |
| SALES_AMOUNT | INTEGER | FALSE |
| SALES_DATE | DATE | FALSE |
동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.
ONLINE_SALE 테이블에서 동일한 회원이 동일한 상품을 재구매한 데이터를 구하여, 재구매한 회원 ID와 재구매한 상품 ID를 출력하는 SQL문을 작성해주세요. 결과는 회원 ID를 기준으로 오름차순 정렬해주시고 회원 ID가 같다면 상품 ID를 기준으로 내림차순 정렬해주세요.
예를 들어 ONLINE_SALE 테이블이 다음과 같다면
| ONLINE_SALE_ID | USER_ID | PRODUCT_ID | SALES_AMOUNT | SALES_DATE |
|---|---|---|---|---|
| 1 | 1 | 3 | 2 | 2022-02-25 |
| 2 | 1 | 4 | 1 | 2022-03-01 |
| 4 | 2 | 4 | 2 | 2022-03-12 |
| 3 | 1 | 3 | 3 | 2022-03-31 |
| 5 | 3 | 5 | 1 | 2022-04-03 |
| 6 | 2 | 4 | 1 | 2022-04-06 |
| 2 | 1 | 4 | 2 | 2022-05-11 |
USER_ID 가 1인 유저가 PRODUCT_ID 가 3, 4인 상품들을 재구매하고, USER_ID 가 2인 유저가 PRODUCT_ID 가 4인 상품을 재구매 하였으므로, 다음과 같이 결과가 나와야합니다.
| USER_ID | PRODUCT_ID |
|---|---|
| 1 | 4 |
| 1 | 3 |
| 2 | 4 |
SELECT USER_ID, PRODUCT_ID
FROM ONLINE_SALE
GROUP BY USER_ID, PRODUCT_ID
HAVING COUNT(*) > 1
ORDER BY USER_ID ASC, PRODUCT_ID DESC;
GROUP BY 절은 실제 데이터를 수정하지 않고, 쿼리 처리 과정에서만 데이터를 논리적으로 그룹화합니다. 이를 통해 특정 열(컬럼)의 값을 기준으로 데이터를 여러 그룹으로 나눌 수 있습니다. **GROUP BY**는 주로 집계 함수(Aggregate functions)와 함께 사용되어, 각 그룹에 대한 합계, 평균, 카운트 등의 계산을 수행할 때 유용합니다.
예를 들어, **GROUP BY USER_ID, PRODUCT_ID**는 **USER_ID**와 **PRODUCT_ID**의 조합별로 데이터를 그룹화합니다. 이렇게 논리적으로 그룹화된 데이터는 집계 함수를 사용하여 각 그룹의 특성을 분석할 때 활용됩니다. 하지만, 이 작업은 데이터베이스 내의 데이터 자체를 변경하지는 않으며, 쿼리 결과에만 영향을 미칩니다.
HAVING 절은 SQL에서 GROUP BY 절과 함께 사용되며, 특정 조건에 맞는 그룹만을 선택하기 위해 사용됩니다. HAVING 절은 **GROUP BY**에 의해 생성된 그룹에 대해 조건을 적용하며, 이 조건은 주로 집계 함수(Aggregate functions)를 포함합니다.
HAVING COUNT(*) > 1의 의미