Intro Group by와 Partition by는 데이터를 집계할 때 주로 사용된다. 대개 역할이 비슷한데, 어떤 차이점이 있을까?
Goals · Group by와 Partition by의 차이점 이해 Content Group by를 사용하면 중복된 데이터가 제거된다. 예를 들어 학생별 과목점수 테이블을 생각해보자.
이 테이블에서 학생별 평균점수를 구하려면 다음과 같이 query문을 작성할 수 있다. 그러면 다음과 같은 결과를 얻을 수 있다.
이 예제에서 알 수 있듯이, Group by를 사용하면 중복된 데이터가 제거됨을 알 수 있다. 이어서 Partition by를 알아보면, 이런 식으로 사용할 수 있다.
그런데 실제로 실행을 해보면, 평균 점수는 구했지만 중복된 데이터가 존재한다. 즉, 의..........