[DB/SQLD] 옵티마이저 조인(optimizer join)

1 분 소요

옵티마이저 조인

하나의 테이블에서 데이터를 먼저 찾고 그 다음 테이블을 조인하는 방식으로 실행.
먼저 조회되는 테이블을 외부테이블(outer table), 그다음 조회되는 테이블을 내부 테이블(innter table)이라고 한다.
외부테이블(선행 테이블)의 크기가 작은 것을 먼저 찾는 것이 중요하다. 그래야 데이터가 스캔되늰 범위를 줄일 수 있기 때문이다.
Random Access가 발생하는데 random access가 많이 발생하면 성능 지연이 발생한다. 그러므로 nested loop 조인은 random access의 양을 줄여야 성능이 향상된다.
외부 테이블(선행테이블)의 인덱스를 먼저 검색하고 외부테이블 인덱스에 있는 ROWID를 사용해 외부 테이블을 읽는다. 그 다음에 외부테이블에서 내부테이블의 인덱스를 찾는다. 이 부분을 RANDOM ACCESS라고 한다. 그 후 내부테이블 인덱스를 사용해 내부테이블에서 데이터를 찾는다. 여기까지 실행되면 모든 데이터를 다 찾는다. 그다음은 인출(fetch)을 실행해 전송한다.

SELECT /*+ ordered use_nl(b) */ *
FROM EMP a, DEPT b
WHERE a.DEPTNO = b.DEPTNO
      AND a.DEPTNO = 10;

위의 예는 use_nl 힌트를 사용해 의도적으로 nested loop 조인을 실행했다.

실행계획을 보면 EMP 테이블을 FULL SCAN하고 그다음 DEPT테이블을 FULL SCAN하여 NESTED LOOP 조인을 한다.

ordered 힌트는 FROM절에 나오는 테이블 순서대로 조인을 하게 하는 것이다. ordered힌트는 혼자 사용되지 않고 use_nl, use_merge, use_hash 힌트와 함께 사용된다.

SELECT *
FROM EMP, DEPT
WHERE EMP.DEPTNO = DEPT.DEPTNO
      AND EMP.DEPTNO = 10;

ALL_ROWS는 비용 기반 옵티마이저를 의미

실행 계획을 읽는 방법은 번호 순서대로 읽으면 된다.

1번 : DEPT 테이블의 SYS_C007959 인덱스를 유일하게 조회(INDEX UNIQUE SCAN)

2번 : INDEX에서 DEPT 테이블 ROWID를 사용해서 조회

3번 : EMP 테이블을 전체 스캔(FULL SCAN)

4번 : DEPT테이블과 EMP테이블을 NESTED LOOP 방식의 조인을 해서 최종 결과를 만들어 낸다.

NESTED LOOP 방식의 조인은 DEPT테이블에서 먼저 데이터를 찾고 그다음 EMP 테이블을 찾는 것을 의미. 이런 것을 RANDOM ACCESS라고 한다.