책 내용 질문하기
인덱스 종류에 대한 질문입니다
도서
[2014] 정보처리기사 실기(산업기사 포함)
페이지
507
조회수
202
작성일
2014-06-28
작성자
첨부파일

507쪽에 미트맵 인덱스를 보면

분포도가 좋은 컬럼에 적합하다고나오는데 분포도가 나쁜컬럼에 적합한게 맞지않은가해서 질문드립니다.

그리고 성별 과같이 분포도가 나쁜 컬럼이있고, 이름처럼 약간 분포도가 좋은 컬럼이있고 등 예시를 통해

분포도에 대한 개념은 이해를 했는데요

비트맵 인덱스와 역방향 인덱스가 이해가 가지않습니다.

분포도가 낮은 성별의 경우 남자와 여자 로있는데 이걸 비트맵인덱스화 한다고 해도

남자 =00 여자=11 로 표현하면 그래도 분포도가 똑같은것 같은데

비트맵인덱스가 왜 분포도가 나쁜컬럼에적합해서 더 좋게 쓰이게 되는지

그리고

역방향인덱스의 경우 릴레이션의 등록날짜라 할경우 1102 1103 1104 이런것이

2011 3011 4011 이렇게 되어 불균형문제를 해결하는것은 이해하겠는데요 ,

역방향인덱스가 어떻게 되어 데이터 분포도가 좋아지며 왜 검색 성능이 좋은지에 대해 모르겠습니다.

1102 1103 1104 이건 2011 3011 4011 이건 둘의 분포도는 차이가없지않나요?

(예를 들어 설명해주시면 감사하겠습니다)

읽어주셔서 감사합니다

답변
2014-07-01 10:43:02

안녕하세요.

수험서는 학습에 양을 조절할 필요가 있습니다.

현재 학습하고 있는 교재의 내용은 실제 학과 과정에서 학습할 내용의 20~30%만 압축하여 수록한 것으로 시험에 나오는 내용 위주로 합격점을 목표로 다루고 있는 것이죠.

그렇기 때문에 교재의 내용으로 관련 내용을 확실히 이해하는데 어려움이 있는 부분이 많습니다. 또 그런 부분을 확실히 이해해야 만 시험 문제를 맞출 수 있다는 것은 아니죠. 개념만 잡고 있어도 맞출 수 있는 문제가 대부분 이기에 학습의 범위와 양을 조절할 필요가 있습니다.

인덱스 관련 내용도 분포도의 개념만 명확히 하는 것이 가장 효과적입니다.

분포도란 조건에 맞는 레코드의 숫자가 적은 경우 분포도가 좋다고 합니다.

즉 분포도가 낮을 수록 좋다고 할 수 있죠.

예를 들어 이름으로 인덱스를 선정한다고 할때

전체 레코드가 100일 때

'홍' 으로 지정하면 약 50개가 나온다고 하면

'홍길'로 하면 그보다 적은 20개

'홍길동'으로 하면 그보다 적은 5개 정도가 나온다고 가정할 때

가장 분포도가 좋은 것은 '홍길동'으로 할 때 입니다. 즉 분포도가 적은 것이 가장 좋은 것이죠.

검색 대상이 적을 수록 효과적인 인덱스가 되니까요.

각 인덱스의 종류별로 특징을 세부적으로 설명하려고 하면 단순한 예만으로는 설명이 부족할 수 있습니다

그러니 우선

비트맵 인덱스는 Bit 값인 0 또는 1로 변환하여 인덱스 키를 사용한다는 것과 분포도가 좋은 컬럼에 적합하다는 것 등 교재에 수록된 내용 정도만으로 시험에 대비한 후 향후 관련 내용에 좀더 깊이 있는 학습을 원하신다면 전공 서적으로 통해 시간을 투자하는 것이 효과적입니다.

역방향 인덱스는 B-트리 인덱스에서 루트에서 하위 노드로 키 값을 비교하는 과정의 역으로 키 값을 비교하면서 진행하다는 내용을 개념적으로 표현한 것이라 이해하면 될 것 같습니다.

오늘도 즐거운 하루 되세요.

"
  • *
    2014-07-01 10:43:02

    안녕하세요.

    수험서는 학습에 양을 조절할 필요가 있습니다.

    현재 학습하고 있는 교재의 내용은 실제 학과 과정에서 학습할 내용의 20~30%만 압축하여 수록한 것으로 시험에 나오는 내용 위주로 합격점을 목표로 다루고 있는 것이죠.

    그렇기 때문에 교재의 내용으로 관련 내용을 확실히 이해하는데 어려움이 있는 부분이 많습니다. 또 그런 부분을 확실히 이해해야 만 시험 문제를 맞출 수 있다는 것은 아니죠. 개념만 잡고 있어도 맞출 수 있는 문제가 대부분 이기에 학습의 범위와 양을 조절할 필요가 있습니다.

    인덱스 관련 내용도 분포도의 개념만 명확히 하는 것이 가장 효과적입니다.

    분포도란 조건에 맞는 레코드의 숫자가 적은 경우 분포도가 좋다고 합니다.

    즉 분포도가 낮을 수록 좋다고 할 수 있죠.

    예를 들어 이름으로 인덱스를 선정한다고 할때

    전체 레코드가 100일 때

    '홍' 으로 지정하면 약 50개가 나온다고 하면

    '홍길'로 하면 그보다 적은 20개

    '홍길동'으로 하면 그보다 적은 5개 정도가 나온다고 가정할 때

    가장 분포도가 좋은 것은 '홍길동'으로 할 때 입니다. 즉 분포도가 적은 것이 가장 좋은 것이죠.

    검색 대상이 적을 수록 효과적인 인덱스가 되니까요.

    각 인덱스의 종류별로 특징을 세부적으로 설명하려고 하면 단순한 예만으로는 설명이 부족할 수 있습니다

    그러니 우선

    비트맵 인덱스는 Bit 값인 0 또는 1로 변환하여 인덱스 키를 사용한다는 것과 분포도가 좋은 컬럼에 적합하다는 것 등 교재에 수록된 내용 정도만으로 시험에 대비한 후 향후 관련 내용에 좀더 깊이 있는 학습을 원하신다면 전공 서적으로 통해 시간을 투자하는 것이 효과적입니다.

    역방향 인덱스는 B-트리 인덱스에서 루트에서 하위 노드로 키 값을 비교하는 과정의 역으로 키 값을 비교하면서 진행하다는 내용을 개념적으로 표현한 것이라 이해하면 될 것 같습니다.

    오늘도 즐거운 하루 되세요.

    "
· 5MB 이하의 zip, 문서, 이미지 파일만 가능합니다.
· 폭언, 욕설, 비방 등은 관리자에 의해 경고없이 삭제됩니다.