인덱스 뜻? 색인과 테이블 개념 2가지 이해

인덱스 뜻과 개념 설명
인덱스 뜻과 개념 설명

인덱스 뜻과 개념에 대해서 이야기해봅시다.




인덱스 뜻과 개념 알기

인덱스 뜻(Index)은 키(Key)를 이용하여 저장된 데이터에 빠르게 접근하기 위해서 사용하는 지시자를 의미합니다. 인덱스는 데이터를 보다 빠르고 효율적으로 검색하기 위해서 미리 가공해두는 과정입니다.

인덱스는 원 데이터의 정보 내용을 적절하게 나타낼 수 있는 정보를 추출하고 원 데이터의 위치를 가리키는 참조 정보와 함께 나타내게 됩니다. 인덱스는 표의 요소를 식별하는 번호를 의미하기도 합니다.

테이블(Table) 개념은 가장 보편적이고 일반적으로 사용하는 데이터베이스(DB, DataBase) 내의 데이터 저장 방식이자 데이터 저장 공간입니다. 테이블은 행과 열로 구성되는 표 형태로 설명 될 수 있고 레코드와 컬럼으로 구성되어 있습니다.




인덱스 뜻과 개념 설명

인덱스 뜻(Index)은 데이터가 가지고 있는 고유의 값으로 색인과 목록을 의미합니다. 인덱스는 데이터를 기록할 때 고유의 키 값과 함께 데이터의 이름과 크기 등 속성과 기록 장소를 표시하는 것을 말합니다.

인덱스(Index)는 줄여서 ID라고도 부르며 인덱스명은 중복되면 안됩니다.

테이블 개념(Table)은 관계형 데이터베이스에서 엑셀(Excel)과 같이 데이터를 저장하는 표 형식의 장소입니다. 데이터베이스(DB)에는 여러 개의 테이블들로 구성되어 있고 링크하여 처리하게 됩니다. 테이블에 데이터를 검색할 때 데이터의 양이 많아지면 처리에 시간이 오래 걸리기 때문에 보다 빠르게 처리하기 위해서 색인을 작성하게 되는데 이를 인덱스라고 부릅니다.

[인덱스 뜻과 테이블 개념]

구분내용
인덱스데이터베이스에서 데이터를 저장하는 표 형식의 데이터 저장 장소
테이블데이터를 빠르고 효율적으로 검색하기 위해서 미리 가공해두는 과정

테이블(Table)은 가로와 세로 방향으로 구성된 표 개념과 유사합니다. 테이블의 가로 방향은 레코드라고 하며 테이블에 행 단위로 등록된 데이터로써 데이터 한 건 한 건의 단위가 됩니다. 테이블의 세로 방향을 컬럼이라고 부릅니다. 컬럼(Column)에는 어떠한 속성을 넣을지를 결정하는 개념입니다.

컬럼은 필드로 구성되어 있습니다. 레코드 하나 하나의 요소를 필드라고 하며 엑셀로 보면 하나의 셀에 해당합니다. 데이터를 입력하는 가장 작은 단위의 장소입니다.

인덱스의 경우 장점과 단점을 가지고 있습니다. 인덱스는 빠르게 검색할 수 있는 장점이 있지만 갱신이 발생할 경우 인덱스도 함께 갱신해줘야 하기 때문에 갱신이 빈번하게 발생하는 테이블의 경우 처리 속도가 느려질 수 있는 가능성이 있습니다.

인덱싱(Indexing)은 텍스트 추출, 토큰 추출, 불용어 제거, 정규화, 역파일 색인의 과정을 거칩니다.

[인덱싱 과정]

① 텍스트 추출(Text Extraction)

② 토큰 추출(Tokenization)

③ 불용어 제거(Stop-word removal)

④ 정규형 만들기(Normalization)

⑤ 역파일 색인(Inverted Indexing)

데이터베이스에서 사용하는 인덱스는 RDMS에서 검색 속도를 높이기 위한 기술이며 데이터 컬럼을 색인화하는 작업입니다. 컬럼을 색인화하게 되면 데이터베이스 안에서 처음부터 끝까지 풀 스캔을 할 필요가 없게 되고 인덱스 파일 검색을 통해서 보다 빠르게 검색할 수 있게 됩니다.

인덱스는 변경과 업데이트가 빈번하지 않고 검색이 많을 경우 사용하면 좋은 기술입니다.