CS/데이터베이스

[데이터베이스] 2. 데이터의 분류

JIN-JJS 2025. 2. 5. 20:01

1. 데이터 분류

1) 특성에 따른 데이터 분류

정형 데이터

 일정한 구조를 가지고 있으며, 엑셀이나 데이터베이스처럼 행과 열로 정리된 데이터를 의미합니다

 예를 들면 날짜, 시간, 고객 ID 등이 있습니다.

 

반정형 데이터

 데이터 자체에 구조에 대한 정보가 포함되어 있지만, 정형 데이터처럼 고정된 형식은 아닙니다.

 예를 들어 HTML, XML, JSON 같은 데이터가 해당됩니다.

 

비정형 데이터

 일정한 구조가 없는 데이터로, 텍스트, 이미지, 동영상 등 다양한 형태로 존재합니다.

 웹 페이지, SNS 게시글, 이메일 등이 여기에 속합니다.

 

 

2) 생성 주기에 따른 분류

정적 데이터

 일정한 주기로 업데이트되지 않는 데이터로, 보통 한 번 저장하면 변경되지 않습니다.

 예를 들어 고객 정보나 제품 정보처럼 오랫동안 변하지 않는 데이터가 있습니다.

 

동적 데이터

 실시간으로 변경되거나 추가되는 데이터입니다.

 예를 들어 주식 시장의 실시간 주가 정보나 SNS에 올라오는 게시글 등이 이에 해당합니다.

 

 

3) 저장 위치에 따른 분류

클라우드 데이터

 클라우드 환경에서 생성되거나 저장되는 데이터입니다.

 예를 들어, 빅데이터 분석 시스템, 온라인 데이터베이스, 애플리케이션 등이 이에 해당합니다.

 

엣지 데이터

 데이터를 생성하는 장치 근처에서 바로 처리되는 데이터입니다. ]

 예를 들어 스마트홈 기기에서 발생하는 데이터나 자동차 센서에서 수집되는 데이터가 이에 속합니다.

 

 

4) 처리 방식에 따른 분류

배치 처리

 일정량의 데이터를 모아서 한 번에 처리하는 방식입니다.


스트림 처리

 실시간으로 들어오는 데이터를 즉시 분석하고 활용하는 방식입니다.

 

 

 

2. 시대 변화에 따른 데이터 중요성

데이터는 시대에 따라 변화해 왔으며, 기록 방식도 발전해 왔습니다.

 

1) 데이터의 변화

초기 기록 형태

 인류는 과거 동굴벽화나 상형문자를 이용해 정보를 남겼습니다.

 

종이 기반 기록

 문자가 발달하면서 종이에 기록을 남기는 방식이 등장했습니다.

 장점: 작성과 수정이 간편하며, 특별한 장비가 필요하지 않습니다.

 단점: 보관과 검색이 어렵고, 시간이 지나면 훼손될 가능성이 높습니다.

 

디지털 데이터

• 전자적으로 데이터를 저장하고 관리하는 방식이 발전했습니다.

 전자 저장: 데이터를 하드디스크, SSD, USB 등에 저장하는 방식입니다.

데이터베이스: 체계적으로 데이터를 관리하는 시스템으로, 예를 들어 은행의 고객 정보나 학교의 성적 관리 시스템이 이에 해당합니다.

데이터웨어하우스: 여러 시스템에서 수집한 데이터를 한곳에 통합하여 저장하는 방식입니다. 기업의 ERP, CRM 시스템이 대표적입니다.

데이터 레이크: 다양한 형태(정형, 반정형, 비정형)의 원시 데이터를 저장하는 공간입니다.

데이터 마트: 특정 목적에 맞춰 데이터를 저장하는 데이터웨어하우스의 간단한 형태로, 마케팅이나 금융 분석 등에 활용됩니다.

데이터 사이언스: 데이터를 수집, 분석, 해석하는 기술이 발전하면서 데이터 사이언스가 중요한 역할을 하게 되었습니다.

 

 

2) 데이터의 중요성

데이터는 오늘날 기업과 조직의 핵심 자산이며, 다음과 같은 이유로 중요성이 커지고 있습니다.

 

• 데이터 기반으로 더 나은 비즈니스 의사결정을 내릴 수 있음
• 최신 트렌드와 전략적 인사이트를 제공하여 경쟁력을 높일 수 있음
• 업무 효율을 개선하고 생산성을 높이는 데 도움을 줌
• 미래 시장 변화에 대한 예측 가능성을 높여 줌
• 고객 및 협력사와의 관계를 개선하고 맞춤형 서비스를 제공할 수 있음


이 내용은 휴넷사회복지평생교육원의 데이터베이스 강의를 듣고 정리한 것입니다.