🌟 [SAP] SAP BW(Business Warehouse) 개념부터 아키텍처, BW/4HANA 최신 트렌드까지 총정리 🌟
안녕하세요! 기업의 IT 시스템과 데이터 아키텍처에 관심을 가지고 계신 여러분을 위해 준비한 상세 가이드입니다. 글로벌 기업이나 대기업의 데이터 프로젝트를 진행하다 보면, 반드시 한 번쯤 마주치게 되는 시스템이 있습니다. 바로 SAP BW (Business Warehouse) 입니다.
1. SAP BW란 무엇인가? (개념 정의)
SAP BW(Business Warehouse)는 SAP에서 제공하는 기업용 데이터 웨어하우스(EDW, Enterprise Data Warehouse) 솔루션입니다. 기업 내외부의 다양한 시스템(SAP ERP, Non-SAP 시스템, 웹 데이터, 플랫 파일 등)에서 발생하는 방대한 데이터를 추출(Extract), 변환(Transform)하여 한 곳에 적재(Load)한 뒤, 이를 비즈니스 의사결정에 활용할 수 있도록 다차원 분석 및 리포팅 기능을 제공하는 중앙 집중형 데이터 플랫폼입니다.
SAP BW의 본질을 이해하기 위해서는 먼저 데이터베이스의 두 가지 핵심 활용 목적, 즉 OLTP와 OLAP의 차이를 명확히 알아야 합니다.
📊 OLTP vs OLAP 비교
| 구분 | OLTP (Online Transaction Processing) | OLAP (Online Analytical Processing) |
| 핵심 시스템 | SAP ERP (ECC, S/4HANA 등) | SAP BW (Business Warehouse) |
| 주요 목적 | 실시간 비즈니스 트랜잭션(거래) 처리 | 과거 및 현재 데이터 기반의 다차원 분석 |
| 데이터 성격 | 현재 진행 중인 최신 데이터 (상세 데이터) | 과거 이력이 포함된 대용량 누적 데이터 (요약 데이터) |
| 작업 형태 | 빠른 속도의 빈번한 데이터 입력, 수정, 삭제 (INSERT/UPDATE) | 복잡한 쿼리를 통한 데이터 조회 및 집계 (SELECT) |
| 데이터베이스 설계 | 정규화(Normalization) 모델 (데이터 중복 최소화) | 비정규화, 다차원 모델 (Star Schema 등 조회 성능 극대화) |
SAP ERP 시스템은 주문 처리, 전표 생성, 재고 이동 등 회사의 일상적인 '업무 처리'를 위한 OLTP 시스템입니다.
반면, "지난 3년간의 국가별, 제품별, 분기별 매출 추이와 이익률은 어떠한가?"와 같은 복잡한 분석 쿼리를 ERP 시스템에 직접 던지게 되면 어떻게 될까요? ERP 데이터베이스에 엄청난 부하가 발생하여, 현업의 실시간 업무 처리가 마비될 수 있습니다.
따라서 분석을 위한 별도의 공간을 마련하고 데이터를 정제하여 모아두는 시스템이 필수적인데, 이 역할을 수행하는 최적의 솔루션이 바로 SAP BW입니다.
2. 왜 기업들은 SAP BW를 도입하는가? (필요성 및 장점)
수많은 데이터 웨어하우스 솔루션(Oracle, Teradata, AWS Redshift 등)이 존재하지만, SAP ERP를 사용하는 기업들이 굳이 SAP BW를 고집하는 데는 강력하고 명확한 이유가 있습니다.
- 단일 진실 공급원 (Single Source of Truth, SSOT): 기업 내의 다양한 부서(재무, 영업, 생산, 인사)는 종종 같은 지표를 두고 서로 다른 숫자를 주장합니다. SAP BW는 전사 데이터를 통합하고 일관된 규칙으로 정제하여, 모든 경영진과 실무자가 동일한 기준의 데이터(진실)를 바탕으로 소통하고 의사결정을 내릴 수 있게 합니다.
- 비즈니스 콘텐츠 (SAP Business Content): 이것은 SAP BW만의 가장 강력한 무기입니다. SAP는 전 세계 수많은 기업의 베스트 프랙티스를 기반으로, 각 모듈(FI, CO, SD, MM 등) 및 산업별로 미리 정의된 데이터 모델, 추출 로직, 리포트 템플릿을 기본 제공합니다. 기업은 백지상태에서 데이터 웨어하우스를 구축할 필요 없이, 비즈니스 콘텐츠를 활성화(Activation)하여 프로젝트 기간과 비용을 획기적으로 단축할 수 있습니다.
- ERP 시스템 부하 방지: 앞서 언급했듯, 무거운 분석 및 집계 리포팅을 BW로 이관함으로써 핵심 운영 시스템인 ERP의 성능을 안정적으로 보장합니다.
- 강력한 데이터 통합 및 조화: SAP 시스템뿐만 아니라 오라클, MS SQL, 플랫 파일(Excel, CSV), 최근에는 클라우드 데이터(OData 등)까지 다양한 이기종 소스의 데이터를 유연하게 통합할 수 있는 강력한 추출/변환 인터페이스를 제공합니다.
3. SAP BW의 핵심 아키텍처 및 구성 요소 심층 분석
SAP BW의 데이터 흐름은 데이터 소스 ➡️ 추출/변환 ➡️ 데이터 저장 ➡️ 리포팅 및 분석의 파이프라인으로 구성됩니다.
시스템 내부를 구성하는 주요 용어와 객체(Object)들을 자세히 살펴보겠습니다.
3.1. 소스 시스템 (Source System)과 PSA
- Source System: 데이터가 처음 생성되는 곳입니다. SAP ERP, CRM, SRM 뿐만 아니라 외부 데이터베이스, 파일 시스템 등을 모두 Source System으로 연결할 수 있습니다.
- PSA (Persistent Staging Area): 소스 시스템에서 추출된 원시 데이터(Raw Data)가 BW에 최초로 저장되는 임시 정거장입니다. 데이터가 변환되기 전 원본 형태를 그대로 유지하므로, 이후 데이터 정제 과정에서 오류가 발생했을 때 소스 시스템에 다시 접속할 필요 없이 PSA에서 데이터를 재처리할 수 있도록 돕습니다. (단, 최신 BW/4HANA 버전에서는 이 영역이 간소화되었습니다.)
3.2. ETL (Extraction, Transformation, Loading) 로직
- InfoPackage (인포패키지): 소스 시스템에서 PSA까지 데이터를 가져오는 스케줄링 도구입니다.
- DTP (Data Transfer Process): PSA에서 다음 단계의 저장소(DSO나 InfoCube)로, 혹은 BW 내부 객체 간에 데이터를 이동시키는 역할을 합니다. 필터링 로직이나 병렬 처리 기능을 제어합니다.
- Transformation (트랜스포메이션): 데이터가 이동하는 과정에서 필드 간의 매핑, 포맷 변경, 수식 계산, 혹은 ABAP 코딩을 통한 복잡한 비즈니스 로직 적용 등 데이터 정제(Cleansing) 및 규칙을 정의하는 핵심 요소입니다.
3.3. 인포오브젝트 (InfoObject) - BW의 뼈대
InfoObject는 SAP BW에서 데이터를 표현하는 가장 작은 메타데이터 단위입니다. 레고 블록과 같아서, 이들을 조립하여 거대한 데이터 모델을 만듭니다. 크게 두 가지로 나뉩니다.
- 특성 (Characteristics): 데이터를 분류하고 분석하는 기준이 되는 차원(Dimension)입니다. 예: 고객(0CUSTOMER), 자재(0MATERIAL), 영업 조직, 회계 연도.
- 주요 수치 (Key Figures): 분석의 대상이 되는 정량적인 숫자 데이터입니다. 예: 매출액(0NETVAL_INV), 할인액, 수량, 환율.
💡 마스터 데이터 (Master Data)
특성 InfoObject는 스스로 마스터 데이터를 가질 수 있습니다. 마스터 데이터는 세 가지 요소로 구성됩니다.
- 속성 (Attributes): 고객의 '주소', '전화번호' 등.
- 텍스트 (Texts): 고객 코드 'C100'에 대한 '삼성전자'라는 설명.
- 계층 (Hierarchies): 영업 본부 ➡️ 지역 영업소 ➡️ 개별 대리점으로 이어지는 트리 구조.
3.4. 인포프로바이더 (InfoProvider) - 데이터 저장소
리포트가 직접 바라보고 데이터를 가져오는 물리적/논리적 저장소입니다.
- DSO (DataStore Object):
- 상세 레벨(Line item)의 데이터를 2차원 평면 테이블 형태로 저장합니다.
- Overwrite(덮어쓰기) 기능이 가장 큰 특징입니다. 예를 들어 주문 번호 100번의 수량이 10개에서 15개로 변경되어 다시 들어오면, DSO는 기존 데이터를 찾아 15개로 업데이트(Delta 처리)를 완벽하게 수행합니다.
- 이를 위해 내부적으로 3개의 테이블(New Data, Active Data, Change Log)을 운용하는 정교한 활성화(Activation) 메커니즘을 가집니다.
- InfoCube (인포큐브):
- 데이터 분석과 조회의 성능을 극대화하기 위해 다차원으로 요약(집계)된 데이터를 저장하는 모델입니다.
- 확장형 스타 스키마 (Extended Star Schema)라는 독특한 구조를 가집니다. 중앙에 숫자 데이터(Key Figure)가 저장되는 거대한 Fact Table이 있고, 그 주변을 Dimension Table들이 둘러싸며, 이 Dimension은 다시 InfoObject의 SID(Surrogate ID) Table을 거쳐 마스터 데이터와 연결됩니다. 이 복잡해 보이는 구조 덕분에 다국어 지원, 마스터 데이터의 독립적 갱신, 쿼리 조회 속도 향상이 가능했습니다.
- 가상 프로바이더 (MultiProvider / InfoSet):
- 데이터를 물리적으로 중복 저장하지 않고, 이미 존재하는 여러 InfoCube나 DSO를 논리적으로 결합(Union 또는 Join)하여 리포팅 뷰를 제공하는 가상 객체입니다.
4. 아키텍처 베스트 프랙티스: LSA와 LSA++
SAP BW 프로젝트를 진행할 때 데이터를 아무렇게나 쌓지 않습니다. 안정성과 확장성을 위해 표준화된 아키텍처 프레임워크를 따르는데, 이를 LSA (Layered Scalable Architecture)라고 합니다.
전통적인 LSA 구조
- Data Acquisition Layer: 소스 데이터를 변경 없이 그대로 저장하는 영역 (PSA).
- Corporate Memory Layer: 데이터 백업 및 이력 관리를 위해 모든 상세 데이터를 영구 보관하는 영역.
- Data Harmonization/Quality Layer: 전사 기준에 맞게 데이터를 정제하고 통합하는 영역 (DSO 활용).
- Business Transformation / Data Mart Layer: 특정 부서나 업무 목적에 맞게 데이터를 집계하고 비즈니스 로직을 가미한 영역 (InfoCube 활용).
- Virtualization Layer: 사용자 리포팅을 위해 여러 모델을 결합하는 영역 (MultiProvider).
이러한 LSA는 데이터의 정합성을 완벽히 보장하지만, 데이터를 여러 레이어에 걸쳐 중복으로 물리적 복사를 해야 하므로 공간 낭비와 배치 처리 시간 증가라는 단점이 있었습니다.
LSA++ (HANA 시대의 아키텍처)
인메모리(In-Memory) 데이터베이스인 SAP HANA가 등장하면서, 패러다임이 완전히 바뀝니다. 연산 속도가 비약적으로 상승함에 따라 미리 데이터를 집계(Cube)해 둘 필요성이 줄어들었습니다. LSA++는 물리적 데이터 복제를 최소화하고, HANA DB의 뷰(View)를 활용한 가상화(Virtualization)를 극대화하여 레이어를 단순화하고 민첩성을 높인 현대적인 아키텍처입니다.
5. 차세대 플랫폼: SAP BW/4HANA로의 진화
SAP BW는 기술의 발전에 따라 그 형태를 크게 세 번 혁신했습니다.
- Classic SAP BW (버전 3.x ~ 7.x): 오라클, MS SQL, IBM DB2 등 전통적인 디스크 기반 관계형 데이터베이스(RDBMS) 위에서 구동되던 시절입니다. 복잡한 인포큐브와 집계 테이블(Aggregate)을 튜닝하는 것이 컨설턴트들의 주된 과제였습니다.
- SAP BW on HANA (버전 7.3 ~ 7.5): 기존 BW 아키텍처를 유지한 채, 밑바탕의 데이터베이스만 SAP의 초고속 인메모리 DB인 HANA로 교체한 과도기적 단계입니다. 조회 속도와 데이터 로딩 속도가 혁신적으로 빨라졌습니다.
- SAP BW/4HANA (최신 플랫폼): HANA 데이터베이스의 강력한 기능을 100% 활용하기 위해 애플리케이션 소스 코드 자체를 처음부터 재작성(Re-write)한 차세대 데이터 웨어하우스입니다. 2016년 첫 출시 후, 현재 최신 안정화 버전인 SAP BW/4HANA 2023 라인업(2025년 2월 FP04 릴리즈 등 지속 업데이트)으로 시장을 주도하고 있습니다.
🚀 SAP BW/4HANA의 주요 혁신 포인트
| 구분 | Classic BW (BW on AnyDB) | SAP BW/4HANA |
| 핵심 DB | Oracle, MS-SQL 등 모든 DB | 오직 SAP HANA만 지원 |
| 객체 종류 | PSA, InfoCube, DSO, MultiProvider 등 10개 이상으로 복잡 | ADSO, CompositeProvider, Open ODS View 등 4개로 극적 단순화 |
| 모델링 환경 | SAP GUI (전통적인 SAP 화면) | Eclipse 기반의 BW MT (Modeling Tools) 및 웹 콕핏 (Web Cockpit) |
| 데이터 연동 | 일괄 배치(Batch) 추출 위주 | 클라우드 플랫폼, Big Data, 실시간(SDI) 스트리밍 완벽 통합 |
| 데이터 티어링 | 수동 아카이빙 복잡 | DTO (Data Tiering Optimization): 핫(메모리), 웜(디스크), 콜드(데이터레이크) 데이터를 자동/규칙 기반으로 분산 저장해 비용 절감 |
기존의 복잡했던 InfoCube와 DSO는 이제 Advanced DSO (ADSO)라는 하나의 강력한 객체로 통폐합되었습니다. 또한 사용자 인터페이스 역시 낡은 SAP GUI를 버리고 현대적인 이클립스(Eclipse) 환경과 웹 기반 콕핏으로 완전히 전환되어 개발 생산성이 대폭 향상되었습니다.
6. 실무 적용 및 시각화 도구
SAP BW 내부에 정제된 데이터를 최종 사용자(임원진, 실무자)가 시각적으로 분석하기 위해서는 프론트엔드 툴이 필요합니다.
- 과거에는 BEx (Business Explorer) Analyzer와 Web Application Designer가 주로 쓰였습니다.
- 최근에는 엑셀 환경에 완벽히 통합된 SAP Analysis for Microsoft Office가 현업 분석가들에게 가장 널리 쓰이며,
- 대시보드와 클라우드 기반의 최신 시각화 및 예측 분석을 위해서는 SAC (SAP Analytics Cloud)와 직접 연동하여 강력한 시너지를 발휘하고 있습니다. 재무 부서는 이를 통해 연결재무제표 통합 및 경영 계획(Planning)을 수립하며, 영업 부서는 실시간 수익성 분석 모델을 구동합니다.
📝 마치며
지금까지 SAP BW의 기본 개념부터 핵심 아키텍처, 그리고 최신의 SAP BW/4HANA로의 진화까지 총망라하여 살펴보았습니다.
SAP BW는 단기간에 마스터하기에는 진입 장벽과 러닝 커브가 분명히 존재하는 복잡한 시스템입니다.
하지만 기업의ERP 트랜잭션을 타고 흐르는 데이터를 의미 있는 정보로 융합해 내는 그 방대한 구조를 이해하고 나면, 데이터 엔지니어링과 아키텍처에 대한 통찰력이 비약적으로 상승할 것입니다.
특히 BW/4HANA로 넘어오면서 복잡성은 줄어들고 유연성과 클라우드 확장성은 더욱 강력해졌습니다.
ERP 시스템의 고도화나 데이터 인프라 마이그레이션을 고민하고 계신다면 이 시스템이 제공하는 무궁무진한 비즈니스 가치를 꼭 주목해 보시길 바랍니다.
'ERP(SAP)' 카테고리의 다른 글
| [SAP] MATDOC 활용한 자재 일별 수불 생성 (이동유형) (0) | 2026.06.02 |
|---|---|
| [SAP] SAP GUI 입력 시 띄어쓰기 들어가는 문제 해결 (0) | 2026.05.27 |
| [SAP SD] Sold-to Party / Shipt-to-Party / Bill-to Party / Payer 개념 정리 (0) | 2026.05.20 |
| [SAP] RFC modules, only parameters with passare allowed (0) | 2026.05.18 |
| 📅 SAP 날짜·주차 계산 함수(Function) 완벽 가이드 (0) | 2026.05.06 |
