Digital Twin과 예지정비의 만남
제조 현장에서 설비가 예고 없이 멈추는 순간, 생산 라인 전체가 정지된다. 비계획 다운타임(Unplanned Downtime)의 비용은 산업에 따라 시간당 수천만 원에서 수억 원에 달한다. 이 문제를 해결하기 위해 등장한 것이 Digital Twin 기반 예지정비(Predictive Maintenance) 시스템이다.
Digital Twin은 물리적 자산의 가상 복제본으로, 실시간 센서 데이터를 기반으로 설비의 현재 상태를 시뮬레이션하고 미래 고장 시점을 예측한다. 이 글에서는 센서 융합부터 실시간 RUL(Remaining Useful Life) 예측 파이프라인까지, 실무에서 적용 가능한 시스템 설계 전체 흐름을 다룬다.
시스템 아키텍처 개요
Digital Twin 기반 예지정비 시스템은 크게 네 개의 레이어로 구성된다.
| 레이어 | 역할 | 주요 기술 |
|---|---|---|
| 데이터 수집 | 센서 데이터 실시간 수집 | IoT 게이트웨이, MQTT, OPC-UA |
| 센서 융합 | 다중 센서 신호 통합·전처리 | Kalman Filter, 웨이블릿 변환 |
| Digital Twin 엔진 | 물리 모델 + 데이터 기반 모델 동기화 | FEM, 상태공간 모델, 하이브리드 모델 |
| RUL 예측 | 잔여 수명 추정 및 의사결정 | LSTM, Transformer, 생존 분석 |
Digital Twin의 핵심 가치는 물리 기반 모델(Physics-based)과 데이터 기반 모델(Data-driven)을 결합하여 단일 모델로는 불가능한 수준의 예측 정확도를 달성하는 데 있다.
센서 융합: 다중 신호를 하나로 통합하기
산업 설비에는 진동, 온도, 전류, 음향 방출(AE) 등 다양한 센서가 부착된다. 각 센서는 고장의 서로 다른 측면을 포착하므로, 센서 융합(Sensor Fusion)을 통해 종합적인 건강 상태 지표(Health Indicator)를 만들어야 한다.
센서 융합의 세 가지 수준
- 데이터 수준 융합: 원시 신호를 직접 결합 (가장 정보량이 많지만 노이즈에 취약)
- 특징 수준 융합: 각 센서에서 추출한 특징(RMS, 첨도, FFT 피크 등)을 결합 (가장 실무에서 많이 사용)
- 결정 수준 융합: 각 센서별 독립 판단을 종합 (앙상블 방식)
특징 추출 예시 코드
import numpy as np
from scipy import signal
from scipy.stats import kurtosis
def extract_features(vibration_signal, sampling_rate=25600):
"""진동 신호에서 시간·주파수 도메인 특징 추출"""
# 시간 도메인 특징
rms = np.sqrt(np.mean(vibration_signal ** 2))
peak = np.max(np.abs(vibration_signal))
crest_factor = peak / rms
kurt = kurtosis(vibration_signal)
# 주파수 도메인 특징
freqs, psd = signal.welch(vibration_signal, fs=sampling_rate, nperseg=1024)
dominant_freq = freqs[np.argmax(psd)]
band_energy = np.sum(psd[(freqs >= 1000) & (freqs <= 5000)])
return {
'rms': rms,
'peak': peak,
'crest_factor': crest_factor,
'kurtosis': kurt,
'dominant_freq': dominant_freq,
'band_energy_1k_5k': band_energy
}
실무 팁: 베어링 고장 진단에서는 첨도(Kurtosis)가 초기 결함 감지에 특히 효과적이다. 정상 상태에서 약 3.0인 값이 결함 발생 시 급격히 증가한다.
Digital Twin 엔진 설계
Digital Twin 엔진은 물리 모델과 데이터 모델을 결합한 하이브리드 모델로 구성하는 것이 가장 효과적이다.
물리 모델과 데이터 모델 비교
| 구분 | 물리 기반 모델 | 데이터 기반 모델 | 하이브리드 모델 |
|---|---|---|---|
| 장점 | 해석 가능성, 적은 데이터로 동작 | 복잡한 패턴 학습 가능 | 양쪽 장점 결합 |
| 단점 | 복잡한 시스템 모델링 어려움 | 대량 데이터 필요, 블랙박스 | 설계 복잡도 증가 |
| 적용 사례 | 파리-윌리스 법칙 기반 피로 수명 | LSTM/CNN 기반 패턴 인식 | 물리 잔차 + ML 보정 |
| 정확도 | 중간 | 높음 (데이터 충분 시) | 가장 높음 |
하이브리드 접근의 핵심 아이디어는 간단하다:
- 물리 모델로 기본 열화 경향을 예측한다
- 물리 모델의 예측값과 실제 관측값의 잔차(Residual)를 계산한다
- 데이터 기반 모델(ML/DL)이 이 잔차 패턴을 학습하여 보정값을 제공한다
실시간 RUL 예측 파이프라인
실시간 RUL 예측 파이프라인은 스트리밍 데이터를 처리하면서 지속적으로 잔여 수명을 갱신해야 한다.
파이프라인 구성 요소
Sensor → MQTT Broker → Stream Processor → Feature Store
↓
Digital Twin Engine (상태 갱신)
↓
RUL Predictor (추론)
↓
Alert Manager → Dashboard / MES
RUL 예측 모델 구현
import torch
import torch.nn as nn
class RULPredictor(nn.Module):
"""LSTM 기반 RUL 예측 모델"""
def __init__(self, input_dim, hidden_dim=128, num_layers=2, dropout=0.3):
super().__init__()
self.lstm = nn.LSTM(
input_size=input_dim,
hidden_size=hidden_dim,
num_layers=num_layers,
batch_first=True,
dropout=dropout
)
self.attention = nn.MultiheadAttention(hidden_dim, num_heads=4, batch_first=True)
self.regressor = nn.Sequential(
nn.Linear(hidden_dim, 64),
nn.ReLU(),
nn.Dropout(dropout),
nn.Linear(64, 1)
)
def forward(self, x):
# x shape: (batch, seq_len, features)
lstm_out, _ = self.lstm(x)
attn_out, _ = self.attention(lstm_out, lstm_out, lstm_out)
last_hidden = attn_out[:, -1, :]
rul = self.regressor(last_hidden)
return rul.squeeze(-1)
예측 결과 기반 의사결정 기준
| RUL 예측값 | 상태 | 조치 |
|---|---|---|
| > 30일 | 🟢 정상 | 정기 모니터링 유지 |
| 15~30일 | 🟡 주의 | 부품 발주, 정비 일정 수립 |
| 7~15일 | 🟠 경고 | 정비 일정 확정, 교대 근무 조정 |
| < 7일 | 🔴 위험 | 즉시 정비 실행, 대체 설비 가동 |
실무 적용 시 고려사항
데이터 품질 관리
- 센서 드리프트: 정기적인 센서 캘리브레이션과 드리프트 감지 알고리즘 적용
- 결측치 처리: 센서 고장 시 Digital Twin의 물리 모델로 가상 센서값 생성
- 라벨 부족: 고장 데이터가 부족한 경우 준지도 학습 또는 전이 학습 활용
모델 운영(MLOps)
- 모델 갱신 주기: 새로운 고장 이벤트 발생 시 온라인 학습 또는 주기적 재학습
- A/B 테스팅: 신규 모델 배포 전 섀도우 모드로 기존 모델과 병렬 비교
- 설명 가능성: SHAP 값을 활용해 RUL 예측에 기여한 주요 특징 시각화
Digital Twin은 한 번 구축하면 끝이 아니다. 설비가 노화하고 운전 조건이 변하면 모델도 함께 진화해야 한다. 지속적인 모니터링과 갱신 체계가 시스템의 성패를 좌우한다.
마무리
Digital Twin 기반 예지정비 시스템의 핵심을 정리하면 다음과 같다:
- 센서 융합은 특징 수준에서 수행하는 것이 실무에서 가장 균형 잡힌 접근이다
- 하이브리드 모델(물리 + 데이터)이 단일 모델보다 높은 예측 정확도를 제공한다
- 실시간 파이프라인은 스트리밍 아키텍처(MQTT + Stream Processor)로 설계해야 지연 없는 예측이 가능하다
- RUL 예측 결과는 단계별 의사결정 기준과 연동하여 실제 정비 행동으로 이어져야 한다
- 시스템 구축 후 지속적인 모델 갱신과 모니터링이 장기적인 성능 유지의 핵심이다
예지정비는 단순한 기술 도입이 아니라, 데이터 수집부터 의사결정까지 이어지는 end-to-end 시스템 설계가 필요한 영역이다. Digital Twin은 이 전체 과정을 하나의 프레임워크로 통합하는 강력한 도구다.
이 글이 도움이 되셨나요?
Buy me a coffee
답글 남기기