대조학습 방법을 이용한 주행 패턴 분석 기법 연구

June 1, 2023

프로젝트 요약

개요: 스마트폰 센서 기반 주행 시계열에서 시간 일관성 대조학습으로 변화점 탐지와 소량 레이블 분류를 수행한 연구
기간: 2023.11, 한국ITS학회논문지 2024년 2월 게재
데이터: Ferreira et al. 공개 스마트폰 주행 데이터셋, 대조학습 913개 세그먼트, 분류 학습 58개/검증 61개 세그먼트
기술 스택: Contrastive Learning, InfoNCE, STFT, Lightweight CNN, SVC, Change Point Detection
성과(성능): 변화점 탐지 precision 0.92(RegNet), 분류 precision/recall 1.0(SqueezeNet), Best Paper Award 수상

문제 정의

스마트폰 센서로 수집한 주행 데이터를 바탕으로, 레이블이 거의 없는 환경에서도 주행 패턴의 변화점을 탐지하고 소량의 레이블 데이터만으로 분류까지 확장할 수 있도록 설계한 연구입니다. 핵심은 지도학습에 의존하지 않고, 시간 축에서의 일관성을 기준으로 대조학습을 수행해 주행 데이터의 표현을 먼저 학습한 뒤 이를 변화점 탐지와 패턴 분류에 재사용하는 것입니다.

학습 파이프라인

레이블이 없는 데이터로 표현을 먼저 학습하고, 이후 소량의 레이블로 분류를 확장하는 2단계 구조입니다.

전처리

스플라인 보간, 이벤트 중심 슬라이싱, STFT 변환을 적용해 주행 시계열을 시간-주파수 표현으로 정리합니다.

대조학습

시간적으로 가까운 구간은 positive pair, 먼 구간은 negative pair로 두고 InfoNCE loss로 특징 표현을 학습합니다.

분류 확장

사전학습된 특징 추출기를 고정한 뒤, 32차원 특징 벡터에 SVC를 붙여 소량 레이블 조건에서 분류를 수행합니다.

시간 일관성 대조학습 개요 — 시간적으로 가까운 세그먼트를 positive pair, 멀리 떨어진 세그먼트를 negative pair로 두어 레이블 없이 주행 패턴 표현을 학습하는 구조입니다.

접근 방법

전체 프레임워크는 2단계로 구성됩니다. 먼저 레이블 없는 데이터로 변화점 탐지를 위한 표현을 학습하고, 이후 소량의 레이블 데이터로 분류기를 학습합니다.
대조학습 단계에서는 시간적으로 가까운 구간을 positive pair, 먼 구간을 negative pair로 두는 time consistency 전략을 사용했습니다.
특징 벡터 간 유사도는 cosine similarity로 계산하고, 손실 함수는 InfoNCE loss를 사용해 유사한 구간은 가깝게, 다른 구간은 멀어지도록 학습했습니다.
변화점 탐지는 학습된 특징 공간에서 현재 구간과 과거 구간 사이의 코사인 유사도가 임계값 이하로 떨어질 때 발생한 것으로 판단했습니다.
분류 단계에서는 사전학습된 딥러닝 모델을 특징 추출기로 고정하고, 추출된 32차원 특징 벡터 위에 SVC를 학습하는 하이브리드 구조를 사용했습니다.

대조학습 기반 주행 패턴 분류 프로세스 — 사전학습된 백본은 특징 추출기로 사용하고, 작은 수의 레이블 세그먼트는 SVC 분류기에 연결해 소량 레이블 조건에서의 분류 성능을 확인했습니다.

표현 학습 관점

레이블 대신 시간 일관성을 학습 신호로 사용해, 데이터 자체에 들어 있는 주행 패턴 변화를 먼저 익히도록 설계했습니다.

실전 적용 관점

경량 백본과 소량 레이블 조건을 함께 검증해, 스마트폰 기반 운전자 보조 시스템으로 확장 가능한 구성을 지향했습니다.

데이터와 EDA

데이터셋은 Ferreira et al. (2017)의 공개 스마트폰 기반 운전 데이터셋을 사용했습니다.
사용 센서는 가속도, 선형가속도, 자기장, 각속도이며, 각 운전자는 13분씩 4회 주행하며 특정 이벤트를 수행했습니다.
전처리는 스플라인 보간, 이벤트 구간 중심 슬라이싱, STFT(Short Time Fourier Transform) 순서로 진행해 시간-주파수 특성을 함께 반영했습니다.
대조학습 단계에서는 레이블을 제거한 전체 913개 세그먼트를 사용했고, 분류 단계에서는 58개 세그먼트로 학습, 61개 세그먼트로 검증했습니다.
일반화 성능을 보기 위해 학습 차량과 검증 차량을 다르게 분리했습니다. 즉, 동일 차량 분포에만 맞춘 모델이 아니라 차량이 달라져도 유지되는 표현 학습 성능을 보려는 설계입니다.
경량 백본으로는 SqueezeNet, ShuffleNet, RegNet, MobileNet, EfficientNet, MnasNet의 6개 모델을 비교했습니다.

스마트폰 주행 센서 데이터의 STFT 시각화 — 시계열 센서 신호를 STFT로 변환해 시간에 따른 주파수 변화를 함께 보도록 구성했습니다. 이 표현을 통해 급격한 주행 이벤트와 완만한 구간의 차이를 더 뚜렷하게 다룰 수 있었습니다.

성과(성능)

변화점 탐지에서는 대부분의 모델이 코사인 유사도 임계값 0.4에서 가장 좋은 정밀도를 보였습니다.
변화점 탐지 최고 성능은 RegNet이 기록했으며, 정밀도는 0.92였습니다.
분류에서는 SqueezeNet이 정밀도 1.0, 재현율 1.0으로 가장 높은 성능을 보였습니다.
RegNet도 정밀도 0.956, 재현율 0.951로 높은 성능을 보였고, ShuffleNet 역시 정밀도 0.886, 재현율 0.869를 기록했습니다.
반면 MobileNet, EfficientNet, MnasNet은 상대적으로 성능이 낮았고, 특히 MnasNet은 본 태스크와 네트워크 최적화 방향의 차이로 인해 학습이 충분히 이뤄지지 않은 것으로 해석되었습니다.
클래스별 레이블 수가 30개 내외로 매우 적은 조건과, 학습/검증 차량이 서로 다른 조건에서도 유의미한 분류 성능을 보였다는 점이 중요한 결과입니다.

사용 기술

Contrastive Learning
Self-Supervised Learning
Time Consistency Learning
STFT
Change Point Detection
SVC
Lightweight CNN Backbones

포트폴리오 관점의 의미

이 연구의 강점은 라벨이 부족한 주행 데이터 문제를 단순 분류가 아니라 표현 학습 + 변화점 탐지 + 소량 레이블 분류의 구조로 다시 설계했다는 점입니다. 특히 변화점 탐지를 먼저 학습한 뒤 같은 표현을 분류에도 재활용함으로써, 실제 데이터 수집 환경에서 더 현실적인 접근을 제시했습니다.

또한 스마트폰 탑재를 고려한 경량 모델들을 비교했다는 점도 의미가 큽니다. 정확도만 보는 것이 아니라 메모리와 연산량을 함께 고려해, 이후 모바일 기반 운전자 보조 시스템이나 실시간 주행 분석 시스템으로 확장할 수 있는 기반을 만들었다고 볼 수 있습니다.

느낀점

이 프로젝트에서 특히 인상적이었던 부분은, 같은 대조학습 프레임워크를 유지하더라도 어떤 백본을 쓰느냐에 따라 변화점 탐지와 분류 성능이 꽤 크게 달라졌다는 점이었습니다. SqueezeNet, ShuffleNet, RegNet, MobileNet, EfficientNet, MnasNet처럼 여러 경량 모델을 직접 바꿔가며 실험해 보면서, 단순히 가벼운 모델이면 모두 비슷하게 동작하는 것이 아니라 각 아키텍처가 특징을 추출하는 방식과 태스크 적합도가 결과에 큰 영향을 준다는 점을 체감했습니다.

또한 이 과정을 통해 모델 하나의 성능만 보는 것이 아니라, 백본 선택 자체가 연구의 중요한 변수라는 점을 더 분명하게 배웠습니다. 어떤 모델은 매우 적은 레이블 환경에서도 강한 일반화 성능을 보였고, 어떤 모델은 같은 설정에서도 학습이 잘 되지 않았기 때문에, 실제 적용을 생각하면 정확도와 함께 안정성, 연산량, 도메인 적합성까지 같이 봐야 한다는 점이 남았습니다. 개인적으로는 여러 백본을 직접 바꿔가며 결과 차이를 확인한 경험이, 경량 모델 설계와 실전 배포 관점을 함께 이해하는 데 큰 도움이 되었습니다.

논문 정보

“대조학습 방법을 이용한 주행 패턴 분석 기법 연구”
한국ITS학회논문지, 23권 1호, 182-196, 2024
DOI: 10.12815/kits.2024.23.1.182
원문 PDF: 한국ITS학회논문지 2024 논문 PDF 열기