메인메뉴로 이동 본문으로 이동

컨텐츠 내용

  1. 캠퍼스소개
  2. 프로젝트 스토리

프로젝트 스토리

프로젝트 스토리 조회 페이지
IoT센싱데이터의 머신러닝 위험 감지 및 예측 모델링 데****스 / 2020.02.11
[3]picture01.png [3]picture02.png

 

 

▶ 프로젝트 배경


정부와 공공기관에서 빅데이터와 인공지능을 도입하려고 하는 가장 핵심적인 분야는 '재난/안전'입니다. 그래서 중앙정부뿐만 아니라 각 지자체에서도 빅데이터와 인공지능을 활용하여 위험을 모리터링, 감지하고, 이에 대한 적절한 대응을 할 수 있는 시스템을 도입하려고 노력하고 있습니다. 그러나 안전 분야의 전문적인 빅데이터 분석업체가 없다보니 공공기관에서는 이러한 사업을 진행하는 데에 어려움을 겪고 있습니다. 혹여 빅데이터 사업을 계획하거나 운영한다면 '재난/안전'에 특화된 전문적인 데이터 및 경험을 축적한다면 충분히 승산이 있을리라 봅니다.

 

본 프로젝트는 지자체 중 고층건물이 많은 도시에서 연구한 것입니다. 고층건물의 다양한 위험상황(화재, 지진 등)을 센서로 상시 모니터링 하고, 이에 대한 위험 감지를 위해 상황별로 지속적인 학습 데이터를 제공하여, 궁극적으로는 재난/위험 상황에 대한 신호를 감지하는 인공지능 모델링을 구현하는 것입니다.

 

본 과제뿐만 아니라 다른 데이터 사이언스 프로젝트가 그렇듯이 '데이터'가 충분히 주어져여 좋은 모델을 만들 수가 있습니다. 그러나 본 프로젝트는 IoT 센서로부터 누적된 데이터가 없이, 사업 과정에서 센서를 달고 시작해야 했습니다. 즉 데이터가 없는 상황에서 머신러닝/딥러닝 기법을 적용하여 최적의 재난/안전 상황 모니터링 및 예측 모델링을 해야 하는 과제였습니다.

 

▶ 주요 결과물


 

일반적으로 센서를 이용한 모니터링 및 예측은 아래와 같은 프로세스로 진행됩니다. 

데이터 수집: 다양한 센서(온도, 습도, 진동 등) 혹은 복합센서를 건물이나 해당 지역에 달고 이 데이터를 실시간으로 서버에 받습니다. 서버에 들어오는 데이터는 아직 분석에 맞게 정제되지 않는 경우가 많기 때문에 변수 단위서 parsing을 통해 DB에 저장을 하게 됩니다. 여기서 센서를 어떻게 달아야 하는가 어떻게 서버로 전송받는가 등 이러한 경험이 없을 경우는 난감할 수 있습니다. 그러나 의외와 품질 좋은 센서는 이미 서버와의 통신모듈을 가지고 있기 때문에 센서를 달면 바로 지정된 서버에 잘 저장이 됩니다. 다만 저장시간단위를 얼마로 할 것인가(초, 분 등)는 서버용량 및 감지의 민감성 등을 고려하여 조정해야 하며, 이 역시 센서 모듈에서 조정할 수 있습니다. 

데이터 전처리: 이렇게 DB에 쌓인 센서 데이터를 바로 인공지능 분석법(머신러닝/딥러닝)에 적용하면 안됩니다. 왜냐하면 데이터 변수의 단위가 모두 다르기 때문에 데이터의 단위를 표준화 또는 정규화하는 방법을 거쳐서 단위를 동일하게 해야 합니다. 

모니터링: 모니터링은 단일 변수에 대한 모니터링과 다차원 축소과정을 거친 다변수 모니터링이 동시에 이루어져야 합니다. 즉 온도, 습도, 진동 등 각각의 데이터를 시각적으로 혹은 수치로 확인하면서 정상적인 범위에 있는지를 파악함과 동시에 온도+습도+진동 등을 통합한(이를 데이터분석에서는 차원축소: dimension reduction이라고 합니다) 시각화 혹은 수치의 확인이 필요합니다. 이유는 각 단일 측정치도 중요하지만 위험과 재난이라는 것은 특정 변수에서 감지되지 못하지만 여러 상황(예를 들어 진동이 발생하면서 먼지가 많아진다=지진 위험 초기 예측 등)을 통해서 더욱 빠르게 감지될 수 있기 때문입니다.

예측: 좋은 예측 모델링 결과는 한 번에, 하나의 알고리즘만을 적용해서 얻어질 수 없습니다. 다양한 알고리즘을 적용하면서 그 중 예측이 최적인 대안적 알고리즘을 선별하는 과정이 여러 상황에서, 여러 데이터에서 확인되어야 합니다. 이러한 과정을 통해서 2~4개의 예측모델링이 최적의 결과를 보인다면, 이중 1개 또는 2-3개의 별도 알고리즘으로 재난 상황을 상시적으로 예측할 수 있는 별도의 예측 모델링을 두는 것이 좋습니다.

 

picture01.png

 

 위에서 언급한 프로세스를 좀 더 직관적으로 도식화하면 아래와 같이 정리할 수 있을 것입니다.

 

picture02.png

 

 

▶ 프로젝트 뒷 이야기

 

 

본 프로젝트에서 가장 어려운 부분은 '기존에 확보된 센서 데이터가 없다'는 것이었습니다. 이에 과업 기간 내에 시뮬레이션을 할 수 있는 상황을 다양하게 만들어, 예를 들어 센서가 부착된 지역에서 담배를 피운다든지, 불을 질러본다든지 등 다양한 상황을 학습시켜야 했습니다. 이것이 실제 상황과 유사하게 하기 위해서는 안전장치를 마련한 상태에서 다양한 상황을 센서를 통해 데이터 학습을 시키는 것이 중요합니다.

 

아무리 좋은 알고리즘도 데이터가 없으면 쓸모가 없습니다. 알고리즘이 요리 레시피라면 데이터는 요리 재료입니다. 훌륭한 레시피라도 재료가 신선하고 좋아야 맛있는 요리가 됩니다. 따라서 앞으로의 시대를 데이터의 시대라고 하는 것도 알고리즘은 공부를 하든 인력을 구하든 간에 상대적으로 쉽게 확보할 수 있지만, 데이터는 오랜 기간 동안 꾸준이 축적되고 이를 가치있게 만드는 것이 핵심이기 때문입니다. 

 

데이터분석을 학습하시면서, 동시에 여러분들이 가지고 있는 혹은 마련할 수 있는 '데이터 사업'도 같이 고민하시기 바랍니다. 

데이터가 돈인 세상이 곧 옵니다.

 

 

read 페이지 바
이전 글 이전 글이 없습니다.
다음 글

바이오메디컬산업 육성산업 발굴 프로젝트

 파일첨부  
2020.02.11