Capstone

데이터 모델링

이타심 2021. 10. 12. 21:44
728x90
데이터 모델링

#시작하며

지난번 포스팅까지, 기존 나선 그리기 검사 Raw data를 가지고 ED, Error Distance 값을 증감시키는 데이터를 생성해보았다. 하지만 해당 데이터는, 앞서 말했듯이 실제 사람이 측정한 Raw data와는 많은 이질감이 있었고, Error를 더 높일수록 그 이질감은 비례해서 증가했기 때문에 실제 Raw data의 모습과 유사한 데이터 샘플 생성을 목표로 프로젝트를 이어 진행하였다.

 

 

#데이터 생성

먼저 Raw data를 기준으로 데이터를 증감시킬수 있는 방법에 대해 생각해 보았다. 기존 데이터를 바탕으로 데이터의 Error 정도를 증감시킬 수 있는 방법은 2가지로 판단된다.

데이터의 Error 증감을 위한 두가지 방법

위 그림에 보이는 Case1, Case2를 생각할 수 있었다. 먼저 Case 1의 경우, 왼쪽에 보이는 Raw data의 파형에 대해, 동일한 진동수를 n배만큼 가지는 Data 생성을 생각하여 고안하였다.

진동수 n배

Raw data의 곡선을 직선으로 펼쳤다고 가정했을 때, BaseLine과 맞닿은 Pair값 을 기준으로 그 사이 ★의 pair값을 계산하여 동일하게 설정한 배수만큼 진동하도록 변화시키는 것이다. 하지만 해당 논리의 문제점은, 기존의 Error Distance를 구하는 방식이 모든 Pair값들의 차이 값의 평균을 구한다는 것이다.

즉 진동수를 늘려 n배의 ED값을 구했다 하더라도, 그만큼 Pair 역시 n배가 되기 때문에 최종적은 ED결과 값은 변화가 없다는 것이다. 

 

따라서 진동수를 증가시키는 방법은 제외하고, 진폭을 증가시키는 방향을 중점적으로 채택하여 모델링을 진행하였다.

 

  • 진폭의 증가

진폭 n배

앞서 설명한 진동수의 변화의 문제점으로 인해, 진폭을 변화시키는 방법에 대해 중점적으로 진행하였다. 진동수 증가의 경우와 달리, 해당 진폭의 변화는 Pair의 수가 일정하게 유지되면서 ED의 값이 변화되기 때문에, 진동수에서 봉착했던 문제점에 대해서는 무리 없이 진행할 수 있었다. 위 그림과 같이 진폭을 증가시키는 방법은 다음과 같다.

진폭의 n배 증가 원리

위 그림은 진폭의 변화를 발생시키는 방법에 대해 고안한 설계도이다. 먼저, Raw data의 모든 Pair가 원점을 기준으로 특정한 기울기를 가지고 있으며, 원점과 동일한 직선 상에 존재한다는 것을 베이스로 하여 진행하였다.

왼쪽의 그림에서 모든 측정 데이터는,

  1. 원점을 기준으로 일정한 1차 방정식을 생성할 수 있고, 

오른쪽의 그림에서,

  1. 왼쪽의 그림에서 구한 1차 방적식과의 동일 선상에 존재하는 좌표 점 중, (a, b)와의 거리가 n만큼 떨어진 좌표 (k, z)를 구함으로써, 진폭의 증감을 발생시킬 수 있다.

 

#비교분석

Raw data의 Error를 손으로 그린 경우

위 그림에서 나타나는 데이터는, 앞서 제시한 Raw data를 기준으로 Error가 발생하는 경우에 대한 결과 값을 모색하기 위해, 손으로 직접 그린 Error가 추가된 Raw data의 모습을 나타낸다. 서두에서 언급했듯이 모델링의 결과로써 표현되는 데이터 값은, 사람이 직접 그린 것처럼 이질감이 없는 데이터이기 때문에, 진폭 변화의 결과로써 위 그림과 같은 데이터 결과가 도출되어야 할 것이다.

짝수 index 진폭의 변화

하지만 위 그림에서도 나타나듯이, 단순히 각 Pair값을 기준으로 진폭의 값을 증가시키면, ED는 증가하지만 이질감 있는 데이터가 생성된다.

곡선형태의 진폭 형성

따라서 위에서 언급했던 진폭을 변화시키는 방법에 더하여, 추가적으로 증가시키는 진폭의 값을, 기존 Raw data가 가지고 있는 ED값에 비례하여 Error를 발생시켜 곡선 형태의 증가된 진폭값을 도출하였다.

적용한 결과 값

따라서, 해당 방법들을 모두 적용하여 Plot한 결과, 위 그림과 같이 보다 이질감을 줄이고 사람이 직접 그린 데이터와 유사한 형태의 데이터를 생성할 수 있었다.

n값의 변화에 따른 Error의 증감

 

#마치며

이번 포스팅까지, 이질감이 없는 데이터를 모델링하는 것을 목표로 연구를 진행하였다. 어느 정도 곡선의 형태를 가지게 된 데이터 모델을 가지고 다음 포스팅부터 공부하며 연구할 주제들은 아래와 같다.

  1. 0~3Hz의 운동성분에 대하여 위 방법을 적용한 Error 발생
  2. 기존의 방법에서 디벨롭하여, Error가 일정하지 않고, 랜덤 하게 나타나는 경우와, 점진적으로 증가하거나 감소하는 경우에 대해서 생각

혼자서 하는 연구가 힘들지만 앞으로도 꾸준히 노력하여 좋은 결과물이 나타나는 학기가 되었으면 좋겠다.

728x90

'Capstone' 카테고리의 다른 글

Make new data sample  (0) 2021.10.27
Way of Modeling  (0) 2021.10.17
포스트 캡스톤의 시작  (0) 2021.10.11
KCC 2021 학부생 논문 부분 우수상 수상  (1) 2021.07.30
캡스톤 프로젝트  (0) 2021.07.30