본문 바로가기

Data Analysis

나의 생활 데이터를 분석하라!

데이터를 분석하는 사람으로서 내 일상생활을 데이터로 남기고 그것을 분석해보면 어떨까 라는 아주 흥미로운 생각을 하게 되었습니다. 그래서 준비한 이번 포스트에서는 생활 데이터가 어떤 건지, 어떻게 모았는지 그리고 어떻게 분석했는지에 대해 알아보겠습니다.!

 

생활 데이터란, 일상에서 자주 하는 행동을 기록한 데이터입니다. 사람마다 기록하는 방식이 다르겠지만 저는 제가 자주 하는 행동 몇 가지를 1점부터 5점까지의 점수를 주어 평가를 하고 마지막에 종합적인 점수를 줍니다. 이 종합적인 점수를 통해 어떤 하루를 보냈는지 개괄적으로 알 수 있습니다. 저는 제가 매일하는 네 가지의 중요한 행동을 데이터로 쌓기 시작했습니다. 이 대표적인 4가지 행동은 운동, 공부, 독서, 잠입니다. 

 

이렇게 데이터를 모으다 보면 하루하루 자기를 평가하여 더 나은 하루를 보내려고 노력하게 됩니다. 또한 이렇게 모은 데이터를 분석하면 본인이 미처 생각지 못했던 문제를 발견하게 되고 개선점을 찾을 수 있습니다.

 

 

 

제가 모은 데이터는 총 141일 동안 모은 시계열 데이터이며,  첫 데이터를 모으기 시작한 날은 바로바로 올해 7월 3일이었습니다.(엄청 오래 모은 것 같은데..)

 

 

자, 그럼 저의 생활 데이터를 한번 탐색해보겠습니다.

컬럼별 요약 통계량

 

통계치를 보면 최하점(min)이 1점이고 최고점(max)이 5점인 것을 확인할 수 있습니다. 어떤 행동에 점수를 가장 짜게 주었는지 보니 책 읽기였습니다.! (독서합시다. 여러분.) 실제로 다른 행동에는 4점이나 5점을 많이 주었지만, 독서에는 3점을 가장 많이 부여한 것을 밑의 그래프를 통해 확인할 수 있습니다.

 

 

이번에는 표준편차(std)를 살펴보겠습니다. 표준편차란, 평균값에서 위아래로 값이 얼마나 퍼져있는지 나타내는 값입니다. 표준편차가 클수록 값에 업 앤 다운이 심하다는 뜻이겠지요?? 표준편차가 가장 심한 저의 행동은 바로 운동이었습니다.(꾸준히 운동합시다. 여러분)

 

그다음으로는, 평균값인데요. 평균값이 가장 높은 행동은 잠이었습니다. 여러분들 공부도 너무 중요하지만 잠도 잘 챙기십시오.! (저는 잠을 사랑합니다.)

 

잠 얘기가 나와서 그다음으로는 상관관계를 알아보겠습니다. 상관관계란, X가 증감할 때 y가 얼마나 증감하는 것을 나타내는 관계입니다. 말이 조금 어렵게 느껴지실 수 있는데 전혀 어렵지 않습니다. 예를 하나 들어보면, 종합 점수인 total 값이 결정되는데 가장 영향을 많이 미친 다른 행동을 말합니다. 

 

종합 점수가 1이라고 했을 때, 나머지 변수들의 점수를 보니 크게 상관관계가 있다고 말하기는 힘들겠지만 변수들 중에서 가장 큰 상관관계를 보인 것은 잠이었습니다. 저는 만족스러운 수면을 할 때 하루에 대한 만족도가 가장 높은 것 같습니다. 

 

전체 데이터의 평균을 그래프로 한번 보시겠습니다.

 

위의 그래프를 보면 위에서 언급했듯 수면 점수가 가장 높은 것을 확인할 수 있고 그다음으로는 공부와 종합점수가 뒤를 이었습니다. 운동과 독서는 더욱더 열심히 해야겠네요.!

 

마지막으로는 월별로 각 행동들의 평균을 plotting 해보았습니다.

눈에 띄는 행동과 월은 9월의 운동입니다. 이 달을 되새겨 보면 약 3주 안에 끝내야 했던 프로젝트를 미친 듯이 하고 있을 당시였습니다. 그래서 운동을 자주 못 갔어요..ㅠㅠ(비겁한 변명..) 아무튼 이렇게 데이터로 확인을 할 수 있어서 다시 한번 반성을 하는 시간을 가져봅니다. 확실히 프로젝트에만 몰두했던 기간에는 독서도 마찬가지로 오래 못하는 것을 알 수 있네요. 반대로 공부는 정말 잘했네요!(프로젝트를 하며 많이 배웠습니다. ㅎㅎㅎ) 

 

마치며..

 

이번 프로젝트를 통해서 깨달은 것은 저를 돌아볼 수 있는 정말 좋은 시간이 되지 않았나 라는 생각을 하게 됩니다.

또한 별다른 기술 없이도 이렇게 데이터 분석을 해볼 수 있다는 것을 알 수 있었습니다. 그러니 전공자가 아니더라도, 데이터 분석이 직업이 아니더라도 할 수 있으니 여러분도 이렇게 정량적으로 여러분의 삶을 돌아보세요! 준비물은 그저 꾸준히 데이터를 성실하게 모으는 것뿐이랍니다. 

 

이번 프로젝트를 통해서 보완하고 싶은 부분은 더 많은 행동에 점수를 주지 못했다는 점이 아쉬웠습니다. 그리하여 다음 시간에는 제가 장기적으로 혹은 단기적으로 하는 다양한 행동들을 keyword로 데이터를 남겨서 분석해보는 keyword 분석을 진행해보겠습니다. 그 날이 언제가 될지는 약속드릴 수가 없어요. 왜냐하면 지금부터 다시 데이터를 모아야 하니깐요.!

 

그럼 오늘도 멋진 하루를 보내세요~!