리서치/나름 리서치

빅데이터를 이용한 주가예측방법에 대하여 생각

storyy 2013. 10. 30. 15:40
728x90

친구로 부터 빅데이터를 이용하여 자문사를 만들어보자라는 제안을 받았다.(물론 이건 향후에 해볼까라는 내용)


어찌하면 빅데이터(주가자료관련 데이터 제외)로 예측할수있을까?


아니 HTS에서 구할수있는 데이터보다 더 시장을 분석하는데 더 요긴하게 쓰일까?


HTS에서 제공하는 기업뉴스의 수 (갯수) 보다 더욱 쓸모있는 자료가 나올까?


물론 HTS에서 기업뉴스의 수 보다는 많이 나올것이다.

하지만 빅데이터(트윗, 블로그의 자료, 여러 SNS에서 나오는 글)가 뉴스보다 더 정확할까?


솔직히 생각해보면 질적 측면을 생각해봤을때 뉴스가 더 좋다. 아니 유리하다.

하지만 빅데이터가 질적으로 유리할까?

물론 빅데이터 안에 뉴스라는 데이터가 들어간다면 말은 달라지겠으나 안들어갔다면 유용하나?


빅데이터를 주가예측에 사용할려면 여러 가정이 필요하다.

가정1: 빅데이터 안에는 여러 글 ex)SNS, 블로그, 댓글, 뉴스...등등 수많은 데이터가 들어가 있다.

가정2: 자료의 수집과 분석에는 비용이 들지 않는다. 즉 공짜

가정3: 모든 데이터가 실시간으로 빅데이터 안에 반영된다.

가정4: 모든 사용자가 (전 국민, 모든 사람) 빅데이터에 수집되는 여러 시스템(ex. SNS)을 사용한다.


이러한 가정은 준강형 효율적 시장가설을 더욱 정확하게 만들것이다.


이러한 가정으로 빅데이터를 주가예측모형을 만든다면

다시 여러 가정이 필요하다.

가정1: 빅데이터의 수치(계량된 정보)는 주가와 상관관계가 있다.

가정2: 빅데이터의 수치(계량된 정보)에서 중요한 정보를 catch 할 수 있다.


이러한 가정이 성립된다면


방법1: 빅데이터로 이동평균을 만든다.

빅데이터는 일정된 수준의 이동평균을 유지하는 성질을 가지고 있다. 라면

주가의 이동평균선 처럼 골든크로스, 데드 크로스를 이용하여 주식을 매매할수있다.

물론 이 이동평균이 주가의 이동평균보다 쓸모가 있을때 이 데이터는 쓸모가 있다.


방법2: 다우이론을 이용한 매매법

특정 주가의 빅데이터가 평균보다 그 이상으로 나올경우

일반투자자는 과열국면에서 주식매수에 확신을 가지므로

이때를 적극적 매도 타이밍으로 활용한다.


방법3: 빅데이터를 이용하여 매수의 힘과 매도의 힘을 분석한다.

좋고 나쁨으로 구분하여 매수의 힘과 매도의 힘을 이용한다면 괜찮은 타이밍을 맞출수있다.

물론 이런 데이터를 이용하여 향후 상승, 하락을 예측하는 지표를 만들수있다.

ex)(5일간 주식의 긍정적 데이터의 합계-5일간 주식의 부정적 데이터의 합계)/특정 주식에 대한 모든 데이터의 합 이런식으로 만들수있을듯?


빅데이터를 이용하여 주가예측모형을 만들때 가장 신경써야 할 부분은 시간이다.

빅데이터는 24시간 365일 나온다. 매일 매분 매초 마다 나온다.

하지만 주식데이터는 아침9시~오후3시이고 그것도 월~금 또 공유일, 특정 휴장일에는 데이터가 나오지 않는다.

빅데이터를 어찌 주식데이터에 적용하는가? 의 문제가 발생한다.

맞추기 위해서는 주식시간으로 나눠야 한다. 하지만 이것도 가장 그럴듯 해보이지만 여러 문제가 있다.

오후3~아침9시까지 빅데이터가 아침9시~오후3시 시장에 영향을 준다? 아닐수도 있고 맞을수도 있다.


빅데이터와 주식간의 상관관계를 알아내는 작업이 가장 중요하다.

또한 모든 기업의 빅데이터량이 너무 적으면 안된다.

데이터 자체의 량이 적으면 신뢰도가 낮다.

빅데이터도 기업마다 큰 차이를 보일것이다. 이것도 조정해야 할 수치이다.


만든다면 먼저 코스피에 포함된 모든 기업의 빅데이터를 이용하여 주가지수 처럼 인덱스를 만들어야 한다.

하지만 사람들이 흥미없는 기업의 빅데이터는 많이 부족할것이다.

따라서 만든다면

코스피200에 포함된 기업에 관한 빅데이터로 인덱스를 만들어야한다. 이것마져 불가능하다면

빅데이터를 이용하여 주가예측하기에는 다소 무리가 있다.

기본적 인덱스 지수 없이 만든 지표는 기업마다 큰 차이가 존재할것이므로

자료의 신뢰성은 부족할 것이기 때문이다.

728x90
728x90