데이터 분석/금융

환율, 유가 그리고 코스피

Miscellaneous MS 2025. 5. 7. 01:49

환율과 유가 정보를 가지고 코스피를 예측할 수 있을까

 

LSTM 을 통한 환율 예측

 

LSTM 을 통한 유가 예측

 

유가 정보를 활용하여 환율 예측

- 환율과 유가의 상관관계가 환율예측에 어떤 영향을 줄까

- 앞선 주가 예측과 마찬가지로 전날의 종가를 다음날의 가격으로 예측해버림

- 트랜스포머 활용

 

 

환율과 유가를 활용한 코스피 예측

 

 

- 전날의 종가를 다음날의 가격으로 예측 -> 예측으로의 의미가 없음

- 코스피 데이터를 사용하지 않고 예측을 한다면?

 

 

코스피 예측 - 코스피 정보 미사용

- 코스피 정보를 학습데이터에 사용하지 않음

- 환율과 유가가 코스피와 어느정도는 연동될 수 있고, 시기에 따라 그 정도가 다를 수 있다는점을 확인

 

 

더 많은 정보를 활용한 코스피 예측

- 환율, 유가정보 뿐 아니라 금시세, 미국채권, 변동성지수, 나스닥 정보까지 활용

- 너무 많은 Feature 로 인해 차원의 저주 발생

- 다양한 방법으로 학습시켜보았지면 전부 평균에 수렴하도록 학습되어버림.

 

 

코스피 정보까지 활용하여 학습

- 앞선 6개 데이터에 코스피 지수까지 학습시킨 결과

- 학습 모델을 조금 더 복잡하게 만듬

- 여전히 데이터의 차원이 높음

- 전일의 종가를 학습하지는 않지만, 더 학습되지도 않고 local minima에 빠짐

 

 

2D input feature 결과

 

 

- Input feature들을 단 2개, UP과 Down 으로 압축한다면 생각하고 차원을 2D 로 낮춤

  -> 많은 논문과 연구에서 사용하는 방법이지만, 과연 인공지능 모델도 같은 "생각"과 정보를 학습할까...?

  -> 어찌되었건 더 나은 결과로 돌아옴, 차원 문제 어느정도 해결

- 평균이 아니라 중간에 학습되었고, 후반에 예측이 되지 않는것을 볼 수 있지만 이전의 테스트들보다 좋은 결과를 보임

 

 

하이퍼 파라미터 수정 결과

- 어느정도 학습이 된다는것을 확인하였으니 모델과 하이퍼 파라미터를 수정

  -> input featue에 코스피는 제외

- 트랜스포머 구조에 이전보다 깊게 레이어를 쌓음, latent dim 도 높이고 lr 도 수정하고 이것저것 시도

- 이전의 다른 결과들보다 좋은 모습을 보이긴 함

- 여전히 미래 예측이 되지 않지만, 그 간격이 줄어듬

- 하이퍼 파라미터 보정 없이 좋은 결과를 내야하지만, 하이퍼 파라미터의 차이가 생각보다 큰것을 확인

  -> 하이퍼 파라미터에 독립적인 모델을 추구

  -> 하이퍼 파라미터를 바꿔가면서 더 좋은 결과를 볼 수도 있지만 여기까지만 시도하는거로...

 

 

결론

- 다양한 데이터와 변수를 활용한 시도

- 코스피에 영향을 끼치는 무수한 변수들을 몇가지 데이터를 통해 학습시킬 수 있다는것을 확인

  -> 예측에 가까운 결과는 아직 힘들지만, 어떤 변수와 어떤 관계성이 압축되어 존재

  -> 다양한 데이터를 통해 결국은 주가가 오를지 떨어질지 라는 결과로 나타남

  -> 더 정확한 예측을 위한 좋은 데이터와 변수를 걸러내는것도 가능

- 여기서 사용한 데이터 이외에도 다양한 변수들을 활용할 수 있어보임

- 생각보다 하이퍼 파라미터의 영향이 큼

- 복잡하지 않은 모델은 ChatGPT가 전부 해결해주기에 빠른 실험및 자동화가능성도 보임

 

 

 

P.S.

- 프로 버전을 사용하지 않기 때문에 ChatGPT4.5를 무제한적으로 쓸 수 없지만, 4o 보다 훨씬 강력할 뿐 아니라 퍼플렉시티와는 비교도 안되는 결과를 보여줌

  -> 심층리서치의 경우 브레인스토밍에는 효율적인것 같지만 결국 대화를 통해 결과를 도출해내는게 덜 답답.

  -> 4o의 경우 할루시네이션이 너무 심함, 최신 정보를 가져오지만 부정확 혹은 없는 출처

  -> 좋은 질문을 하면 해결된다고 하지만 좋은 질문을 하는것도 결국은 사람,
       인공지능에게 좋은 질문을 요구하여도 결국 질문의 시작점은 사람. 

  -> 영어로 물어보면 훨씬 좋은 결과를 제공

- MAE 를 통한 오차율이 옜날모델은 20% 요즘모델은 5% 라고 생각했을때 정밀한 공정이나 중요한 판단에 있어서 이 차이는 매우 크지만, 다양한 Decision 을 토대로 하나의 결과를 도출해낸다 가정할 때 다양한 모델이 나타낸 20% 오차율을 먼저 종합해서 5% 이하로 낮춘 다음 최신 모델을 활용한다면 더 낮은 오차율을 보이지 않을까 라는 아이디어에서 테스트중

 

'데이터 분석 > 금융' 카테고리의 다른 글

S&P 와 미국채  (0) 2025.05.17
Portfolio Management - 0  (0) 2025.05.16
환율, 유가 그리고 코스피 - 2  (0) 2025.05.14
미국채 데이터 활용 예시  (0) 2025.05.01
주가예측_test  (0) 2025.04.27