토이프로젝트

주식 자동거래(1) - 데이터 수집

신랑각시 2022. 8. 1. 18:39

자동 거래를 통해 수익을 올리려면 전략(알고리즘)이 필요하다.

또한, 손해보지 않고 자본을 지키는 것도 역시 전략에 따른다.

 

거래 전략을 세운 후에는 시험이 필요하다. 바로 돈을 넣고 실전을 통해 전략을 조정하는 것은 위험이 너무 크다.

따라서, 거래 전략을 시험하기 위해, 먼저 데이터 수집이 필요했다.

 

데이터 수집은 다음과 같이 하였다. (22년 08월 01일 기준)

 

1. 코스피, 코스닥 각 거래소 종목을 구분하여 수집 (코스피: 781 종목, 코스닥: 1,398 종목)
2. 관리종목, 거래정지, 거래 중단 제외,  권리락, 배당락, 분배락 등 기타 락 종목 제외
3. 08:20분 ~ 16:10까지 5초 간격으로 수집
4. 코스피 1일 데이터 SIZE : 약 1.5G (압축 600 M)
5. 코스닥 1일 데이터 SIZE : 약 2.6G (압축 1.0 G)

 

수집한 항목은 아래와 같다. (대신증권 사이보스 CpSysDib.MarketEye 활용, 총 57 항목)

 

'종목코드', '시간 hhmm', '대비 부호 (1:상한, 2:상승, 3:보합, 4:하한, 5:하락)', '전일대비', '현재가', '시가', '고가', '저가', '매도호가', '매수호가', '거래량', '거래대금(원)', '장구분(0:장전, 1:동시호가, 2:장중)', '총 매도호가잔량', '총 매수호가잔량', '최우선 매도호가잔량', '최우선 매수호가잔량', '종목명', '총 상장주식수', '외국인 보유비율', '전일 거래량', '전일 종가', '체결강도', '체결 구분(1:매수체결, 2:매도체결)', '19 일종 가합', '상한가', '하한가', '매매수량단위', '시간 외 단일 현재가', '시간 외 단일 시가', '시간 외 단 일고가', '시간 외 단일 저가', '시간 외 단일 매도호가', '시간 외 단일 매수호가', '시간 외 단일 거래량', '외국 인순 매매(주식수)', '52주 최고가', '52주 최저가', '시간 외 매수잔량', '시간 외 매도잔량', '자본금(백만)', '4 일종 가합', '9 일종 가합', '프로그램 순매수', '당일 외국인 순매수', '당일 기관 순매수', '전일 외국인 순매수', '전일 기관 순매수', '공매도 수량', '59 일종 가합', '119 일종 가합', '당일 개인 순매수', '전일 개인 순매수', '5일 전 종가', '10일 전 종가', '20일 전 종가', '60일 전 종가', '120일 전 종가'

 

생각보다 데이터 사이즈가 컸다.

수집하는 종목 중에는 실시간으로 변하지 않는 값들도 존재한다. 하지만 RAW 데이터라고 생각하고 수집할 계획이다.

 

 

5초 단위로 수집하는 이유

 

개인의 주식 자동매매는 단기매매에 그 장점이 있다고 생각한다.

시황을 해석하고 회사의 비전 및 실현 가능성을 판단하여 투자하는 것은 사람들이 잘한다. (사람보다 더 잘할만한 알고리즘을 나는 못 만든다.)

 

기술적 분석이 오래전부터 있었다는 것은 분명 거래 및 가격 추이 분석을 통해 수익을 올릴 수 있다는 증거라고 생각한다.

지금까지 기술적 분석의 시간 단위가 사람이 다룰 만한 단위였다면, 알고리즘에 의한 자동매매는 더 짧은 단위의 시간을 다룰 수 있다.

 

내가 시험한 바에 의하면 국내 상장 종목 데이터(현재가, 매수/매도 호가, 거래량 등)를 모두 수집하는데 가장 짧은 시간 단위는 5초다.

따라서, 5초 단위의 데이터를 수집하게 되었다.

 

데이터만 있으면 언제 어디서든 짧은 시간 안에 아이디어를 검증할 수 있을 것이다. 

 

시황이나 국내외 정세, 사회 변화를 배제한 기술적 분석을 시도하는 것으로 데이터만 있으면 2022년도 2023년에도 유의미한 데이터일 것으로 기대한다.

 

 

 

다음글:주식 자동거래(2) - 만만치 않다

 

주식 자동거래(2) - 만만치 않다

데이터 수집은 순조롭다. 08월 01일(월)부터 08월 17일(수) 순조롭게 데이터를 쌓아가고 있다. 1일 2개(코스닥, 코스피)씩 파일을 쌓고 있다. 데이터는 Azure Windows 서버에서 생성하여, Windows 서버와 네

jhchoi-ag.tistory.com