최근 포스트

[Python 재무제표 크롤링 #5] txt to tsv 자동화

February 20 2020

OpenDART에서 제공해준 API들을 추가적으로 조사해보다가, 굳이 기업별로 재무정보를 확인할 필요 없이 상장되어 있는 전체 기업들의 재무정보를 한꺼번에 확인할 수 있는 txt파일의 다운로드를 제공한다는 것을 확인했다. 얼마전 차장님께서 진행해주신 ERP 관련 교육 때, ERP...

[Python 재무제표 크롤링 #4] 뒤집힌 프로젝트

February 12 2020

2020년 1월 22일 기준 전자공시사이트(dart.fss.or.kr)에서 신규API사이트 오픈을 공개했다. 그간 개발해온 프로젝트와 동일한 목적을 이루는 API 또한 존재하는 걸 확인했고, 이를 테스트 해본 결과 더 양질의 결과물을 얻을 수 있는 것을 확인했다. 그렇다....

마크다운과 HTML

February 04 2020

마크다운(MarkDown)이라는 이름이 HTML(Hyper Text Markup Language)과 같은 마크업 언어의 종류인데 말장난스럽게 지은 이름이라는 것까지는 알고 있었다. 이러한 특성 때문에 마크다운 문법으로 문서를 작성하면 HTML로 자동 변환되어 글이 적힌다는 것 ...

[Python 재무제표 크롤링 #3] 분기점 세분화 및 예외처리 시작

January 17 2020

저번 포스팅까지 작성된 코드에서는 연결 재무상태표에 대한 정보만을 다루었다. 이번에는 (개별) 재무상태표의 정보까지 다루기 위해 연결 재무제표와 (개별) 재무제표를 구별할 수 있는 분기점을 설계 및 보완하고, 기업별로 들쭉날쭉한 사업보고서 양식을 커버할 수 있는 방법에 대해 고...