Selenium
thread를 사용한 데이터 수집
- 원래 파이썬 프로그램은 기본적으로 Single Thread 에서 실행됨. 즉 하나의 쓰레드가 순차적으로 코드를 실행함.
- 여기에서 별도의 쓰레드를 생성해 코드를 병렬로 실행하면 컴퓨터의 리소스가 허락하는 한도내에서 코드를 더 빨리 실행시킬수 있음.
Pickle
- 객체를 파일로 저장할때 직렬화(Serialization)라는 과정을 거쳐서 저장.
- 직렬화
- 객체(데이터타입)과, 저장되는 파일의(데이터타입)은 다릅니다.
- 서로 다른 데이터 타입을 맞춰주는 과정이 필요
- 파일을 읽고 저장하는데 속도가 더 빠릅니다.