# response.content로 내용 선택, html.parser로 HTML로 파싱 dom = BeautifulSoup(response.content, "html.parser")
bs4.BeautifulSoupr
select 매서드 : 여러개의 element 객체를 리스트로 가져옴 select_one 매서드 : 하나의 element 객체를 가져옴
1 2 3 4 5 6 7 8 9
# 크롬 개발자 도구에서 copy selector했을때 id가 나올때 까지 찾아 복사함 # 리스트안의 딕셔너리 형태로 만들어줌{"컬럼명":내용} datas = [] for element in elements: datas.append({ "title": element.select_one('.tit_g').text.strip().replace("\n",""), #tit_g이름의 클래스 안에 텍스트를 잡음 "link" : element.select_one('a').get("href"), #href속성의 값을 가져옴 }) article_df = pd.DataFrame(datas)