728x90
반응형
🙆♂️ URL Formatting
먼저 URL Format을 해줘야 합니다.
https가 있어야 웹 사이트 이동이 가능합니다.
그래서 https가 붙어있는 string은 그냥 이동하고 아니라면 https를 붙여서 이동해주는 작업이 필요합니다.
webs=(
"google.com",
"airbnb.com",
"https://www.naver.com",
"twitter.com"
)
for web in webs:
if web.startswith("https://"):
print(True)
else:
print(False)
우선 위의 코드를 보면 webs 튜플에 website들이 등록되어 있습니다.
그 밑에 for문을 보면 webs의 데이터들을 startwith 이라는 메소드를 통해서 값이 https://로 시작한다면 True
아니라면 False를 출력하는지 확인해봅니다.
필터가 잘 되는 모습입니다.
더 코드를 줄여보려면
for web in webs:
if not web.startswith("https://"):
print(False)
이렇게 줄일 수도 있습니다.
그럼 이제 URL formatting을 해봅시다.
for web in webs:
if not web.startswith("https://"):
web = f"https://{web}"
print(web)
if문을 사용해서 https://로 시작하지 않다면 그 데이터(web)에 앞에 https://를 추가하도록 하고
다 출력해보는 for문입니다.
잘 적용 됩니다.
728x90
반응형
'웹 개발 > 크롤링' 카테고리의 다른 글
[웹크롤링] post방식 requset 웹 크롤링하기 (1) | 2022.09.30 |
---|---|
[웹크롤링] 04. beautifulSoup 좀더 자세히 (0) | 2022.09.21 |
[웹크롤링] 03. beautifulsoup4 (0) | 2022.09.17 |
[웹크롤링] 02. requests 라이브러리 (0) | 2022.09.15 |