웹 개발/크롤링

[웹크롤링] 01. URL 포맷하기

내만 2022. 9. 15. 16:18
728x90
반응형

 

 

 

 

 

🙆‍♂️ URL Formatting


먼저 URL Format을 해줘야 합니다.

https가 있어야 웹 사이트 이동이 가능합니다.

 

그래서 https가 붙어있는 string은 그냥 이동하고 아니라면 https를 붙여서 이동해주는 작업이 필요합니다.

 

webs=(
    "google.com",
    "airbnb.com",
    "https://www.naver.com",
    "twitter.com"
)


for web in webs:
    if web.startswith("https://"):
        print(True)
    else:
        print(False)

우선 위의 코드를 보면 webs 튜플에 website들이 등록되어 있습니다.

그 밑에 for문을 보면 webs의 데이터들을 startwith 이라는 메소드를 통해서 값이 https://로 시작한다면 True

아니라면 False를 출력하는지 확인해봅니다.

 

필터가 잘 되는 모습입니다.

더 코드를 줄여보려면

 

for web in webs:
    if not web.startswith("https://"):
        print(False)

이렇게 줄일 수도 있습니다.

그럼 이제 URL formatting을 해봅시다.

 

for web in webs:
    if not web.startswith("https://"):
        web = f"https://{web}"
    print(web)

if문을 사용해서 https://로 시작하지 않다면 그 데이터(web)에 앞에 https://를 추가하도록 하고

다 출력해보는 for문입니다.

잘 적용 됩니다.

 

 

 

728x90
반응형