[구글스프레드시트] IMPORTXML()함수를 통한 로또번호 웹클로링

in kr-dev •  5 years ago  (edited)

[구글스프레드시트] IMPORTXML()함수를 통한 로또번호 웹클로링


오늘은 그냥 재미로 웹클로링 놀이를 하는데 어떤 데이터를 읽어올지 고민하다가 재미로 로또 번호를 추출해보는 걸 한번 해보았네요. IMPORTXML()함수는 구글스프레드시트에서 제공되는 강력한 함수로 쉽게 특정 웹 페이지의 데이터를 읽어 올 수 있는 함수입니다. 한번 실험해 보도록 하죠.

1. IMPORTXML()함수


a2.jpg


  • IMPORTXML("풀주소","검색할위치")

딱 두개의 인자값을 지정해 주면 해당 데이터를 읽어 올 수 있습니다.

2. 로또번호 웹클로링


a3.jpg

로또번호 페이지를 위와 같이 열었을 때 URL 주소와 읽어올 로또번호 영역을 구분해 놓습니다.

URL은 그대로 주소를 가져오면 되고 읽어 올 데이터 위치는 아래 그림처럼 복사해 옵니다.

a11.jpg

URL  : https://search.daum.net/search?nil_suggest=btn&w=tot&DA=SBC&q=%EB%A1%9C%EB%98%90+%EB%B2%88%ED%98%B8

검색 할 위치(copy XPath) : //*[@id="lottoColl"]/div[2]/div/div[2]/div[1]

URL을 그냥 복사하면 "q="이하 한글은 뭔가 특수 기호들로 합쳐진 문자열이 나오게 됩니다. 그대로 사용해도 되고 그 부분한 한글로 다시 치셔도 됩니다.

q=%EB%A1%9C%EB%98%90+%EB%B2%88%ED%98%B8
q=로또+번호

둘 아무거나 사용하셔도 됩니다. 그리고 검색 할 위치에서 id든 쌍따옴표로 되어 있는데 한개짜리로 수정하셔야 합니다.

[완성]

=IMPORTXML("https://search.daum.net/search?nil_suggest=btn&w=tot&DA=SBC&q=로또+번호","//*[@id='lottoColl']/div[2]/div/div[2]/div[1]")

[결과]
a12.jpg

마무리


만약 로또 번호를 타이머를 넣고 트리거인가 그걸 이용하면 정해진 날짜와 시간에 한번 웹크로링해서 구글스프레드시트에 등록하면 로또번호를 DB화 할 수도 있을 듯 보이네요.
암튼 심심해서 한번 실험을 해 보았네요.


Sponsored ( Powered by dclick )

dclick-imagead

Authors get paid when people like you upvote their post.
If you enjoyed what you read here, create your account today and start earning FREE STEEM!
Sort Order:  

Thank you for your continued support towards JJM. For each 1000 JJM you are holding, you can get an additional 1% of upvote. 10,000JJM would give you a 11% daily voting from the 700K SP virus707 account.

Thank you

아직은 어렵기만 하네요 .좋은정보 감사합니다 보팅하고 가요^^

제 글에 댓글달아주셔서 유입되었는데요 ㅎㅎ 저도 사실 코딩에 관심은 있는데 입문하려니 어렵기만 하네요 ㅠㅠ