본문 바로가기

cmd2

프로젝트(2)_파이썬 웹 크롤링_개발환경설치 본격적으로 저희 프로젝트의 결과물이 생성된 과정에 대하여 설명하는 글을 쓰려고 합니다. 저와 비슷한 프로젝트를 진행하는 분들은 제 게시물 잘 따라와보세요 ! 웹 크롤링(Web Crawling)이란 ? 컴퓨터 소프트웨어 기술로, 웹 사이트에서 원하는 정보를 추출하는 것 저희는 웹 크롤링이라는 방법으로 이캠퍼스 페이지에서 필요한 부분만 추출할 것입니다. 크롤링의 방법에는 여러가지가 존재하는데 그 중에서 HTML 페이지를 파싱하고, 필요한 데이터만 추출하는 기법 을 사용할게요. (파싱 : 어떤 페이지에서 원하는 데이터를 특정 패턴이나 순서로 추출해 가공하는 것) HTML 페이지를 파싱하는 방법으로 크롤링을 하기 위해서는 크롤링할 페이지의 html 파일이 있어야 합니다. 원하는 페이지에서 F12 버튼만 누른다면.. 2021. 9. 30.
Github와 폴더 연동하기 Git(깃)이란? 📣 분산 소스 버전 관리 시스템 📣 소스 코드를 효율적으로 관리할 수 있게 해주는 형상 관리 도구 GitHub(깃허브)란? 📣 Git(깃)을 사용하는 프로젝트를 지원하는 웹 호스팅 서비스 📣 Git(깃)을 업로드할 수 있어 공동 작업에 많이 사용되는 플랫폼 기술자들에겐 필수라고 할 수 있는 " 깃허브" 의 중요성에 대해서는 많은 사람들이 알고 있지만 막상 직접 깃허브를 만들기에는 어려움을 많이 겪고 있는 것 같습니다. 그래서 제가 간단명료하게 아주 쉽게 설명을 해드리려고 해요. 일단 깃허브는 제 컴퓨터에 있는 폴더와 깃허브 페이지에 만든 repository를 연결해줄 수 있어 굉장히 편리하게 사용할 수 있는 플랫폼이라고 할 수 있어요. 그렇다면 "폴더와 repository를 어떻게 연결.. 2021. 9. 30.
반응형