본문 바로가기

Data science24

QGIS 다운로드 방법 위치 기반의 시각화에 유용하게 활용 가능한 QGIS 다운로드 방법을 공유해보고자 한다! 단순히 원하는 지역의 지도를 구할 수 없을 때 경계에 따라 지도를 새로 생성하는 것부터 데이터와 연계하여 다양한 시각화에 활용할 수 있는 유용한 툴이다. 구글에 QGIS 다운로드라고 검색하면 바로 연결되는 다운로드 페이지에서, 본인의 운영체제에 맞는 버전을 선택해서 설치하면 된다. 나는 가장 안정적인 안정화버전으로 설치했다. 라이센스 동의하며 계속 다음 단계로 넘어간다. 나는 바탕화면 바로가기와 시작메뉴에 추가하기는 생략했다. QGIS 다운로드 시간은 꽤 오래 걸리는 편이다. 인내심을 가지고 기다리면 설치 완료! 2022. 7. 21.
No module named 'pyautogui' 오류 3초 해결 크롤링이나 단순 반복작업 효율화를 위한 키보드 자동화 작업을 위해 pyautogui를 사용하려고 하는데, No module named 'pyautogui' 라는 오류가 발생하는 경우가 있다. vscode에서 작업을 하면 보이는 화면과 같이 import 단계에서도 제대로 적용되지 않고, 터미널에서 오류 메세지가 발생하는데 이런 경우 아주 간단히 해결할 수 있다! 아마 이 글을 찾아 들어오신 분들은 셀레니움 버전 업데이트가 되면서 css selector처럼 코드 사용방법이 없어진 게 아닌가 생각하실텐데, 그렇지 않고 패키지 설치가 되지 않은 게 원인이기 때문에 pip install로 간단히 해결할 수 있다. pip install pyautogui 혹시 이 명령어가 잘 동작하지 않는다면 현재 작업 중인 창은 .. 2022. 7. 7.
3초만에 해결하는 FeatureNotFound 오류 : Do you need to install a parser library? 프로젝트별로 가상환경을 생성해서 하다보니, 놓칠 수 있는 부분들이 많이 발생하는데 오히려 그래서 공부가 더 많이 된다 :) 크롬 드라이버 오류 해결 후에는 FeatureNotFound 오류가 발생했다. (지난 번 크롬 드라이버 오류) 2022.05.18 - [Data science] - 3분 안에 해결하는 크롬 드라이버 버전 오류 : Selenium chromedriver FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? BeautifulSoup을 사용할 때 html.parser 로 처음 웹크롤링을 배웠었는데, lxml을 사용하면 .. 2022. 5. 18.
3분 안에 해결하는 크롬 드라이버 버전 오류 : Selenium chromedriver 몇 개월 전의 코드를 다시 실행해보던 중에, 아래와 같은 오류가 떴다. SessionNotCreatedException 오류. SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 99 Current browser version is 101.0.4951.67 with binary path 실제경로 설명을 읽어보면, 세션이 생성되지 않았고 실행하려는 크롬 드라이버의 버전은 Chrome버전 99만 지원하는데, 현재 브라우저 버전은 101.0.4951.67이기 때문이라고 한다. 실제 경로를 복사해 들어가서 chrome.exe를 확인해보면 안내된 바와 같다. .. 2022. 5. 18.
간단한 네이버 블로그 크롤링 파이썬 API 활용 방법 특정 키워드에 대한 사람들의 의견을 수집하기 위해 네이버 블로그 크롤링을 Naver Developers의 API로 활용해보고자 가입을 진행했다. 먼저 네이버 개발자 센터로 접속한다. https://developers.naver.com/main/ NAVER Developers 네이버 오픈 API들을 활용해 개발자들이 다양한 애플리케이션을 개발할 수 있도록 API 가이드와 SDK를 제공합니다. 제공중인 오픈 API에는 네이버 로그인, 검색, 단축URL, 캡차를 비롯 기계번역, 음 developers.naver.com 따로 회원가입 버튼이 없는 대신 바로 로그인 버튼이 있고, 네이버 아이디 로그인 페이지로 간다. 네이버 아이디가 없으면 가입하자. 상단의 Application - 새 애플리케이션 등록에 들어간다.. 2022. 5. 16.
선형 회귀 모델 + 다중 선형 회귀 개념 정리 및 실습 w.Colab 지난 글에서 살펴본 것과 같이, 머신러닝 학습 종류에는 지도학습, 비지도학습, 강화학습 등이 있다. 2022.04.25 - [Data science] - 머신러닝이 뭐지? 3분 안에 정리하는 기초 개념 선형회귀의 개념 그 중 선형회귀는 지도학습의 대표적인 예시로, 레이블(정답)이 있는 데이터를 가지고 학습하는 지도학습의 대표적인 예시로, 가장 자주 쓰이는 모델이다. 회귀는, 연속적인 값을 예측할 때 쓰이며, 평균으로 돌아간다는 뜻을 가지고 있다. 좌측의 그래프가 데이터 위치라고 생각했을 때, 데이터들을 잘 설명하기 위해서는 우측과 같이 y=x 그래프를 그려야 할 것이다. 이렇게 데이터를 대표할 수 있는 그래프를 그려야 하는 것을 직관적으로 알 수 있다. 회귀분석은 이렇게 점들을 가장 잘 대변하도록 직선을.. 2022. 4. 26.
머신러닝이 뭐지? 3분 안에 정리하는 기초 개념 머신러닝 개념 알파고 이후로 이슈가 된 머신러닝은, 사실 몇십 년 전부터 존재해온 개념이지만 최근 하드웨어의 발전 및 여러 요인으로 인한 빅데이터 수집이 가능해지고, 여러 알고리즘들이 발전하면서 더욱 주목받게 된 개념이다. 머신러닝에 대한 개념을 정리한 대표적 인물로는 Arthru Samuel과 Tom Mitchell이 있다. 아서 사무엘은 1959년, 프로그램이 작성되지 않더라도 컴퓨터가 스스로 학습하는 것을 머신러닝이라 정의했으며, 톰 미첼은 1988년, 컴퓨터가 경험(E, experience)으로부터 학습하여 작업(T, task)을 하되 이 성능(P, performance)에 대한 측정이 가능한 것을 머신러닝이라 정의했다. 머신러닝 프로그래밍 차이 먼저 프로그래밍은 input data를 갖고 있고,.. 2022. 4. 25.
트위터 twitter API 개발자 계정 신청 및 apps 등록 후기 : 바로 승인 성공 SNS의 대명사 중 하나인 트위터. SNS를 활발하게 하지 않기에 계속 가입을 미루고 있다가, 트위터의 데이터를 손쉽게 크롤링해올 수 있다는 소식을 듣고 드디어 가입을 하게 되었다! 트위터 개발자 계정을 만들기 이전에 당연하지만 트위터 계정이 있어야 한다. 나는 구글 아이디로 가입했다. 차례대로 가입을 하다 보니, 최소 1명 이상을 팔로우하래서 대한민국 청와대를 팔로우하고, 관심사로 'Data science'를 설정하니 관련된 트윗이 표출되었다. 이제 트위터 개발자 페이지로! https://developer.twitter.com/en/apps https://developer.twitter.com/en/apps developer.twitter.com 해당 링크로 접속하면, 다음과 같은 화면이 뜬다. Cre.. 2022. 4. 13.
파이썬 file_path 사용하기 : FileNotFoundError 파일 위치를 지정하기 위해 사용하는 file_path에서, 경로를 잘못 지정했을 경우 FileNotFoundError 가 발생한다. 말 그대로 파일을 찾을 수 없다는 뜻인데, 경로가 잘못되어서 발생하는 에러다. file_path = '폴더/하위1폴더/불러오고싶은 파일명' 방식으로 경로를 지정하며 pd.read_csv(file_path, sep= '')와 같은 형식으로 사용할 수 있다. ..을 사용하면 한 폴더 위로 갈 수 있는데, 주의할 점은 이 때 '현재 실행중인 주피터노트북의 위치' 기준으로 파일 경로를 설정해줘야 한다. 예를 들어 내가 지금 작업하고 있는 주피터노트북 ipynb 파일명이 Example_note.ipynb이고, 폴더는 06_Master_2203에서 작업을 하고 있다면 아래와 같은 모습.. 2022. 3. 11.