본문 바로가기

Data science24

ChatGPT 가입부터 사용법 주의사항까지, IT회사 직장인의 꿀팁 IT회사에 재직하다보니 ChatGPT가 처음 출시됐을 때 신문기사를 보면서 신기해했던 게 엊그제같은데, (실제로 11월 30일에 출시되었다) 몇 달 만에 어느새 정말 유명한 AI가 되어버렸다. 일각에서는 알파고에 이은 제 2의 인공지능 열풍을 불러올 것이라는 예측을 했는데, 그 말이 사실임을 인정해야 할 것 같다. 직장 동료들끼리 챗gpt 써봤냐는 이야기를 나누는 것을 넘어 이제는 개인의 업무 그리고 회사 업무에 어떻게 활용할 수 있는지에 대한 방법이 공유되고 있는 시점이다. (사실 실무에서 AI를 사용하기 위해서는 파인튜닝-데이터를 추가로 학습시켜 좀 더 내가 원하는 결과물을 만들기 위한 과정-이 필요한데 한국어는 SKT의 KoGPT2에 파인튜닝을 하는 것이 가장 현실적인 방법이라고 생각해 실험을 해보.. 2023. 2. 1.
네이버 Data Science 부스트코스 코칭스터디 8기 시작! 얼마 전 신청한 네이버 Data Science 부스트코스 코칭스터디에 선정되었다. 데이터 사이언스에 대한 부분들을 좀 더 체계적으로 정리하기 위해 블로그를 하나 더 개설했는데, 이 곳에서 자세한 내용을 확인할 수 있으므로 함께 공유해본다 :) [리드부스터 선정 후기] 네이버 Data Science 부스트코스 코칭스터디 8기 지난 9월 26일부터 10월 19일까지, 네이버의 Data Science 부스트코스 코칭스터디 8기의 모집이 있었다. 기간은 10월 27일~11월 24일 진행되는 약 한 달간의 스터디이다. 선정 결과는 10월 21일 금요일에 for-data-science.tistory.com 2022. 10. 22.
[해결완료] 파이썬 2차원 리스트 1차원으로 오류 concatenate ValueError: zero-dimensional arrays cannot be concatenated 자연어 처리를 하는 과정에서, 특정 단어가 등장했을 때 리스트 형태로 단어가 들어있는 [키워드] 열에 있는 단어라면 [존재하는 키워드], 그렇지 않다면 [새로운 키워드]로 자동 분류하는 코드를 작성하고 있다. 가장 먼저 [키워드] 열에 있는 단어가 파이썬 2차원 리스트이기 때문에 1차원으로 변환하려고 하는데, 이런 오류가 발생했다. concatenate ValueError: zero-dimensional arrays cannot be concatenated 1. 1차 오류 해결 : 리스트로 바꿔주기 해당 시리즈([키워드] 열)을 먼저 리스트로 변환해줘야 하는데 그 과정을 거치지 않아서 그런 것 같아 먼저 file['키워드'].values.tolist()를 이용해서 리스트로 바꿔준 다음, np.concat.. 2022. 9. 28.
Git push 할 때 오류 발생 Git을 시작하면서 좌충우돌 오류들이 계속 발생하는데, 오늘 발생한 오류는 두 가지다. 개인 노트북에서는 branch가 main이라는 이름으로 인식되는데, 회사 컴퓨터에서는 master라는 이름으로 인식된다. Github에는 main이라는 이름으로 잘 등록되어 있었다. 그래서 먼저 master라는 이름을 아래 명령어를 이용해 main으로 바꿔주었다. git branch -m master main git fetch origin git branch -u origin/main main 그리고 생성해놓은 원격 저장소에 다시 접근하려고 하니 아래와 같은 오류가 발생했다. $ git push origin main Warning: Permanently added the ECDSA host key for IP addr.. 2022. 8. 5.
Git repository 변경하기 TIP ) 원하는 폴더 우클릭 - Git Bash Here로 경로를 빠르게 오픈할 수 있다. 1. 현재 연결된 주소를 확인 git remote -v 현재 연결된 주소를 확인해보면 기존 저장소 주소가 있을 것이다. 이 저장소의 연결을 끊고 새롭게 연결해줘야 한다. 2. 기존 저장소와 연결 끊기 git remote remove origin 명령어로 연결을 끊어준다. 3. 새로운 저장소와 연결해주기 git remote add origin 저장서SSH키 입력 4. 변경된 주소로 잘 연결되어 있는지 확인하면 끝! 2022. 8. 5.
[3초 해결] Github Private public 변경 Github public private 차이는 다른 사람들에게 보이냐, 아니냐의 차이이다. 나 혼자 작업을 하거나, 내가 선택한 사람만 저장소를 볼 수 있도록 하려면 private으로 설정해줘야 한다. 2022년 8월 기준 현재는 Github private 무료 이용이 가능한 상태이다. 만약 public으로 생성한 Github을 private으로 변경하고 싶다면 다음과 같이 처리하면 된다. 오늘도 아주 간단하게 3초 해결이 가능하다! 1. 로컬 저장소의 Settings에 접속 2. 스크롤을 가장 아래로 내려서 Danger Zone - Change repository visibility 의 Change visibility 버튼 클릭 3. Make private 버튼을 선택한 다음, Please type ".. 2022. 8. 5.
jupytext install 주피터 노트북 py파일 동시생성하기 요즘 공부를 시작한 책의 예제가 주피터 노트북으로 되어 있어서, ipynb 형식으로 저장이 되고 있다. 하지만 이왕 공부하는 거 Git 잔디 심기를 해보자! 싶어서 등록을 하려고 하니, 형상관리에는 불리한 파일 형식이라는 점을 깨닫게 되었다. 다행히 py 파일로 작업을 다 다시 할 필요 없이 jupytext라는 라이브러리를 이용해 페어가 되는 파일을 동시에 생성해서 관리할 수 있기에, pair notebook 타입으로 관리하려고 한다. 즉, ipynb 와 py 파일이 쌍둥이처럼 페어로 이루어져 있고 이 중 하나만 수정해도 나머지 하나가 자동으로 수정되게끔 만들 수 있다는 것! jupytext install jupytext 사용법은 간단하다. 가장 먼저 아나콘다 프롬프트에 아래 명령어를 넣어준다. (주피터.. 2022. 8. 4.
Github 사용법 회원가입과 repo 생성부터 시작하기 프로젝트가 많아지면서, 구글 드라이브에서 폴더를 관리하는 것보다 더 효율적인 방법을 찾다가 생각난 깃허브! 개발자들의 포트폴리오에 많이 쓰이기도 하고, 개발을 한다면 필수라고 할 만큼 많은 사람들이 사용하고 있다. 나는 데이터 분석을 하는 데에는 꼭 필요한 게 아니라고 생각해왔지만, 최근 머신러닝에 관심이 생기면서 프로젝트 관리에도 좋을 것 같고.. 사실은 모르는 일에 대한 망설임이 아닌가? 하는 생각이 들어 도전해보기로 했다! 나처럼 Github 사용법을 모르는 분들을 위해 정말 맨 처음, 회원가입과 깃 설치부터 정리해본다. Github 회원가입 1. github 사이트에 접속해서 'Sign up for GitHub'를 이용해 회원가입을 진행해준다. http://www.github.com/ GitHub.. 2022. 8. 3.
파이썬 문자열 헷갈리는 부분 총정리 파이썬 문자열을 다룰 일이 꽤나 많은데, 그때마다 은근히 헷갈리는 부분들이 있다. 어려운 게 아니더라도 헷갈릴 때마다 찾아보게 되어서, 관련 강의를 듣고 파이썬 문자열의 기초를 정리해둔다! 파이썬 자료형은 크게 3가지로, 정수(integer), 실수(float), 문자열(string)이며 변수들 간에 계산을 할 때는 타입을 일치시켜줘야 한다. 그중 문자열, string은 단순한 텍스트 데이터보다는 "문자들의 순서 있는 집합"이라고 생각하고 접근하는 것이 좋다. 1. 파이썬 문자열 ✔ 문자열 안에 따옴표가 들어가는 경우를 처리하기 위해서 ""와 ''를 같이 사용한다. message = "친구가 '안녕'이라고 말했다." print(message) >>친구가 '안녕'이라고 말했다. ✔ 파이썬에서는 따옴표 출력.. 2022. 7. 29.