transformer를 활용한 한-영 번역 모델(pytorch)
·
데이터 분석/토이프로젝트
Tranformer를 이용한 한-영 번역 모델 입니다. Ai hub의 기계독해 데이터 사용(한-영 번역) 하였습니다. 모델 성능을 끌어 올리기 보다는 단순히 모델을 이해하고 활용해보기 위해 작성한 코드입니다. 코드는 나동빈님의 깃허브에서 많은 부분을 참고하였습니다. 코드시작 데이터 불러오기 import pandas as pd from glob import glob data = glob('./한영번역/*.xlsx') data ['./한영번역/5_문어체_조례.xlsx', './한영번역/2_대화체.xlsx', './한영번역/1_구어체(2).xlsx', './한영번역/1_구어체(1).xlsx', './한영번역/3_문어체_뉴스(2).xlsx', './한영번역/3_문어체_뉴스(3).xlsx', './한영번역/3_문..
토이 프로젝트 - foilum을 이용한 지도 시각화
·
데이터 분석/토이프로젝트
지도 시각화 카카오 맵 api와 '위치명 ' 데이터를 이용하여 위도 경도를 추출한다. foilum 을 이용하여 지도에 마커를 그려준다. #위치정보 가져오기 위치_빈도수 = df['위치'].value_counts( ) 위치_빈도수 Busan 釜山, South Korea 92 Busan, South Korea 82 부산 광안리해수욕장 - 廣安里海水浴場 GwangalliBeach, Busan, South Korea 52 Haeundae, Busan 22 흰여울문화마을 17 .. 부산주당 1 0731커피로스터스 1 수영구 광안동 1 한창정보타운 1 카페밀유 1 Name: 위치, Length: 578, dtype: int64 #등록된 위치정보별 빈도수 데이터 위치_빈도수 = pd.Da..
토이프로젝트 - 워드 클라우드
·
데이터 분석/토이프로젝트
워드클라우드 해쉬태그의 빈도수를 워드 클라우드로 표현해 보자. 먼저 크롤링한 데이터에서 해쉬태그만 불러옵니다. 그리고 빈도수를 확인한후 워드 클라우드로 시각화 합니다. df['해쉬태그'] 0 ['#KPGA', '#시티원골프연습장', '#레슨프로', '#부산', '#부산골프레... 1 [] 2 ['#부산맛집', '#부산밥집', '#food', '#foodstagram', '#... 3 ['#부산맛집', '#신평맛집', '#영진돼지국밥', '#수육백반', '#돼지국밥'] 4 [] ... 2413 ..
토이프로젝트 - 인스타그램 크롤링
·
데이터 분석/토이프로젝트
인스타그램 크롤링 인스타그램 URL을 만들어서 접속 제일 처음 게시물을 클릭하여 내용을 가져온다. 그다음 차례대로 옆으로 이동하며 내용을 가져온다. 인스타그램 접속하기 chorme driver를 통해 인스타그램에 접속 해보자. from selenium import webdriver driver = webdriver.Chrome('chromedriver.exe') import time # 인스타그램 접속하기 driver.get('https://www.instargram.com') #로딩하는데 시간이 걸릴 수 있으므로 3초간 대기 time.sleep(3) 인스타그램은 계정을 로그인하여야 원활한 크롤링을 진행 할 수 있다. # 인스타계정으로 로그인 insta_id = '인스..
토이프로젝트 - 인스타그램
·
데이터 분석/토이프로젝트
프로젝트 개요 인스타그램에 키워드를 검색 (나는 부산맛집, 부산데이트, 부산여행 검색) 검색해서 나오는 게시글들의 본문, 좋아요 수, 해쉬태그,위치 등등을 크롤링 해쉬태그 빈도수를 이용하여 워드 클라우드 크롤링 내용중 위치 정보를 기반으로 하여 지도 시각화(foilum 라이브러리를 이용)
ariz1623
'데이터 분석/토이프로젝트' 카테고리의 글 목록