R에서 Google Trends API
를 이용해서 관심 검색어의 traffic과 traffic 추이를 분석하는 방법을 실 사례로 따라가면서 학습할 수 있도로 정리한 학습자료다.
“Google Trends Analysis - Case Study”는 R에서 Google Trends API
를 이용해서 관심 검색어의 traffic과 traffic 추이를 분석하는 방법을 실 사례로 따라가면서 학습할 수 있도로 정리한 학습자료다.
일반 대중들의 관심사와 관심의 트랜드를 설명할 데이터 소스로 검색 포털의 검색 통계를 하나의 대상으로 선정하였다. 그리고 그 가능성을 검증하기 위해서 Google Trends의 통계를 수집하고 표현한 방법을 정리하였고, 그 과정에서의 R 코드를 공유한다.
Naver, Google 등의 검색 포털에서의 검색 traffic은 그 시대의 일반 대중들의 관심사를 대변해준다. 또한 시간의 추이에 따른 traffic의 증감은 단위 기간 안에서의 관심의 트랜드를 보여 주는 주요한 정보다.
Google Trends는 Google 검색 로그로부터 집계된 검색 통계정보를 제공하는 서비스로 일부 기능들은 Open API로 조회가 가능하다.
Figure 1: Google Trends Logo
Google Trends 정보를 수집하는 패키지는 gtrendsR 패키지다. 분석과 관련된 패키지를 로드한다.
###############################################################
## 필요한 패키지 로드
###############################################################
library(gtrendsR)
library(dplyr)
library(magrittr)
library(ggplot2)
필요한 패키지를 로드하고, 버블플롯을 그리는 함수를 정의한다. Case Study 후반부에 이 사용자 정의함수로 버블플롯을 그릴 것이므로 미리 생성해 두자.
###############################################################
## 사용자 정의함수 - 버블 플롯을 그리는 함수
###############################################################
bbplot <- function(label, value, textColor = "#333333",
color = RColorBrewer::brewer.pal(8, "Dark2")) {
library(bubbles)
library(RColorBrewer)
color <- substr(color, 1, 7)
n <- length(label)
n.pal <- length(color)
if (n > n.pal) {
color <- c(color, rep(color[n.pal], n - n.pal))
}
if (n < n.pal) {
color <- color[1:n]
}
bubbles(value, label, color = color, textColor = textColor)
}
Bitcoin 거래 시세는 별도로 수집해서 CSV 파일에 담아 놓았다. 시세를 담은 CSV 파일인 <a href=“data/market-price.csv”, target = "_blank">market-price.csv을 로드한다.
###############################################################
## Bitcoin 거래 시세 정보
###############################################################
dpath <- "data"
bitprice <- read.csv(paste(dpath, "market-price.csv", sep = "/"), header = FALSE)
bitprice <- bitprice %>%
transmute(date = as.POSIXct(V1),
value = V2)
Google Trends 데이터를 수집하기 위해서는 인터넷에 접속된 온라인 환경이어야만 가능하다. 그러므로 이 절의 예제는 온라인에 접속된 인터넷 환경에서만 사용하기 바란다.
다음처럼 gtrends()
로 “YOLO”와 “DINK”의 두 검색 키워드로 traffic을 조회한다. 이 경우는 world 기준의 traffic이다. 즉, 전세계 사람들이 Google에서 검색한 통계를 수집하게 된다.
수집한 traffic 데이터는 다음처럼 plot() 함수로 간단하게 시계열 그래프를 그릴 수 있다.
plot(yolo_trend)
시계열 그래프를 보면 y-축인 Search hits의 최대값이 100임을 알수 있다. 즉, traffic 데이터는 검색 건수가 아니라 통계 시점에서 가장 큰 규모의 traffic을 100으로 놓고 산정한 상대적인 측도이다. traffic 데이터의 시계열 그래프는 ggplot2
패키지로 생성한다. 그래서 다음의 ggplot2 패키지의 기능을 추가하여 좀 더 팬시하게 그래프를 그릴 수도 있다. 두번 째 플롯이 범례를 아래로 이동해서 가독성을 높인 것이다.
p <- plot(yolo_trend)
p +
ggtitle("Google Trend Traffics (Interest over Time)") +
theme(plot.title = element_text(hjust = 0.5)) +
theme(legend.position = "bottom")
geo 인수값을 “KR”로 지정하면 우리 나라에서 검색한 traffic 통계를 수집한다.
YOLO 검색 traffic은 전세계적으로 줄어드는 추세이지만, 우리나라에서는 2016년도 말부터 증가하다가 2017년도 하반기부터 줄어드틑 추세임을 알 수 있다.
p <- plot(yolo_trend2)
p +
ggtitle("Google Trend Traffics (Interest over Time)") +
theme(plot.title = element_text(hjust = 0.5)) +
theme(legend.position = "bottom")
한글 키워드로 비트코인이라는 검색어의 traffic을 수집한다.
2013년도 하반기 반짝 상승 이후로 traffic이 없다가 2017년 초부터 급증함을 알 수 있다.
p <- plot(bit_trend)
p +
ggtitle("Google Trend Traffics (Interest over Time)") +
theme(plot.title = element_text(hjust = 0.5)) +
theme(legend.position = "bottom")
비트코인 검색어의 traffic을 미국과 우리 나라를 비교하기 위해서, 영문으로 검색한다.
두 나라의 traffic이 유사하지만 2017년도 말의 급등세는 미국에서의 규모가 더 크다.
p <- plot(bit_trend2)
p +
ggtitle("Google Trend Traffics (Interest over Time)") +
theme(plot.title = element_text(hjust = 0.5)) +
theme(legend.position = "bottom")
참고로 앞에서 수집한 CSV의 비트코인 시세 데이터인 bitprice 데이터 프레임객체를 시계열 플롯으로 출력해보자.
head(bitprice)
date value
1 2009-01-03 0
2 2009-01-05 0
3 2009-01-07 0
4 2009-01-09 0
5 2009-01-11 0
6 2009-01-13 0
bitprice %>%
ggplot(aes_string(x = "date", y = "value")) +
geom_line() +
xlab("Date") +
ylab("Price ($)") +
ggtitle("Bitcoin Price Trend") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5)) +
theme(legend.title = element_blank())
비트코인 매매 시세가 정확히 traffic 데이터와 유사한 패턴을 보여줌을 알 수 있다.
임의의 기간동안의 검색 traffic을 수집하기 위해서는 time 인수에 다음 예제와 같은 포맷으로 시작 일자와 종료 일자를 지정할 수 있다.
2013, 2014, 2015, 2016, 2017년의 각각의 5년치 traffic을 수집한다.
bit_trend_2013 <- gtrends(c("bitcoin"), geo = c("KR", "US"),
time = "2013-01-01 2013-12-31")
bit_trend_2014 <- gtrends(c("bitcoin"), geo = c("KR", "US"),
time = "2014-01-01 2014-12-31")
bit_trend_2015 <- gtrends(c("bitcoin"), geo = c("KR", "US"),
time = "2015-01-01 2015-12-31")
bit_trend_2016 <- gtrends(c("bitcoin"), geo = c("KR", "US"),
time = "2016-01-01 2016-12-31")
bit_trend_2017 <- gtrends(c("bitcoin"), geo = c("KR", "US"),
time = "2017-01-01 2017-12-31")
bit_trend_2013_k <- gtrends(c("비트코인"), geo = c("KR"),
time = "2013-01-01 2013-12-31")
bit_trend_2014_k <- gtrends(c("비트코인"), geo = c("KR"),
time = "2014-01-01 2014-12-31")
bit_trend_2015_k <- gtrends(c("비트코인"), geo = c("KR"),
time = "2015-01-01 2015-12-31")
bit_trend_2016_k <- gtrends(c("비트코인"), geo = c("KR"),
time = "2016-01-01 2016-12-31")
bit_trend_2017_k <- gtrends(c("비트코인"), geo = c("KR"),
time = "2017-01-01 2017-12-31")
2017년도 말의 급등세가 우리 나라보다 미국이 크다는 것은 4/4분기의 중반 이후부터 두드러짐으로 알 수 있다.
p <- plot(bit_trend_2017)
p +
ggtitle("Google Trend Traffics (Interest over Time)") +
theme(plot.title = element_text(hjust = 0.5)) +
theme(legend.position = "bottom")
gtrends 패키지로 수집한 Google Trends 데이터는 gtrends 객체로 저장된다.
is(bit_trend2)
[1] "gtrends"
gtrends 객체는 다음처럼 6개의 속성 데이터를 가지고 있다.
names(bit_trend2)
[1] "interest_over_time" "interest_by_country" "interest_by_region"
[4] "interest_by_dma" "interest_by_city" "related_topics"
[7] "related_queries"
interest_over_time는 일자별로 traffic 정보를 담고 있는 데이터 프레임이다. 일자, 상대 traffic, 키워드, 국가, 그룹, 카테고리 정보를 담고 있다.
그룹(gprop)은 web, news, images, froogle, youtube 중에서 한가지 값을 갖는데 기본값으로 수집하면 웹검색 traffic인 web으로 지정된다.
head(bit_trend2$interest_over_time)
date hits keyword geo time gprop category
1 2016-10-16 1 bitcoin KR today+5-y web 0
2 2016-10-23 1 bitcoin KR today+5-y web 0
3 2016-10-30 1 bitcoin KR today+5-y web 0
4 2016-11-06 1 bitcoin KR today+5-y web 0
5 2016-11-13 1 bitcoin KR today+5-y web 0
6 2016-11-20 2 bitcoin KR today+5-y web 0
tail(bit_trend2$interest_over_time)
date hits keyword geo time gprop category
515 2021-08-29 15 bitcoin US today+5-y web 0
516 2021-09-05 20 bitcoin US today+5-y web 0
517 2021-09-12 14 bitcoin US today+5-y web 0
518 2021-09-19 18 bitcoin US today+5-y web 0
519 2021-09-26 15 bitcoin US today+5-y web 0
520 2021-10-03 19 bitcoin US today+5-y web 0
interest_by_region은 검색한 사람이 거주하는 지역으로서의 광역시도(우리나라)와 주(States, 미국) 정보를 담고 있다.
bit_trend2$interest_by_region
location hits keyword geo gprop
1 Seoul 100 bitcoin KR web
2 Gyeonggi-do 78 bitcoin KR web
3 Jeju-do 74 bitcoin KR web
4 Daejeon 73 bitcoin KR web
5 Incheon 60 bitcoin KR web
6 Gyeongsangnam-do 59 bitcoin KR web
7 Chungcheongnam-do 55 bitcoin KR web
8 Gyeongsangbuk-do 55 bitcoin KR web
9 Busan 49 bitcoin KR web
10 Daegu 46 bitcoin KR web
11 Gangwon-do 44 bitcoin KR web
12 Ulsan 43 bitcoin KR web
13 Jeollabuk-do 40 bitcoin KR web
14 Jeollanam-do 39 bitcoin KR web
15 Chungcheongbuk-do 35 bitcoin KR web
16 Gwangju 33 bitcoin KR web
17 Hawaii 100 bitcoin US web
18 Nevada 92 bitcoin US web
19 California 92 bitcoin US web
20 Washington 88 bitcoin US web
21 New Jersey 86 bitcoin US web
22 New York 85 bitcoin US web
23 Colorado 83 bitcoin US web
24 Utah 82 bitcoin US web
25 Florida 80 bitcoin US web
26 Massachusetts 75 bitcoin US web
27 Oregon 73 bitcoin US web
28 Connecticut 73 bitcoin US web
29 Arizona 73 bitcoin US web
30 Illinois 72 bitcoin US web
31 Alaska 70 bitcoin US web
32 Maryland 68 bitcoin US web
33 Montana 68 bitcoin US web
34 Idaho 67 bitcoin US web
35 Virginia 65 bitcoin US web
36 Rhode Island 64 bitcoin US web
37 New Hampshire 64 bitcoin US web
38 Minnesota 64 bitcoin US web
39 District of Columbia 64 bitcoin US web
40 Pennsylvania 63 bitcoin US web
41 North Dakota 61 bitcoin US web
42 Michigan 60 bitcoin US web
43 Vermont 60 bitcoin US web
44 Georgia 59 bitcoin US web
45 Texas 59 bitcoin US web
46 Delaware 58 bitcoin US web
47 Wyoming 57 bitcoin US web
48 Nebraska 56 bitcoin US web
49 Maine 56 bitcoin US web
50 North Carolina 55 bitcoin US web
51 Missouri 55 bitcoin US web
52 Ohio 54 bitcoin US web
53 Kansas 54 bitcoin US web
54 South Dakota 54 bitcoin US web
55 Iowa 54 bitcoin US web
56 Wisconsin 54 bitcoin US web
57 New Mexico 52 bitcoin US web
58 Indiana 52 bitcoin US web
59 Tennessee 50 bitcoin US web
60 South Carolina 48 bitcoin US web
61 Louisiana 47 bitcoin US web
62 Arkansas 46 bitcoin US web
63 Oklahoma 45 bitcoin US web
64 Alabama 45 bitcoin US web
65 Kentucky 44 bitcoin US web
66 Mississippi 39 bitcoin US web
67 West Virginia 37 bitcoin US web
interest_by_dma는 DMA(Designated Market Area) 정보를 담고 있다. DMA는 시장분석 전문회사인 Nielsen이 시장 분석을 위해서 지정한 지역 분류체계로 우리나라는 없고, 미국에서만 정의되어 있다.
dim(bit_trend2$interest_by_dma)
[1] 210 5
head(bit_trend2$interest_by_dma)
location hits keyword geo gprop
1 San Francisco-Oakland-San Jose CA 100 bitcoin US web
2 West Palm Beach-Ft. Pierce FL 90 bitcoin US web
3 Las Vegas NV 90 bitcoin US web
4 Honolulu HI 89 bitcoin US web
5 Miami-Ft. Lauderdale FL 88 bitcoin US web
6 Seattle-Tacoma WA 85 bitcoin US web
tail(bit_trend2$interest_by_dma)
location hits keyword geo gprop
205 Joplin MO-Pittsburg KS 30 bitcoin US web
206 Harlingen-Weslaco-Brownsville-McAllen TX 29 bitcoin US web
207 Alexandria LA 28 bitcoin US web
208 Meridian MS 28 bitcoin US web
209 Laredo TX 27 bitcoin US web
210 Clarksburg-Weston WV 24 bitcoin US web
interest_by_city는 검색한 사람이 거주하는 지역으로서의 도시 정보를 담고 있다.
dim(bit_trend2$interest_by_city)
[1] 90 5
head(bit_trend2$interest_by_city)
location hits keyword geo gprop
1 Seongnam-si 100 bitcoin KR web
2 Pyeongtaek-si 82 bitcoin KR web
3 Yongin-si 73 bitcoin KR web
4 Hwaseong-si 71 bitcoin KR web
5 Seoul 70 bitcoin KR web
6 Gimpo-si NA bitcoin KR web
tail(bit_trend2$interest_by_city)
location hits keyword geo gprop
85 Virginia Beach NA bitcoin US web
86 Fort Worth NA bitcoin US web
87 Memphis NA bitcoin US web
88 Indianapolis 39 bitcoin US web
89 Louisville NA bitcoin US web
90 San Antonio 34 bitcoin US web
related_topics는 검색 키워드와 관련있는 주제(topics)에 대한 통계 정보를 담고 있다.
이 정보는 2개 이상의 지역에서는 표현되지 않아서 bit_trend로 살펴본다.
subject 변수는 상대적 traffics 정보이며, related_topics 변수는 통계의 기준을 의마한다. top은 top frequency를 의미하며, rising는 최근 급상승 관련 주제를 의미한다.
head(bit_trend$related_topics)
subject related_topics value geo keyword category
1 100 top Bitcoin KR 비트코인 0
2 99 top Bit KR 비트코인 0
3 55 top Coin KR 비트코인 0
4 9 top UPbit KR 비트코인 0
5 4 top Eclipse KR 비트코인 0
6 3 top Exchange KR 비트코인 0
tail(bit_trend$related_topics)
subject related_topics value geo keyword category
20 1 top Dogecoin KR 비트코인 0
21 1 top Cryptocurrency KR 비트코인 0
22 1 top Bittrex KR 비트코인 0
23 1 rising GIMP KR 비트코인 0
24 1 rising Commission KR 비트코인 0
25 1 rising Bittrex KR 비트코인 0
related_queries는 검색 키워드와 관련있는 검색어에 대한 통계 정보를 담고 있다.
이 정보는 2개 이상의 지역에서는 표현되지 않아서 bit_trend로 살펴본다.
subject 변수는 상대적 traffics 정보이며, related_queries 변수는 통계의 기준을 의마한다. top은 top frequency를 의미하며, rising는 최근 급상승 관련 검색어를 의미한다.
bit_trend$related_queries
subject related_queries value geo keyword
1 100 top 비트 코인 KR 비트코인
2 100 top 코인 KR 비트코인
3 100 top 비트 KR 비트코인
4 17 top 비트 코인 시세 KR 비트코인
5 12 top 비트 코인 갤러리 KR 비트코인
6 11 top 코인 갤러리 KR 비트코인
7 8 top 업 비트 비트 코인 KR 비트코인
8 8 top 업 비트 KR 비트코인
9 3 top 비트 코인 뽀 개기 rndcoin KR 비트코인
10 3 top 비트 코인 가격 KR 비트코인
11 3 top 빗썸 비트 코인 KR 비트코인
12 3 top 비트 코인 거래소 KR 비트코인
13 3 top 코인 거래소 KR 비트코인
14 3 top 코인 판 KR 비트코인
15 3 top 빗썸 KR 비트코인
16 2 top 비트 코인 주가 KR 비트코인
17 2 top 비트 코인 전망 KR 비트코인
18 2 top 코인 원 KR 비트코인
19 2 top 비트 코인 채굴 KR 비트코인
20 2 top 바이 비트 KR 비트코인
21 1 top 비트 코인 캐시 KR 비트코인
22 1 top 바이 낸스 비트 코인 KR 비트코인
23 1 top 이더 리움 KR 비트코인
24 1 top 비트 코인 차트 KR 비트코인
25 1 top 비트 코인 주식 KR 비트코인
26 Breakout rising 비트 코인 갤러리 KR 비트코인
27 Breakout rising 코인 갤러리 KR 비트코인
28 Breakout rising 업 비트 비트 코인 KR 비트코인
29 Breakout rising 업 비트 KR 비트코인
30 Breakout rising 비트 코인 뽀 개기 rndcoin KR 비트코인
31 Breakout rising 코인 판 KR 비트코인
32 Breakout rising 바이 비트 KR 비트코인
33 Breakout rising 바이 낸스 비트 코인 KR 비트코인
34 Breakout rising 비트 코인 차트 KR 비트코인
35 Breakout rising 바이 낸스 KR 비트코인
36 Breakout rising 비트 코인 갤 KR 비트코인
37 Breakout rising 코인 갤 KR 비트코인
38 Breakout rising 비트 코인 도미 넌스 KR 비트코인
39 Breakout rising 미국 비트 코인 KR 비트코인
40 Breakout rising 비트 코인 골드 KR 비트코인
41 Breakout rising 코인 네스트 KR 비트코인
42 Breakout rising 비트 코인 볼트 KR 비트코인
43 Breakout rising 도지 코인 KR 비트코인
44 Breakout rising 비트 코인 디시 KR 비트코인
45 Breakout rising 테슬라 비트 코인 KR 비트코인
46 Breakout rising 비트 코인 김프 KR 비트코인
47 Breakout rising 김프 KR 비트코인
48 Breakout rising 비트 맥스 KR 비트코인
49 Breakout rising 비트 코인 실시간 KR 비트코인
50 Breakout rising 비트 렉스 KR 비트코인
category
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 0
11 0
12 0
13 0
14 0
15 0
16 0
17 0
18 0
19 0
20 0
21 0
22 0
23 0
24 0
25 0
26 0
27 0
28 0
29 0
30 0
31 0
32 0
33 0
34 0
35 0
36 0
37 0
38 0
39 0
40 0
41 0
42 0
43 0
44 0
45 0
46 0
47 0
48 0
49 0
50 0
일자별 시계열 그래프는 이미 앞에서 다루었으므로 생략한다.
앞서 만들어 놓은 bbplot() 함수를 이용해서 시각화한다.
관련 주제가 영문으로 출력되지만, 비트코인 검색어의 관련 주제 규모를 버블차트로 출력해 보자.
##===========================================================
## 관련 Topic별 Traffics
##===========================================================
bit_trend$related_topics %>%
filter(related_topics == "top") %>%
mutate(relative = as.integer(subject) + 1) %>%
mutate(label = gsub(" ", "", value)) %>%
filter(relative > 0) %>%
select(label, relative) %$%
bbplot(label, relative)
color 인수를 사용하면 버블의 색상을 바꿀 수도 있다.
bit_trend$related_topics %>%
filter(related_topics == "top") %>%
mutate(relative = as.integer(subject) + 1) %>%
mutate(label = gsub(" ", "", value)) %>%
filter(relative > 0) %>%
select(label, relative) %$%
bbplot(label, relative, color = terrain.colors(35, alpha = NULL))
bit_trend$related_topics %>%
filter(related_topics == "top") %>%
mutate(relative = as.integer(subject) + 1) %>%
mutate(label = gsub(" ", "", value)) %>%
filter(relative > 0) %>%
select(label, relative) %$%
bbplot(label, relative, color = rainbow(20, alpha = NULL))
##===========================================================
## 관련 검색어별 Traffics
##===========================================================
bit_trend$related_queries %>%
filter(related_queries == "top") %>%
mutate(relative = as.integer(subject) + 1) %>%
mutate(label = gsub(" ", "", value)) %>%
filter(relative > 0) %>%
select(label, relative) %$%
bbplot(label, relative)
관련 검색어별 통계를 보면 상대 traffic이 0인 건도 통계로 집계되어 있다. 그래서 시각화 함수에서 traffic이 0인 건의 포함여부를 지정할 수 있도록 gplot.queries() 함수를 만들어 보았다.
gplot.queries <- function(x, rm.zero = FALSE, geos = "KR",
color = RColorBrewer::brewer.pal(8, "Dark2")) {
x$related_queries %>%
filter(geo %in% geos) %>%
filter(related_queries == "top") %>%
mutate(relative = as.integer(subject) + !rm.zero) %>%
mutate(label = gsub(" ", "", value)) %>%
filter(relative > 0) %>%
select(label, relative, geo) %$%
bbplot(label, relative, color = color)
}
다음 예제는 traffic이 0인 건을 제거한 후 버블차트를 그리는 예제다.
gplot.queries(bit_trend, rm.zero = TRUE)
2013년부터 2017년까지의 관련 검색어 Top 랭크를 살펴보자.
gplot.queries(bit_trend_2013_k, rm.zero = TRUE,
color = terrain.colors(20, alpha = NULL))
gplot.queries(bit_trend_2014_k, rm.zero = TRUE,
color = terrain.colors(20, alpha = NULL))
if (!is.null(bit_trend_2015_k$related_queries)) {
gplot.queries(bit_trend_2015_k, rm.zero = TRUE,
color = terrain.colors(20, alpha = NULL))
}
gplot.queries(bit_trend_2016_k, rm.zero = TRUE,
color = terrain.colors(20, alpha = NULL))
gplot.queries(bit_trend_2017_k, rm.zero = TRUE,
color = terrain.colors(20, alpha = NULL))
광역시도별 traffic 현황을 그리기 위해서 다음의 함수를 만들었다.
gplot.region <- function(x, geos = "KR",
color = RColorBrewer::brewer.pal(8, "Dark2")) {
x$interest_by_region %>%
filter(geo %in% geos) %>%
mutate(region = location) %>%
mutate(region = ifelse(region %in% c("Daejeon"), "대전광역시", region)) %>%
mutate(region = ifelse(region %in% c("Incheon"), "인천광역시", region)) %>%
mutate(region = ifelse(region %in% c("Seoul"), "서울특별시", region)) %>%
mutate(region = ifelse(region %in% c("Ulsan"), "울산광역시", region)) %>%
mutate(region = ifelse(region %in% c("Gwangju"), "광주광역시", region)) %>%
mutate(region = ifelse(region %in% c("Daegu"), "대구광역시", region)) %>%
mutate(region = ifelse(region %in% c("Busan"), "부산광역시", region)) %>%
mutate(region = ifelse(region %in% c("Chungcheongnam-do"), "충청남도", region)) %>%
mutate(region = ifelse(region %in% c("Jeollanam-do"), "전라남도", region)) %>%
mutate(region = ifelse(region %in% c("Chungcheongbuk-do"), "충청북도", region)) %>%
mutate(region = ifelse(region %in% c("Gyeongsangbuk-do"), "경상북도", region)) %>%
mutate(region = ifelse(region %in% c("Jeollabuk-do"), "전라북도", region)) %>%
mutate(region = ifelse(region %in% c("Gyeongsangnam-do"), "경상남도", region)) %>%
mutate(region = ifelse(region %in% c("Gangwon-do"), "강원도", region)) %>%
mutate(region = ifelse(region %in% c("Gyeonggi-do"), "경기도", region)) %>%
mutate(region = ifelse(region %in% c("Jeju-do"), "제주도", region)) %>%
select(region, hits, geo) %$%
bbplot(region, hits, color = color)
}
광역시도별 traffic 현황은 다음과 같다.
gplot.region(bit_trend)
2017년도 광역시도별 traffic 현황은 다음과 같다.
gplot.region(bit_trend_2017)
2017년도 미국의 주별 traffic 현황은 다음과 같다.
gplot.region(bit_trend_2017, geos = "US",
color = terrain.colors(60, alpha = NULL))
For attribution, please cite this work as
유충현 (2018, Jan. 12). Dataholic: Google Trends Analysis_Case Study. Retrieved from https://choonghyunryu.github.io/posts/2018-01-12-google_trends/
BibTeX citation
@misc{유충현2018google, author = {유충현, }, title = {Dataholic: Google Trends Analysis_Case Study}, url = {https://choonghyunryu.github.io/posts/2018-01-12-google_trends/}, year = {2018} }