분류 전체보기
-
DAY1. OPIC 기본 주제(자기 소개, 거주지)카테고리 없음 2021. 1. 15. 00:08
Category: 자기소개 Q1. Please tell me about yourself look on the bright side: 밝은 면을 보다 spend most of the time alone: 대부분의 혼자 보내다 I'm in charge of A: 저는 A를 담당합니다. freshman - sophomore - junior - senior: 1~4학년 I'm graduating this semester: 저는 이번 학기에 졸업합니다. I'm looking for a job: 저는 직업을 찾고 있는 중입니다. go for a walk, go on a trip, go shopping / jogging chat with someone: 누군가와 수다 떨다 work out: 운동하다 surf the ..
-
구글 Cloud Vision 제품 검색 API 사용을 이용한 안경검색카테고리 없음 2020. 4. 30. 13:52
현재 인턴에 참여하던중, 제품검색 API사용에 대한 업무가 주어져, 처음으로 외부 API를 사용하여 제품 유사도 값을 실험해보는 시간을 가졌다. 자사에서는 OCR(이미지의 텍스트 감지)기술을 개발하고 있으나, 텍스트 감지가 GF(Glass Finder) 기능을 제대로 구현하지 않을 때를 대비하여, 구글 Cloud Vision 제품검색 API를 사용해보고자 했다. 목표: 구글 Cloud API에서 제공하는 ‘제품 검색 기능’ 구현 목차: 구글 Cloud 제품 검색 API 활용 3단계 CH1. 구글 Cloud API 설정 CH2. 데이터 세트 준비(입력데이터-구글 스토리지URL / 실험데이터-로컬URL) CH3. 제품 검색 API 사용 Cloud Vision API 제품검색 사용자가 자신의 이미지로 제품 세..
-
Google Analytics 및 마케팅 용어 정리카테고리 없음 2020. 4. 20. 23:26
구글 애널리틱스의 모든 데이터는 히트, 세션, 사용자 세 가지 요소를 포함하는 위계형 구조로 되어 있다. 히트가 모여 하나의 세션을 구성하고 여러 세션이 모여 하나의 사용자를 구성한다. # 히트(HIT) 웹 분석 툴에서 사용되는 가장 작은 데이터 단위로 웹사이트 방문자가 웹사이트 내에서 행하는 모든 개별적 상호작용을 '히트' 라고 한다. 히트의 대표적인 예로 페이지뷰(pageview), 이벤트(event) 그리고 거래(transaction)가 있다. '페이지 뷰'는 방문자가 하나하느이 페이지를 열어보는 것을 말하며, 하나하나의 버튼/링크를 클릭하거나 동영상을 재생하거나 마우스 커서를 움직이는 것을 '이벤트' 그리고 구매를 하는 것을 '거래'이다. 앱활동성을 체크하는 Firebase의 경우, 사용자가 앱 ..
-
시계열 데이터 이상치 모니터링 with Window size + 3 Sigma카테고리 없음 2020. 4. 17. 22:15
시계열 데이터는 시간의 영향을 많이 받으며, 원인 변수가 따로 존재하지 않는다. 원인 변수 X는 이전의 값들로 해당 값들을 가지고 트렌드, 계절성 등을 파악하여야 다음 Y값을 예측할 수 있다. 문제를 해결하기위해, 측정을 해야하고 측정한 수치들로 이슈를 만들어낼 수 있어야한다. 현재 회사에서는 Firebase SDK를 삽입하여 특정 화면의 이벤트 수가 사용자 수를 파악하고 있다. 이때 가장 먼저 보는 데이터가 DAU 일일 활성 사용자 수 이다. 일일 사용자들이 얼마나 어플상에 유입이되는 지 확인할 수 있는 어플의 성장을 확인할 수 있는 대표적인 수치이다. 이와 같이 수집한 데이터를 가지고 마케팅 및 기획의 효과를 검증하는데 활용하거나 어플 상에서 발생하는 이슈들을 파악한다. 주간 금요일 마다 DATAST..
-
[SQL] BIG QUERY with Firebase 이벤트 및 사용자 수 추출하기카테고리 없음 2020. 4. 15. 18:37
우리 어플의 경우, WEB의 경우, Google Analytics를 이용하여, 어플의 경우 Firebaes를 이용하여 데이터를 수집하고 있다. 데이터를 수집함으로서 우리 서비스 사용자들의 사용성을 확인하고 사용자 입장에서 적합한 기획-개발을 진행한다. 예를 들어, 단계별 이벤트를 설정하여, 이탈하는 페이지를 찾아내고 이벤트 수가 적은 버튼들을 점검하여 사용자 편의도 가 높은 UI를 개선하기 위한 개선 작업을 진행한다. 인턴 과정에서 서비스를 효과적으로 관리하기 위한 대쉬보드를 만드는 작업을 하였다. 처음에는 DATA STUDIO에서 FB 정보가 쌓이는 Big query와 GA를 DATA STUDIO에 직접 연결시켜 실시간 상황판을 작업했지만, DATA STUDIO 내에서 다양하게 연산을 적용하여 데이터를..
-
COVID19 EDA1: Time age data Handling카테고리 없음 2020. 4. 5. 17:41
2020.04.05 TimeAge Data. SUMMARY 1. Time_Age 데이터 에서 확진에 따른 사망률은 그려보면, 60대 이후로 급격하게 증가한다. 2. 매일 확진자를 체크했을때, 20대에서 가장 많이 나타난다. => 그래프를 보면, 20,50대가 주요 확진자이며, 20대가 매일 나타나는 확진자가 가장 많다. => 치사율이 높은 60대 이후의 고연령층 확진자에 대해서는 적극적인 care가 필요하며, 확진자가 많이 나타나는 20대, 50대가 많이 다니는 장소에 대한 주의가 요구된다. 3. 예상과 달리, 요일별 확진자의 추이가 큰 변동이 없다. 4. 연령대에 따라 요일별 확진자 추이 곡선은 매우 유사하다. => 주말이나 근무일에 따라 코로나 질병 확진자는 변화하지 않는다. 시간때에 따라 파악해보는..
-
데이터 핸들링, FCM 오픈률 조건 조사카테고리 없음 2020. 4. 2. 20:03
유저 리서치팀에 있으며, 어플에 대한 신규 고객의 1주차 리텐션 수치를 30%까지 끌어올리기 위해, 다양하게 FCM(Firebase Cloud Message)를 보내는 일을 하였다. FCM은 Firebase로 직접 예약을 설정하면, 조건에 맞는 잠재고객들에게 메세지를 날림으로써 고객이 앱에 접급하는 비율을 높일 수 있다. FCM을 보내면서 발송에 따른 오픈률을 체크하게 되는데, 이때 오픈률을 높이는 메세지 조건을 찾는 것이 중요하다. 파이썬을 이용하면, 기존의 엑셀 파일을 쉽게 다룰 수 있다. 이번 코드는 condition이라는 조건 리스트를 만들어 해당 리스트를 만족하는 데이터를 추출하여 뽑아오는 일을 한다. 프로젝트를 하다보면, 고유값이 없는 데이터를 받는 경우가 종종있다. 여기서 고유값이란 해당 정..
-
시계열 데이터 예측 모델 비교, MLP-RNN-LSTM카테고리 없음 2020. 4. 1. 21:56
저번 시간에 생성하였던 ARMA 시계열 데이터를 가지고 다음 날의 값을 예측해볼 것이다. 앞서 create_dataset 함수를 이용하여, X와 Y 데이터를 구분해준다. 이때 몇개의 시차, X값 들을 가지고 다음 값을 예측할 지, Window size로 지정해주면된다. 여기서는 5개의 X으로 다음 값을 예측해볼 것이다. 따라서, 초반에 5개는 이전의 값들이 없기 때문에, 예측을 할 수 없고 오로지 X값으로만 사용된다. 또한, 데이들은 총 3000개에서 10%는 모델을 학습시키기위해 사용되며, 나머지 10% 만들어진 몯르을 가지고 결과와 테스트 값을 비교해볼 것이다. 시퀀셜 모델 객체를 생성한뒤, 여러개의 층과 활성화함수를 설정할 수 있다. 이때, 주의할 점은 층에서는 매개변수의 제한이 없지만, input..