본문 바로가기

분류 전체보기

(34)
[데이터리안] WEEK1 EDA 과제 : US E-Commerce Records 2020 Q. records 테이블, customer_stats 테이블에 각각 어떤 데이터들이 들어있는지 테이블에서 데이터를 10개만 뽑아서 확인해봅시다. records 테이블의 한 행은 주문 1개를 의미하나요? SELECT * FROM records LIMIT 10 아니다. order_id가 겹치는 경우가 많음. 한 행은 상품 한 개를 의미함. Q. records 테이블에 들어있는 'JP-15520' 유저의 데이터를 확인해봅시다. SELECT * FROM records WHERE customer_id = 'JP-15520' -- 해당 유저가 주문을 한 횟수는 몇 번인가요? 2번 SELECT COUNT(DISTINCT order_id) AS total_order FROM records WHERE customer_..
[SQL] 클래식 리텐션(classic retention) 분석 solvesql 플레이그라운드에서 제공하는 US E-commerce Records 2020 데이터를 사용했다. solvesql - 플레이그라운드 solvesql - 플레이그라운드 플레이그라운드 다양한 데이터에 자유롭게 SQL을 적용해보며 데이터 분석 역량을 키워보세요. solvesql.com -- 전처리한 TABLE은 WITH로 처리 후 저장 WITH records_preprocessed AS( SELECT r.customer_id , r.order_id , r.order_date , c.first_order_date , DATE_FORMAT(r.order_date, '%Y-%m-01') AS order_month , DATE_FORMAT(c.first_order_date, '%Y-%m-01') AS f..
[프로그래머스] 조건에 맞는 도서 리스트 출력하기 - MySQL 코딩테스트 연습 - 조건에 맞는 도서 리스트 출력하기 | 프로그래머스 스쿨 (programmers.co.kr) 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 문제 요약 BOOK 테이블에서 2021년에 출판된 '인문' 카테고리에 속하는 도서 리스트를 찾아서 도서 ID(BOOK_ID), 출판일 (PUBLISHED_DATE)을 출력하는 SQL문을 작성해주세요. 결과는 출판일을 기준으로 오름차순 정렬해주세요. 문제 풀이 주의사항은 "PUBLISHED_DATE의 데이트 포맷이 예시와 동일"하게 작성해야 한다는 점이다. 즉, 2020-01-01의 형태로 출력이 되어..
[2023 KAKAO BLIND RECRUITMENT/프로그래머스] 개인정보 수집 유효기간 - Python 코딩테스트 연습 - 개인정보 수집 유효기간 | 프로그래머스 스쿨 (programmers.co.kr) 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 문제 요약 고객의 약관 동의를 얻어서 수집된 1~n번으로 분류되는 개인정보 n개가 있습니다. 수집된 개인정보는 유효기간 전까지만 보관 가능하며, 유효기간이 지났다면 반드시 파기해야 합니다. 당신은 오늘 날짜로 파기해야 할 개인정보 번호들을 구하려 합니다. 모든 달은 28일까지 있다고 가정합니다. - 매개변수 오늘 날짜를 의미하는 문자열 today 약관의 유효기간을 담은 1차원 문자열 배열 terms 수집된 개인..
[Python] LSTM을 이용한 주가 예측 LSTM의 구조 및 특징 1. RNN에 비해 무한대의 기억 능력 2. RNN의 gradient 문제 극복 3. Momory Block 구조 - sigmoid 함수 계열의 activation function이 사용됨 (hard sigmoid를 사용하면 성능 UP) - output을 만들 때는 tanh 함수 사용 LSTM 기반 주가 예측 - 주가는 정상성을 만족하지 않음 - 수익률 자체도 정상성을 만족하지는 않음 ( ← 수익률 평균이 일정하지 않으므로) ⇒ 비정상성 제거 후 예측 진행 - EMA(Exponential Moving Average) 이용 import yfinance as yf import pandas as pd import numpy as np import talib # 데이터 다운로드 star..
파이썬의 정렬 라이브러리 : sorted, sort [Python] 정렬 알고리즘 정리 : 선택 / 삽입 / 퀵 / 계수 정렬 (tistory.com) [Python] 정렬 알고리즘 정리 : 선택 / 삽입 / 퀵 / 계수 정렬 1. 선택 정렬 : 가장 작은 데이터를 '선택'한 뒤 가장 앞으로 보내기 array = [7, 6, 3, 5] for i in range(len(array)): min_ind = i # 비교 대상의 값을 min_ind로 설정 for j in range(i+1, len(array)): if array[min_ind] > array[j] ss-doubt.tistory.com 기본적인 정렬 알고리즘의 원리는 위 포스팅에 정리했다. 그러나 코딩테스트에는 직접 구현이 아닌 라이브러리를 이용한 정렬을 사용하는 경우도 많다. - 표준 라이브러리..
[Python] 정렬 알고리즘 정리 : 선택 / 삽입 / 퀵 / 계수 정렬 1. 선택 정렬 : 가장 작은 데이터를 '선택'한 뒤 가장 앞으로 보내기 array = [7, 6, 3, 5] for i in range(len(array)): min_ind = i # 비교 대상의 값을 min_ind로 설정 for j in range(i+1, len(array)): if array[min_ind] > array[j] min_ind = j # 가장 작은 원소의 인덱스를 min_ind로 설정 array[i], array[min_ind] = array[min_ind], array[i] print(array) - 시간 복잡도 : O(N^2) 2. 삽입 정렬 : 두번째 원소부터 움직이면서 정렬 array = [7, 6, 3, 5] for i in range(1, len(array)): for j..
적률(Moment)과 적률 생성 함수(Moment generating function; MGF) 적률(moment) : 함수의 모양을 수학적으로 표현하는 하나의 척도 - 통계학에서 평균(1차 적률), 분산(2차 적률), 왜도(3차 적률), 첨도(4차 적률) ​ 확률변수 X의 r 제곱의 기댓값으로 계산한다. 적률 생성 함수(Moment generating function; MGF) ​ 수업 중 교수님께서 E[Y(Y-1)]이 팩토리얼과 유사해서 a factorial moment라고 하셨는데 이것도 하나의 분포를 표현하는 척도, 즉 적률인가 보다. Y(Y-1)의 평균도 수많은 적률 중 하나니까 ​