STUDY ✏️/회고

[2024 여름시즌] 5주차(6/24~6/30)

더하기plus 2024. 7. 12. 00:18

1️⃣ 회원 세그먼트 daily 스냅샷 자동화

  • braze 에서 추출하는 세그먼트를 일자별로 회원 번호를 기록하기로 하였다.
  • braze api 문서를 잘 못 찾아서 1시간 넘게 헤맸다
  • 이전 사업부에서 다른 분이 했던 코드를 샘플 삼아 적용해야겠다고 생각했는데, 데이터 저장 방식이 내가 할 수 없는 방식이었다.
    • braze 데이터를 S3에 저장 → python 으로 import 하여 기록…인데
    • 내가 S3 권한이 없다 😇
  • 대안을 찾아서 해냈다. 다행!
    • python 작업파일 하위에 임시 폴더를 생성
      → braze 데이터 zip파일의 압축을 해당 폴더에 풀어서 저장
      → python 으로 파일 import 하여 기록

 

 

 

 

2️⃣ 빅쿼리 UNNEST

  • 회사 데이터를 주로 databricks 로 보지만, 빅쿼리로 뽑아서 봐야하는 업무가 생겼다.
  • 거의 2년만에 빅쿼리를 실행하니 새롭고 짜릿해..
  • 특히 unnest는 뒤돌면 까먹는 개념이라 이걸 빨리 뽑을 수 있을까 막막했는데, 챗gpt 와 함께 해내니 1시간 이내로 해냈다💪
📖 내가 쓴 프롬프트 (예)
회사의 필드명 그대로 쓰지 않고, 임의로 바꾸어 예시로 공유.
- (role 정의) 너는 나와 함께 빅쿼리로 고객 데이터를 추출하는 데이터분석가야. 나와 함께 빅쿼리로 데이터 추출을 해야해.
- event_property 라는 unnest 필드가 있어. 이걸 활용해서 아래와 같은 데이터를 뽑고 싶은데 오류가 난다. 고쳐줘.
  SELECT userid, event_nm, event_property.field_nm, event_property.field_value FROM dataset