썸네일 [그로스해킹] AARRR (2) 이전 글 [그로스해킹] AARRR (1) * 본 게시글은 다음 인프런 강의를 수강하고 정리한 내용들입니다. 그로스해킹 - 데이터와 실험을 통해 성장하는 서비스를 만드는 방법 강의 - 인프런 데이터를 기반으로 정의한 핵심지표를 바 imstatdust.tistory.com * 본 게시글은 다음 인프런 강의를 수강하고 정리한 내용들입니다. 그로스해킹 - 데이터와 실험을 통해 성장하는 서비스를 만드는 방법 강의 - 인프런 데이터를 기반으로 정의한 핵심지표를 바탕으로, 실험을 통해 배움을 얻고, 이를 빠르게 반복하면서 서비스를 성장시키는 것. 그로스해킹의 기본을 다루는 101 강의입니다., 🌱 데이터와 실험을 www.inflearn.com Acquisition-2 : 모바일앱 Attribution 웹과 달리 앱은..
썸네일 [그로스해킹] AARRR (1) * 본 게시글은 다음 인프런 강의를 수강하고 정리한 내용들입니다. 그로스해킹 - 데이터와 실험을 통해 성장하는 서비스를 만드는 방법 강의 - 인프런 데이터를 기반으로 정의한 핵심지표를 바탕으로, 실험을 통해 배움을 얻고, 이를 빠르게 반복하면서 서비스를 성장시키는 것. 그로스해킹의 기본을 다루는 101 강의입니다., 🌱 데이터와 실험을 www.inflearn.com 그로스해킹이란? 위키피디아의 그로스해킹 정의에 따르면 다음과 같다. 성장을 뜻하는 growth와 해킹(hacking)이 결합된 단어로 고객의 반응에 따라 제품 및 서비스를 수정해 제품과 시장의 궁합(Product-Market Fit)을 높이는 것을 의미한다. 여기서 말하는 고객의 반응은 정량 데이터와 정성 데이터로 산출된다. 그로스해킹을 간단..
썸네일 [tableau] Sankey Diagram 생키 차트란? 흐름을 보여주는 시각화, 생키 다이어그램(Sankey Diagram) - 뉴스젤리 : 데이터 시각화 전문 기업 익숙하지 않은 데이터 시각화 유형 생키 다이어그램, 이 데이터 시각화가 무엇인지부터 어떻게 활용하는지, 또 어떻게 읽어야 하는지 생키 다이어그램에 관한 모든 것을 데이터 시각화 전문 기 newsjel.ly 생키 다이어그램은 데이터의 흐름을 나타내는 데이터 시각화 유형의 하나. 데이터의 이동이나 흐름을 시각적으로 강조하며 어떤 항목의 기여도가 높은지 파악하는데 효과적이다. 추가적인 생키 차트의 특성, 활용 방안 등은 위에 첨부해 둔 생키차트 글을 참고 바랍니다. 0. ideation : 어떻게 제작해볼까? 따로 데이터를 가공하지 않고 슈퍼스토어 내장 데이터를 이용했습니다. 생키차트를..
썸네일 [DL] 퍼셉트론 * 본 내용은 딥러닝을 공부하며 정리한 내용들입니다. 혹여나 잘못 서술되어있는 지식들은 바로잡아주시면 감사하겠습니다. 퍼셉트론(perceptron) : 다수의 신호를 입력으로 받아 하나의 신호를 출력 * 신호 : 전류와 같은 흐름, 퍼셉트론에서는 흐른다/안 흐른다(1/0)으로 구분 가능 입력이 2개인 퍼셉트론 - x1, x2는 입력신호, y는 출력신호, w1, w2는 가중치 신호 - 그림의 원을 뉴런 혹은 노드라 칭함. - 뉴런에 전해진 입력 신호의 총합이 정해진 한계를 넘어설 때만 1을 출력한다. (='뉴런이 활성화한다') * 한계값 = 임계값, θ로 나타냄. 퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여하는데, 이는 각 신호가 결과에 주는 영향력을 조절하는 요소로 작용함. (=가중치 클수록..
썸네일 [BOAZ] 제 19회 BOAZ 빅데이터 컨퍼런스 국내 최초 빅데이터 연합동아리 BOAZ에서 제 19회 빅데이터 컨퍼런스를 개최합니다! 이번 컨퍼런스에서는 데이터 분석 부문 6팀, 데이터 시각화 부문 4팀, 데이터 엔지니어링 부문 3팀의 발표가 있을 예정입니다. 많은 관심과 참여 부탁드립니다. - 일정: 2024년 01월 27일 토요일 (11:30 ~ 17:30) - 장소: 하자센터(영등포구 영신로 200) 하하허허홀 - 참가대상: 빅데이터에 관심 있는 누구나 - 참가비: 무료 - 신청 링크: https://festa.io/events/4569 제 19회 빅데이터 컨퍼런스 | Festa! Festa에서 당신이 찾는 이벤트를 만나보세요. festa.io ☎️ 문의 메일: boazbigdata@naver.com 카카오톡 채널: https://pf.kakao..
썸네일 [DL] 딥러닝의 학습 방법 * 본 내용은 딥러닝을 공부하며 정리한 내용들입니다. 혹여나 잘못 서술되어있는 지식들은 바로잡아주시면 감사하겠습니다. DL (Deep Learning), 딥 러닝을 구글에 검색했을 때 보이는 정의들은 다음과 같다. 쉽게 이야기하면 다음과 같이 이야기할 수 있고, 인간의 두뇌에서 영감을 얻은 방식으로 데이터를 처리하도록 컴퓨터를 가르치는 인공 지능(AI) 방식 어렵게 정의하면 다음과 같이 정의할 수 있을 것이다. '비선형 변환기법'의 조합을 통해 높은 수준의 추상화(abstractions, 다량의 데이터나 복잡한 자료들 속에서 핵심적인 내용 또는 기능을 요약하는 작업)를 시도하는 기계 학습 알고리즘의 집합 내가 딥러닝을 공부하면서 가장 보편적으로 많이 봤던 정의는 다음과 같았다. 머신 러닝(Machine ..
썸네일 [BOAZ] 국내 최초 빅데이터 연합동아리 🐘BOAZ🐘에서 22기 신입회원을 모집합니다! (~12/29(금)) 국내 최초 빅데이터 연합동아리 🐘BOAZ🐘에서 22기 신입회원을 모집합니다! (~12/29(금))보아즈는 '데이터 분석', '데이터 시각화', '데이터 엔지니어링' 총 세 부문에서 신입 회원을 모집하고 있습니다. 각 부문별 신입 회원은 기본기를 익힐 수 있는 BASE Session, 직접 문제를 정의하고 해결해보는 ADVance Session을 통해 빅데이터 전문성을 쌓게 됩니다. 뿐만 아니라 멘토-멘티 스터디를 비롯한 다양한 스터디, 부문 공동세션 등을 통해 자신이 추가로 관심 있는 영역에서 역량을 키울 수 있습니다.📌 BOAZ SlideShareBoaz Bigdata presentationsWe’ve updated our privacy policy so that we are compliant with..
썸네일 [공모전] 2023 학교안전사고 데이터 분석 활용 경진대회 최우수상 9, 10월을 여기다가 갈아넣은 보람이 있었다 ! 올해 시각화 프로젝트를 정말 많이 진행했지만 이번 공모전을 통해 큰 성과를 이룬 것 같아 뿌듯하다. 최우수상 받을지 정말 상상도 못했는데...🥹 이번 대회에서는 주어진 데이터 내에서 시각화를 해야하는 거라 주제를 잡고 구현하는 것에 있어 창의적으로 시각화하는 건 한정적이라고 생각했었다. 그래서 주어진 데이터를 어떻게 구성해야 효과적으로 보여줄 수 있을까에 대한 고민을 다른 프로젝트보다 더 깊이 했고, 이러한 고민들이 모여서 수상으로 이어지는 발판이 되지 않았나 싶다. 자세한 대회 내용은 팀장님이 만들어주신 한 장 요약 포스터와 태블로 퍼블릭 링크를 첨부해두었다 ... '-' 1등 수상이라니 ! 행복하다 😁 결과물 학교안전사고 데이터 분석 활용 경진대회 학..
썸네일 [SQL 고득점 Kit] SELECT (2) 1. 재구매가 일어난 상품과 회원 리스트 구하기 [문제 설명] 다음은 어느 의류 쇼핑몰의 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다. 동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다. Column name Type Nullable ONLINE_SALE_ID INTEGER FALSE USER_ID INTEGER FALSE PRODUCT_ID INTEGER FALSE SALES_AMOUNT I..
썸네일 [SQL 고득점 Kit] SELECT (1) 1. 강원도에 위치한 생산공장 목록 출력하기 [문제 설명] 다음은 식품공장의 정보를 담은 FOOD_FACTORY 테이블입니다. FOOD_FACTORY 테이블은 다음과 같으며 FACTORY_ID, FACTORY_NAME, ADDRESS, TLNO는 각각 공장 ID, 공장 이름, 주소, 전화번호를 의미합니다. Column name Type Nullable FACTORY_ID VARCHAR(10) FALSE FACTORY_NAME VARCHAR(50) FALSE ADDRESS VARCHAR(100) FALSE TLNO VARCHAR(20) TRUE [문제] FOOD_FACTORY 테이블에서 강원도에 위치한 식품공장의 공장 ID, 공장 이름, 주소를 조회하는 SQL문을 작성해주세요. 이때 결과는 공장 ID를 기..
썸네일 분류(Classification) 분류 모델은 데이터를 분류하는 방법을 학습한다. 분류 모델은 크게 이진 분류(Binary Classification)와 다중 분류(Multi Classification)로 나뉜다. 이진 분류(Binary Classification)는 입력값에 따라 모델이 분류한 카테고리가 두 가지인 분류 알고리즘. 주로 어떤 대상에 대한 규칙이 참(True)인지 거짓(False)인지를 분류하는데 쓰인다. ex. 암 종양을 분류하는 모델 → 어떤 종양을 입력으로 받았을 때 이 종양이 암 종양인지(True) 암 종양이 아닌지(False) 다중 분류(Multi Classification)은 입력값에 따라 모델이 분류한 카테고리가 세 가지 이상인 분류 알고리즘입니다. ex. 숫자 손글씨를 분류하는 모델(0~9까지 10개의 카테..
썸네일 [공모전] 광진구 빅데이터 공모전 후기 BOAZ 2차 프로젝트로 참여했던 2023년 광진구 빅데이터 분석 프로젝트! 부문은 '시각화'였지만 당시 진행하고 있는 공모전이 광진구 공모전 뿐이라 분석 공모전을 진행했다. 그래서 우리는 수상을 목표로... (목표는 크게!) 광진구 관련 데이터 분석이 중심, 시각화는 부가적인 느낌으로 공모전을 진행했다. 우리 팀은 총 2개의 모델링과 2개의 시각화를 진행했다. 1. 문제 상황 몇 년 간, 광진구의 주차장 부족과 불법주차로 인한 교통난이 심각하다는 기사 및 통계치를 참고하여, 도시교통 데이터를 활용해 주차 공간이 부족한 곳을 찾아 주차장을 설립하고, 혼잡한 곳을 찾아 주차단속 강화함이 필요하다는 생각이 들었다. 2. 주차공간 부족 문제 분석 2-1. 주차장 입지선정을 위한 주차장 면수 예측 모델 가장 주..