썸네일 [tableau] 계산된 필드, 필터, 매개변수 필터 필터는 데이터를 원하는 조건에 맞게 걸러주는 역할을 한다. 필터에는 여러 가지의 기능을 가진 다양한 필터가 있고, 작동 순서가 정해져 있어 어떤 필터를 먼저 사용하는지에 따라 결과물이 다르게 나타난다. 1. 추출 필터 추출 필터는 데이터 원본 소스에서 데이터의 일부분만 추출하고 싶을 때 사용하는 필터다. 태블로 [데이터 원본] 창에서 [추출]을 누르고 옆에 [편집]을 클릭해 원하는대로 추출할 데이터를 편집한 후 저장한다. 2. 데이터 원본 필터 데이터 원본 필터는 원본에서 원하는 부분만 볼 때 사용하는 필터다. 원본 자체를 건들이는 방식이라 따로 데이터 저장은 하지 않는다. 사용하는 방법은 [데이터 원본 창]의 필터 밑 [추가] 버튼을 클릭하여 데이터를 추출하면 된다. 3. 차원 필터 차원 필터는 ..
썸네일 [tableau] 그래프 만들기 태블로를 활용해서 만들 수 있는 그래프의 종류는 다양하다. 막대 그래프, 파이 차트, 간트 차트, 라인 차트 등 너무나도 종류가 다양해 활용하는 데이터에 알맞게 그래프를 사용하는 것이 중요하다. (지난 학기 수강했던 태블로 수업 교재에도 기본 그래프만 27개의 챕터로 구성되어있다.) 이번에는 가장 기본적인 차트인 막대 그래프, 라인 그래프와 도넛 차트, 워드 클라우드 작성했던 것을 기록해보려한다. 데이터는 모두 태블로 내장 데이터인 슈퍼 스토어와 세계 지표를 활용했다. 막대 그래프 배송형태별 수익 구성 비율을 연도별로 나타낸 막대 그래프다. 열에는 배송 날짜를 우클릭해 불연속형 년도를 클릭해 배치해주고, 배송 형태 또한 함께 넣는다. 행에는 수익을 넣는다. 색상에 배송 형태를 넣어 막대 그래프 색상을 변..
썸네일 [python] 데이터 전처리 ② 순서대로 정렬하기 df.sort_values( )에 정렬 기준으로 삼을 변수를 입력한다. 높은 값에서 내림차순으로 정렬할 시, ascending = False를 입력한다. exam.sort_values('math') # math 오름차순 정렬 exam.sort_values('math', ascending = False) # math 내림차순 정렬 정렬 기준으로 삼을 변수를 여러 개 지정하려면 [ ] 안에 변수명을 나열하면 된다. 변수별로 정렬 순서를 다르게 지정하려면 ascending에 [ ]를 이용해 값을 입력한다. True를 입력하면 오름차순, False를 입력하면 내림차순으로 정렬한다. # nclass는 오름차순, math는 내림차순으로 정렬 exam.sort_values(['nclass', 'ma..
썸네일 [BOAZ] 제 17회 BOAZ 빅데이터 컨퍼런스 국내 최초 대학생 빅데이터 연합동아리 BOAZ에서 제 17회 빅데이터 컨퍼런스를 개최합니다. 많은 참여와 관심 부탁드립니다. 일정 : 2023년 1월 28일 (토) 13:00 - 18:00 장소 : 서울시청 서소문별관 후생동 4층 강당 참가 대상 : 빅데이터에 관심 있는 누구나 참가비 : 무료 신청 링크 : https://onoffmix.com/event/269081 제 17회 BOAZ 빅데이터 컨퍼런스 세상의 모든 모임 '온오프믹스' onoffmix.com 문의 mail : boazbigdata@naver.com 카카오톡 채널 : https://pf.kakao.com/_xeaCBK/chat BOAZ 카카오톡 채팅을 해보세요. pf.kakao.com
썸네일 [python] 데이터 전처리 ① : 변수 추출 데이터 전처리 : 분석에 적합하게 데이터를 가공하는 작업 함수 기능 query( ) 행 추출 df( ) 열(변수) 추출 sort_values( ) 정렬 groupby( ) 집단별로 나누기 assign( ) 변수 추가 agg( ) 통계치 구하기 merge( ) 데이터 합치기(열) concat( ) 데이터 합치기(행) 조건에 맞는 데이터 추출하기 실습에 활용한 데이터는 exam.csv 파일이다. id(번호), nclass(반), math(수학 점수), english(영어 점수), science(과학 점수) 변수들로 이루어져있다. import pandas as pd exam = pd.read_csv('exam.csv') exam # nclass가 1인 경우만 추출 exam.query('nclass == 1')..
썸네일 국내 최초 빅데이터 동아리, BOAZ 20기 데이터 시각화 부문 합격 수기 1학년 2학기 시험기간을 보내며 대학교 게시판을 보다가 우연히 BOAZ 동아리 홍보글을 보게 되었다. 겨울방학 때도 공부를 계속해서 해야겠다는 계획은 가지고 있었지만 막상 추상적이고 막연하게 짜고 있는 내 모습을 보고 실제로 무언가를 해봐야겠다...! 이런 생각이 들던 찰나였어서 큰 고민없이 바로 지원했다. BOAZ 데이터 분석 동아리에는 크게 3가지의 트랙이 있다. 데이터 분석 | 데이터 시각화 | 데이터 엔지니어링 이 중에서 나는 데이터 시각화 부문에 지원했다. 아직 분석이나 엔지니어링에 지원할만큼 관심이 아주 많거나 지식이 있는 것이 아니었기도 했고, 데이터 시각화 부문에서 다루는 Tableau라는 프로그램을 배우는 과목을 지난 학기 때 수강했었는데 A+ 라는 성적이 증명할 만큼 정말 열심히 그리고..
썸네일 [book] 한 스푼의 시간 최근 책을 읽어야겠다는 생각이 많이 들어 학교 전자 도서관을 이용하여 눈에 끌리는 소설책 한 권을 빌려 읽었다. 2023 첫 도서 제목은 . 세탁소를 운영하고 있는 '명정'과 사고를 당한 이후 행방불명 된 아들로부터 배송된 휴머노이드 로봇 '은결'의 이야기다. '은결'이 인간과 함께 시간을 보내며 인간의 삶을 학습하는 과정들이 드러난 문장들이 굉장히 섬세하다. 이과와 문과의 감성들이 모두 섞여 있어 읽으면서 문장을 스크랩하면서 읽을 정도로 마음에 드는 문장들이 많았다. "그렇게 부서지기 쉬운 거라면 사람들은 어째서 가족을 이룹니까." '명정'이 자신의 아들을 이국에 있는 육촌동생 내외에 부탁했지만 결국 '남겨먹기'를 시전해 갈등이 있었던 이야기들을 '은결'에게 하자 위와 같이 이야기한다. 이 문장을 읽으..
썸네일 [python] 데이터 프레임 데이터 프레임? 행과 열로 구성된 사각 모양의 표 열 (= 컬럼 column = 변수 variable) & 행 (= 로 row = 케이스 case) 열은 속성을 의미한다면 행에는 한 사람(하나의 단위)의 정보가 들어간다. 데이터가 크다? 이는 행이 많거나 열이 많다는 것을 의미한다. 특히 열이 많다는 것이 중요한데, 왜냐하면 변수가 늘어난다는 것은 그만큼 적용해야 할 분석 기술이 달라지기 때문이다. 데이터 프레임 만들기 import pandas as pd df = pd.DataFrame({'name' : ['김지훈', '이유진', '박동현', '김민지'], 'english' : [90, 80, 60, 70], 'math' : [50, 60, 100, 20]}) 데이터 프레임 분석하기 [변수 추출] df[..
썸네일 [python] 변수 생성과 함수 동기들과 함께 Dacon 따릉이 데이터를 활용한 연습 대회에 참여하기로 결정하고 난 후 데이터를 살펴보는데, 분석과 관련하여 너무나도 부족한 지식을 가지고 있는 나를 발견하게 되었다. 그래서 2학기 학회에서 사용했던 교재 교재 복습을 시작했다. 사실 2학기에 전공 4개 + 파이썬 IDLE 수업을 수강하면서 학회에서 진행했던 파이썬 분석 공부에 소홀했었다. 분석 공부를 많이 하지 못해서 아쉬움이 많았었는데, 다행히 이번 겨울방학 학회 프로젝트도 파이썬 분석 스터디를 진행한다고 한다. 그래서 이번 겨울에는 DACON 연습 대회(개별 공부) + 학회 공부로 파이썬 데이터 분석을 공부할 것이다. 오늘 진행했던 공부는 교재의 3-4장의 내용이다. 교재 3-4장의 내용은 변수 생성 및 연산 과정, 함수 사용과 데이..