썸네일 [python] 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (4) [이전 글] 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (3) [python] 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (3) 소상공인시장진흥공단 상가업소정보로 스타벅스, 이디야 위치 분석하기 이번 실습에서는 이디야와 스타벅스의 매장입지의 차이에 대해 파악하는 과정을 다룬다. 다음 기사에서 제시된 시각화 imstatdust.tistory.com 구별 브랜드별 점포수 groupby와 pivot_table로 구별 스타벅스 이디야 매장 수 구하기 groupby로 구별 매장 수 구하기 df_cafe_vs = df_cafe.groupby(["시군구명", "브랜드명"])["상호명"].count() df_cafe_vs.head() # 인덱스 컬럼 만들기 df_cafe_vs = df_cafe_v..
썸네일 [python] 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (3) 소상공인시장진흥공단 상가업소정보로 스타벅스, 이디야 위치 분석하기 이번 실습에서는 이디야와 스타벅스의 매장입지의 차이에 대해 파악하는 과정을 다룬다. 다음 기사에서 제시된 시각화 자료와 비슷하게 만들어보기 위해 Pandas, Numpy, Seaborn, Matplotlib, folium 등을 사용한다. 관련 기사 [비즈&빅데이터]스타벅스 '쏠림' vs 이디야 '분산' 스타벅스와 이디야는 해외브랜드와 토종브랜드를 대표하는 양대 커피 전문점이다. 1999년 이대1호점으로 국내에 상륙한 스타벅스는 신세계 이마트와 미국 스타벅스 본사(스타벅스커피인터내셔 news.bizwatch.co.kr 다루는 내용 공공데이터를 활용해 텍스트 데이터 정제하고 원하는 정보 찾아내기 문자열에서 원하는 텍스트 추출하기 문자열을 활용..
썸네일 [python] 100 pandas puzzles 퀴즈 전체 중 일부만 풀이한 내용이다. 모르는 문제에는 주석을 첨부하여 함수가 갖고 있는 기능을 적어두었다. 기본 이상의 pandas 지식을 묻는 문제들은 답안지를 보며 코드 작성 방법을 배우고, 함수들의 기능을 구글링을 통해 배우는 등의 공부를 진행했다. https://wikidocs.net/book/7188 [Python 완전정복 시리즈] 2편 : Pandas DataFrame 완전정복 안녕하세요! 파이썬 완전정복 시리즈의 저자 김태준 입니다. 파이썬 완전 정복 시리즈의 궁극적인 목표는 자신만의 알고리즘 트레이딩 프로그램 만들기 입니다. 본 도서는 독자… wikidocs.net https://github.com/rougier/numpy-100 GitHub - rougier/numpy-100: 100 ..
썸네일 [python] jupyter notebook에서 생성한 folium map 티스토리로 불러오기 2023.01.25 - [python] - [python] 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (2) [python] 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (2) https://www.inflearn.com/course/%EA%B3%B5%EA%B3%B5%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%A1%9C-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0 공공데이터로 파이썬 데이터 분석 시작하 imstatdust.tistory.com 이 글을 작성하면서 가장 큰 문제가 바로 지도를 불러오는 것이었다. 인프런 강의..
썸네일 [python] 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (2) https://www.inflearn.com/course/%EA%B3%B5%EA%B3%B5%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%A1%9C-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0 공공데이터로 파이썬 데이터 분석 시작하기 - 인프런 | 강의 이디야는 스타벅스 근처에 입점한다는 설이 있었습니다. 과연 이디야와 스타벅스의 매장입지는 얼마나 차이가 날까요? 2013년부터 2019년까지 부동산 가격 변동 추세가 아파트 분양가에도 반영될 www.inflearn.com 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (1) [python..
썸네일 [python] 소상공인시장진흥공단 상가업소정보로 프랜차이즈 입점분석 (1) 상가업소정보로 프랜차이즈 입점분석 배스킨라빈스 & 던킨도너츠 프랜차이즈 매장의 밀집도를 지도를 통해 표시하고, 이를 위해 데이터 전처리 과정을 진행한다. 다루는 내용 데이터 요약하기 공공데이터를 활용해 텍스트 데이터 정제하고 원하는 정보 찾아내기 문자열에서 원하는 텍스트 추출하기 문자열을 활용한 다양한 분석 방법과 위치 정보 사용하기 folium을 통한 위경도 데이터 시각화 이해하기 folium을 통해 지도에 분석한 내용을 표현하기 - CircleMarker와 MarkerCluster 그리기 데이터셋 공공데이터 포털 : https://www.data.go.kr/dataset/15012005/fileData.do 출처 : https://www.inflearn.com/course/%EA%B3%B5%EA%B3..
썸네일 [python] 데이터 전처리 ② 순서대로 정렬하기 df.sort_values( )에 정렬 기준으로 삼을 변수를 입력한다. 높은 값에서 내림차순으로 정렬할 시, ascending = False를 입력한다. exam.sort_values('math') # math 오름차순 정렬 exam.sort_values('math', ascending = False) # math 내림차순 정렬 정렬 기준으로 삼을 변수를 여러 개 지정하려면 [ ] 안에 변수명을 나열하면 된다. 변수별로 정렬 순서를 다르게 지정하려면 ascending에 [ ]를 이용해 값을 입력한다. True를 입력하면 오름차순, False를 입력하면 내림차순으로 정렬한다. # nclass는 오름차순, math는 내림차순으로 정렬 exam.sort_values(['nclass', 'ma..
썸네일 [python] 데이터 전처리 ① : 변수 추출 데이터 전처리 : 분석에 적합하게 데이터를 가공하는 작업 함수 기능 query( ) 행 추출 df( ) 열(변수) 추출 sort_values( ) 정렬 groupby( ) 집단별로 나누기 assign( ) 변수 추가 agg( ) 통계치 구하기 merge( ) 데이터 합치기(열) concat( ) 데이터 합치기(행) 조건에 맞는 데이터 추출하기 실습에 활용한 데이터는 exam.csv 파일이다. id(번호), nclass(반), math(수학 점수), english(영어 점수), science(과학 점수) 변수들로 이루어져있다. import pandas as pd exam = pd.read_csv('exam.csv') exam # nclass가 1인 경우만 추출 exam.query('nclass == 1')..
썸네일 [python] 데이터 프레임 데이터 프레임? 행과 열로 구성된 사각 모양의 표 열 (= 컬럼 column = 변수 variable) & 행 (= 로 row = 케이스 case) 열은 속성을 의미한다면 행에는 한 사람(하나의 단위)의 정보가 들어간다. 데이터가 크다? 이는 행이 많거나 열이 많다는 것을 의미한다. 특히 열이 많다는 것이 중요한데, 왜냐하면 변수가 늘어난다는 것은 그만큼 적용해야 할 분석 기술이 달라지기 때문이다. 데이터 프레임 만들기 import pandas as pd df = pd.DataFrame({'name' : ['김지훈', '이유진', '박동현', '김민지'], 'english' : [90, 80, 60, 70], 'math' : [50, 60, 100, 20]}) 데이터 프레임 분석하기 [변수 추출] df[..
썸네일 [python] 변수 생성과 함수 동기들과 함께 Dacon 따릉이 데이터를 활용한 연습 대회에 참여하기로 결정하고 난 후 데이터를 살펴보는데, 분석과 관련하여 너무나도 부족한 지식을 가지고 있는 나를 발견하게 되었다. 그래서 2학기 학회에서 사용했던 교재 교재 복습을 시작했다. 사실 2학기에 전공 4개 + 파이썬 IDLE 수업을 수강하면서 학회에서 진행했던 파이썬 분석 공부에 소홀했었다. 분석 공부를 많이 하지 못해서 아쉬움이 많았었는데, 다행히 이번 겨울방학 학회 프로젝트도 파이썬 분석 스터디를 진행한다고 한다. 그래서 이번 겨울에는 DACON 연습 대회(개별 공부) + 학회 공부로 파이썬 데이터 분석을 공부할 것이다. 오늘 진행했던 공부는 교재의 3-4장의 내용이다. 교재 3-4장의 내용은 변수 생성 및 연산 과정, 함수 사용과 데이..