목록2023/01 (37)
도찐개찐
import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl import seaborn as sns 파이 차트 파이차트의 경우 부채꼴의 시작은 12시 방향에서 부터 시작해야함 하나의 원을 여러 영역 또는 조각으로 나눈 원그래프 각 조각은 해당 변수에 대한 관측치 개수 또는 백분율 의미 전체 대비 여러 구성 요소 간 관계를 표시하는 데 유용 고객 유형별 백분율, 다양한 제품별 매출 백분율, 다양한 국가별 수익 pie(값, 레이블, 옵션) # autopct : 부채꼴 않에 백분율 표시 vals = [10, 20, 30, 40] labels = ['Java', 'Python', 'R', 'C#'] p..
conda create -n ipywidgets_problem jupyterlab ipywidgets -y# 명목형 데이터 시각화 빈도에 따른 막대그래프 빈도비율에 따른 원그래프 빈도는 value_counts 또는 crosstab를 이용 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl import seaborn as sns # fontpath = '/usr/share/fonts/NanumGothic.ttf' fontpath = '/home/bigdata/py39/lib/python3.9/site-packages/matplotlib/mpl-data/fonts/ttf/NanumGothi..
!conda install -y matplotlib Collecting package metadata (current_repodata.json): done Solving environment: done ## Package Plan ## environment location: /opt/miniconda3 added / updated specs: - matplotlib The following packages will be downloaded: package | build ---------------------------|----------------- brotli-1.0.9 | h5eee18b_7 18 KB brotli-bin-1.0.9 | h5eee18b_7 19 KB cycler-0.11.0 | pyh..
import numpy as np import pandas as pd import scipy.stats as sp 변동성 이해하기 값들이 서로 얼마나 다른지 여부 파악 nums1 = [7,6,3,3,1] nums2 = [3,4,4,5,4] nums3 = [4,4,4,4,4] print(np.mean(nums1) ,np.mean(nums2) ,np.mean(nums3)) nums_df = pd.DataFrame({'a':nums1, 'b':nums2, 'c': nums3}) nums_df.mean() 4.0 4.0 4.0 a 4.0 b 4.0 c 4.0 dtype: float64 분산경향 기술통계의 또 다른 관점 - 분산, 산포 데이터가 어떻게 분포되어 있는지 설명하는 통계치 자료의 흩어지거나 밀집되는 정..
통계 분석하고자 하는 집단과 관련해 조사나 실험의 결과로 얻는 자료 또는 이의 요약된 형태를 의미 통계학 : 좀더 효과적인 의사결정을 할 수 있도록 수치자료를 수집,정리,표현,분석하는 학문 통계는 항상 반례 가능성을 가지고 있음 관련 통계 분야 : 사회과학통계, 자연과학통계, 수학학통계 통계학의 유형 1. 기술통계학 자료중심 통계 수집한 데이터를 요약, 묘사, 설명하는 통계기법 그래프,표,수치를 이용해서 집단의 특성 파악 예) 대표값, 분산 2. 추론통계학 예측 중심 통계 (중요도높음) 수집된 데이터를 바탕으로 예측하는 통계기법 관측된 자료를 이용해서 모집단 특성 추측 모수통계 빈도분석 상관분석 ✩✩✩✩✩ 세 집단이상 평균분석 회귀분석(!!!) ✩✩✩✩✩ 비모수통계 적합도검증 변수간 상관분석 자료의 종류..