1. 데이터 불러오기
/* 데이터 불러오기 */
proc import datafile = "/home/회귀분석/Advertising.csv"
dbms = csv
out = advertising;
getnames = yes; /* getnames: 첫 행을 변수명으로 사용 */
run;
2. 산점도
(1) 기본 산점도 코드
/* 기본 산점도(scatter plot) */
proc gplot data = advertising;
plot sales * radio = 2; /* Y축 변수 * X축 변수 = 1 1 설명은 아래 코드*/
run;
(2) 옵션을 추가한 산점도 코드
/* 옵션 추가한 산점도(scatter plot) */
symbol1 i = join v = dot c = black ci = red cv = blue h = 3 l = 3 width = 1.2;
symbol2 i = needle v = star c = red ci = green cv = yellow h = 5 l = 2 width = 1.2;
symbol3 i = sm v = star c = red ci = green cv = yellow h = 5 l = 2 width = 1.2;
symbol4 i = spline v = none c = red ci = green cv = yellow h = 5 l = 2 width = 1.2;
proc gplot data = advertising;
plot sales * radio = 4; /* 위 symbol1, symbol2,... 중 어떠한 옵션을 사용할지 결정 - 1(symbol1), 2(symbol2),... */
run;
/* symbol: 그래프의 옵션 설정 (대소문자 모두 가능)
- i: join(선분 연결), none(산점도), needle(x축에서 수직 선), spline(곡선) 등등
- v: 점의 모양 (none or symbol - plus, star, sqaure, # 등등)
- h: 점 크기
- cv: 점 색상
- ci: 연결 선 색상
- l: 연결선 종류(1~46: 1은 실선, 2는 점선)
- width: 연결선 굵기 (default = 1) */
3. 히스토그램
proc univariate data = advertising noprint; /* noprint: proc univariate가 기본으로 출력하는 통계량값을 출력 안함*/
histogram sales /* sales 변수에 대한 histogram 생성 */
/ endpoints = 0 to 30 by 3 /* endpoints: 데이터의 분할 범위(x축) 결정 / midpoint로도 가능 */
vaxis = 0 to 50 by 5 /* vaxis: y축 출력 범위 */
normal(mu = est sigma = 3 color = blue) /* normal: 정규분포 겹쳐 그리기 (est: 자동으로 계산해 할당) */
barlabel = count; /* barlabel: 히스토그램 막대기 위에 표시할 값(count, percent, proportion) */
run;
반응형
반응형
'SAS' 카테고리의 다른 글
[내 맘대로 SAS 공부] 범주형(categorical) 변수 처리 (0) | 2023.01.03 |
---|---|
[내 맘대로 SAS 공부] 간단한 선형 회귀 분석 (0) | 2022.12.30 |
[내 맘대로 SAS 공부] 시계열 - 평활법 (1) | 2022.12.29 |