본문 바로가기

SAS

[내 맘대로 SAS 공부] 산점도(scatter plot)과 히스토그램(histogram)

반응형

Advertising.csv
0.00MB

1. 데이터 불러오기

/* 데이터 불러오기 */
proc import datafile = "/home/회귀분석/Advertising.csv"
	
	dbms = csv
	out = advertising;
	getnames = yes;      	/* getnames: 첫 행을 변수명으로 사용 */
run;

2. 산점도

(1) 기본 산점도 코드

/* 기본 산점도(scatter plot) */
proc gplot data = advertising;
	plot sales * radio = 2;      /* Y축 변수 * X축 변수 = 1  1 설명은 아래 코드*/
	run;

(2) 옵션을 추가한 산점도 코드

/* 옵션 추가한 산점도(scatter plot) */
	
symbol1 i = join v = dot c = black ci = red cv = blue h = 3 l = 3 width = 1.2;
symbol2 i = needle v = star c = red ci = green cv = yellow h = 5 l = 2 width = 1.2;
symbol3 i = sm v = star c = red ci = green cv = yellow h = 5 l = 2 width = 1.2;
symbol4 i = spline v = none c = red ci = green cv = yellow h = 5 l = 2 width = 1.2;
proc gplot data = advertising;
	plot sales * radio = 4;      /* 위 symbol1, symbol2,... 중 어떠한 옵션을 사용할지 결정 - 1(symbol1),  2(symbol2),... */
	run;
    
    

/* symbol: 그래프의 옵션 설정 (대소문자 모두 가능)
     - i: join(선분 연결), none(산점도), needle(x축에서 수직 선), spline(곡선) 등등
     - v: 점의 모양 (none or symbol - plus, star, sqaure, # 등등)
     - h: 점 크기
     - cv: 점 색상
     - ci: 연결 선 색상
     - l: 연결선 종류(1~46: 1은 실선, 2는 점선)
     - width: 연결선 굵기 (default = 1)	*/

3. 히스토그램

proc univariate data = advertising noprint;      /* noprint: proc univariate가 기본으로 출력하는 통계량값을 출력 안함*/
 										
	histogram sales						/* sales 변수에 대한 histogram 생성 */
                    / endpoints = 0 to 30 by 3			/* endpoints: 데이터의 분할 범위(x축) 결정 / midpoint로도 가능 */
                      vaxis = 0 to 50 by 5			/* vaxis: y축 출력 범위 */
                      normal(mu = est sigma = 3 color = blue)	/* normal: 정규분포 겹쳐 그리기 (est: 자동으로 계산해 할당) */
                      barlabel = count;				/* barlabel: 히스토그램 막대기 위에 표시할 값(count, percent, proportion) */
	run;
반응형

 

반응형