본문 바로가기

반응형

List

(28)
[Crawling] 크롤링으로 네이버 이미지 가져오기 크롤링(crawling)으로 네이버의 이미지 가져오는 법! 1. Import packages import time import os import urllib.request from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys 2. Browser 및 이미지 Setting IMAGE = input("검색할 이미지를 입력하세요: ") CNT = int(input("저장할 이미지 개수를 입력하세요: ")) ### Chrome web 사용. options = webdriver.ChromeOptio..
[Crawling] 크롤링으로 유튜브 댓글 가져오기 크롤링(crawling)으로 유튜브의 댓글 가져오는 법! 유튜브는 제 친구의 유튜브를 사용했습니다. 개인 경험에 의해서는 다음과 같은 조정이 필요할 것 같습니다. 1. 컴퓨터의 성능에 따라 페이지 로딩 시간(INTERVAL 변수)을 조절 2. 유튜브 동영상에 있는 댓글 개수 or 동영상 페이지의 광고/설명 여부에 따라 댓글 시작 위치 or 컴퓨터 화면 크기에 따라 한 번에 스크롤할 높이와 총 스크롤 횟수를 조절 1. Import packages import time import pandas as pd import requests from bs4 import BeautifulSoup from urllib import parse from selenium import webdriver fro..
[내 맘대로 SAS 공부] 범주형(categorical) 변수 처리 1. 데이터 생성 Input: 생성할 변수명 설정 - 변수1 $ : 변수1이 문자형임을 의미 - 변수2: $4. : 변수2는 문자형이며 4자리까지 출력함을 의미 - @@ : 입력한 데이터(cards)에서 한 줄에 여러 데이터가 들어와도 지정한 변수(input)에 지정된 변수에 맞춰 데이터 생성 data human;/* data 데이터 테이블 명 지정 */ input name: $4. gender $ age height @@; cards; Lee Women 25 176 Park Women 28 165 Kim Men 14 169 Choi Women 38 172 Youkkk Men 21 181 Youk Men 24 173 Leeeee Women 43 179 Lee Men 23 159 Kim Men 19 180..
[내 맘대로 SAS 공부] 산점도(scatter plot)과 히스토그램(histogram) 1. 데이터 불러오기 /* 데이터 불러오기 */ proc import datafile = "/home/회귀분석/Advertising.csv" dbms = csv out = advertising; getnames = yes; /* getnames: 첫 행을 변수명으로 사용 */ run; 2. 산점도 (1) 기본 산점도 코드 /* 기본 산점도(scatter plot) */ proc gplot data = advertising; plot sales * radio = 2; /* Y축 변수 * X축 변수 = 1 1 설명은 아래 코드*/ run; (2) 옵션을 추가한 산점도 코드 /* 옵션 추가한 산점도(scatter plot) */ symbol1 i = join v = dot c = black ci = red c..
[내 맘대로 SAS 공부] 간단한 선형 회귀 분석 1. 데이터 불러오기 proc import datafile = "/home/회귀분석/Advertising.csv" dbms = csv out = advertising; getnames = yes; /* getnames: 첫 행을 변수명으로 사용 */ run; 2. 데이터 산점도 그리기 및 요약 통계량 /* 데이터 산점도 */ proc sgscatter data = advertising; matrix sales TV radio newspaper; run; /* 데이터 요약통계량 */ proc means data = advertising n min max mean median maxdec = 2 ; run;/* maxdec = 2: 소수점 2번째 자리까지 */ 3. 데이터 표준화 proc standard d..
[내 맘대로 SAS 공부] 시계열 - 평활법 평활법에 의한 시계열 이동평균평활법 1. 단순이동평균법 (simple moving average method) 더보기 정의 - 수평적 시계열에 적용(수평적 시계열: 시간의 경과에 따라 평균 수준이 변하지 않는 시계열) - 가장 최근의 m-기간 동안 자료들의 단순평균으로 다음 값을 예측하는 방법 예측식 $\begin{align} F_{n+1} \;&=\; {1 \over m}(Z_{n} + Z_{n-1} + \cdots + Z_{n-m+1}) \\ &=\; {1 \over m} {\sum_{t=n-m+1}^{n}} Z_i \\ &=\; MA_n \end{align}$ $Z_n$: n시점에서의 실제값 $F_{n+1}$: 시점 n에서 추정한 n+1시점 예측값 2. 선형이동평균법 (linear moving me..
R studio 설치 방법 ※ R studio를 설치하기 위해서는 먼저 R을 설치해야 합니다. [ R 설치하기 ] 1. R 공식 사이트 접속 : https://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org 2. 좌측 상단 "Download - CRAN" 클릭 3. 화면(스크롤)을 내려 Korea에 해당하는 링크 중 한 개 클릭 → 어떤 것을 선택해도 무관합니다. 4. 화면 상단에서 자신의 컴퓨터 운영체제에 맞는 다운로드 실행 ○ 여기서는 Download R for Windows 사용. 5. 화면 상단의 "base" 클릭 후 다음 화면에서 "Download R.4.1.3 for Windows" 클릭 ○ R.4.1.3의 경우 version..
(수리 통계) Gamma distribution (감마 분포) Gamma distribution으로 알아보는 수리통계의 전반적인 Flow! 특징 $\cdot$ (포아송 사건이) $\alpha$번째 사건 발생까지의 대기시간을 나타내는 분포. $\cdot$ 정규분포로 설명할 수 없는 부분을 보완하기 위해 나온 확률분포. $\cdot$ 연속 확률분포로 두 개의 매개변수를 받으며 양의 실수를 가질 수 있다. Q1. 데이터 정의 $\cdot$ 여기서는 단변량 데이터의 경우만 고려. $\cdot$ Excel 형태 Index X (R.V) $\to \;\;x$ (observation) 1 $X_1$ $\to \;\;x_1$ 2 $X_2$ $\to \;\;x_2$ $\vdots$ $\vdots$ $\vdots$ n $X_n$ $\to \;\;x_n$ $\to \quad X_1,X..

반응형