반응형

정보통계학과 18

웹문서 데이터의 수집

여기 웹 문서에서 R데이터 분석, 마케팅조사, 베이즈데이터분석, 비정형데이터 분석, 이슈로 보는 오늘날의 유럽 의 제목을 뽑겠다.1) httr 라이브러리(웹문서 수집 패키지) 를 설정 후(만약 설치되어 있지 않다면 install.packages("httr")을 먼저 하도록 하자!) 웹 페이지의 Url을 GET함수에 넣는다library(httr)webpage=GET('https://press.knou.ac.kr/goods/textBookList.do?condLscValue=001&condMscValue=003&condSscValue=007&condScyr=4') 2)XML라이브러리(html문서 파싱)를 설정 후(만약 설치되어 있지 않다면 install.packages("XML")을 먼저 하도록 하자!) 웹..

1.3 회귀선의 추정

1.3.1 최소제곱법 n개의 관찰점(X1,Y1), (X2,Y2).... 있을 때, 이 데이터를 이용하여 회귀직선을 구하는 방법으로 가장 널리 이용되는 방법이 최소제곱법이다. 최소제곱법은 회귀식에서 오차제곱들의 합을 최소로 하는 값들을 추정값으로 하는 방법이다. 표본 상점의 인테리어비와 총 판매액 자료에 대하여 회귀직선을 구하고, 산점도 위에 회귀직선을 그려보다 > summary(market_lm) Call: lm(formula = Y ~ X, data = market) Residuals: Min 1Q Median 3Q Max -2.02908 -1.35349 -0.05685 0.98903 2.51517 Coefficients: Estimate Std. Error t value Pr(>|t|) (Interc..

1.1 회귀분석이란 ~ 1.2 단순회귀모형

1.1 회귀분석이란 회귀분석은 변수간에 상호관련성을 찾아보는 과정에서, 다른 변수에 영향을 주는 변수 >> 독립변수, 설명변수 독립변수에 의하여 영향을 받는 변수 >> 종속변수, 반응변수 독립변수와 종속변수 간의 함수 관계를 규명하는 통계적인 분석방법 1.2 단순회귀모형 1.2.1 산점도 setwd("D:/방송대/회귀모형 자료(2024년 1월 출간)") market = read.csv("market-1.csv") head(market) plot(market$X,market$Y, xlab="인테리어비", ylab="총판매액", pch=19) title("인테리어비와 판매액의 산점도") market_lm=lm(Y~X, data=market) abline(market_lm) 인테리어비가 증가하면 총판매액도 증..

4장 데이터의 추가, 삭제, 갱신

16강 행 추가하기 - INSERT INSERT INTO 테이블명 VALUES (값1, 값2...) INSERT INTO 테이블명(열1,열2) VALUES (값1, 값2) 1) NOT NULL 제약이 걸려 있으면 NULL 값을 입력할 수 없다 (DESC 명령어도 확인가능) 2) 열 구성에서 Default는 명시적으로 값을 지정하지 않았을 경우 사용하는 초깃값 17강 삭제하기 - DELETE DELETE FROM 테이블명 WHERE 조건식 18강 데이터 갱신하기 - UPDATE UPDATE 테이블명 SET 열1=값1, 열2=값2... WHERE 조건식 1) where가 없다면 모든 행에 적용됨 2) 복수열 갱신 시, 오라클과 mysql은 다르게 처리한다. 오라클은 SET 구에 기술한 식의 순서가 처리에 영..

다양한 데이터베이스

1. 데이터베이스 종류 계층형 데이터 베이스 : 폴더와 파일 등의 계층 구조로 데이터를 저장하는 방식으로 하드디스크나 DVD파일 시스템에서 주로 사용 관계형 데이터 베이스 : 행과 열을 가지는 표 형식 데이터를 저장하는 형태의 데이터베이스로 SQL명령어로 조작가능 객체지향 데이터베이스 : 객체 그대로를 데이터베이스의 데이터로 저장 http://www.comworld.co.kr/news/articleView.html?idxno=48790 [IT산업 20년 전] 객체지향 데이터베이스의 몰락 - 컴퓨터월드 [컴퓨터월드] 20년 전만 하더라도 ‘객체지향DBMS’의 발전은 눈부셨다. CAD/CAM, GIS등 그동안 데이터화 할 수 없었던 많은 비정형데... www.comworld.co.kr 비정형데이터를 데이터베..

데이터베이스

데이터 : 컴퓨터 안에 기록되어 있는 숫자. 데이터 베이스 : 데이터들의 집합 1. 시스템 내의 데이터 베이스 데이터 베이스는 서버에서 운용되거나 개인용 컴퓨터나 휴대용 기기에 내장되어 있기도 한다. 인터넷에서 쇼핑 등 -> 웹 시스템(데이터 센터) -> 데이터 베이스 편의점 쇼핑 시, 계산대(POS 시스템) -> 데이터 베이스 휴대전화 전화번호부 -> 휴대용 기기 데이터 베이스 2. DB와 DBMS DB = DataBase = 저장장치 내에 정리되어 저장된 데이터의 집합 DBMS = DataBase Management System = 데이터베이스를 효율적으로 관리하는 소프트웨어 DBMS 필요성 1) 생산성 : 데이터의 검색, 추가, 삭제, 갱신과 같은 기본기능을 DBMS에서 제공 2) 기능성 : 데이터..

FORCE 변수

/* sashelp.class 에서 obs 5개를 가져와서 데이터 allvars 생성.*/ data allvars; set sashelp.class (obs=5); run; /* sashelp.class 에서 obs 5개를 가져오되, age 변수만 가져와서 onevar 생성*/ data onevar (keep= age); set sashelp.class (obs=5); run; /* onevar 와 allvars를 합치는 작업을 하는데.. 이때 이건 에러가 난다. 이유는 allvars에서 onevar에 있는 변수를 추가할 수 없어서, 추가가 되지 않는다. 자동으로 Force 옵션을 사용해서 파일을 추가 하게 된다. */ proc append base=onevar data=allvars; run; /* 결..

반응형