언어 52

[C++] STL vector

vector template class vector; // generic template T : 요소의 type Alloc: 저장공간 할당 모델을 지정. 기본적으로는 allocator 클래스로 지정되어 있다. (가장 간단한 메모리 할당 모델이고, type에 영향을 받지 않는다) 설명 https://www.cplusplus.com/reference/vector/vector/ vector - C++ Reference difference_typea signed integral type, identical to: iterator_traits ::difference_type usually the same as ptrdiff_t www.cpluspl..

언어/C&C++ 응용 2021.06.22

6. 실습: 한국 복지 패널 데이터 분석 2

데이터 불러오기, 데이터 전처리, 변수 이름 바꾸기 등의 내용은 5. 실습: 한국 복지 패널 데이터 분석 1 에 있음! https://chagaun-omija.tistory.com/56 5. 실습: 한국 복지 패널 데이터 분석 1 0. 한국 복지 패널 데이터 는 다음 사이트에서 다운받을 수 있다. https://www.koweps.re.kr:442/data/data/list.do 다만, 데이터를 받기 위해서는 회원가입 후 로그인 해야 하며, 데이터를 사용하고자 하는 목 chagaun-omija.tistory.com 1. 직종 별 임금 비교분석 직종 데이터 (code_job) 은 112, 101 등의 숫자로 되어 있는데 그 항목이 매우 많다. table로 그려봐도 뭐가 뭔지 알 수 없다. 이에 대한 내용은..

언어/R 2021.06.15

5. 실습: 한국 복지 패널 데이터 분석 1

0. 한국 복지 패널 데이터 는 다음 사이트에서 다운받을 수 있다. https://www.koweps.re.kr:442/data/data/list.do 다만, 데이터를 받기 위해서는 회원가입 후 로그인 해야 하며, 데이터를 사용하고자 하는 목적을 작성해야 한다. 이렇게 받은 데이터 파일들은 그냥 읽으면 뭔 소린지 절대 모른다. 그래서 이를 설명한 설명서를 읽어야 하는데, 이 설명서는 아래 링크에서 받는다. https://www.koweps.re.kr:442/data/book/list.do 1. 사용할 데이터를 불러온다. 데이터 파일명은 Koweps_hpda15_2020_beta1.1.sav 이다. sav 파일은 spss 전용 파일로, R에서 사용하기 위해서는 foreign 패키지를 사용해야한다. fore..

언어/R 2021.06.15

[TS] foreign package is not available

R 버전 문제인 것 같아서 R을 업데이트 해보았다. 간단하게 바로 Rstudio 내 콘솔에서 업데이트 하는 방법이다. https://needjarvis.tistory.com/535 R 버전 업그레이드하기 R의 버전을 업데이트하기 위해서 사이트에서 R을 다운로드하여 인스톨을 하는 등의 작업을 할 필요 없이 R 명령어를 몇개 입력하여 최신 버전으로 Install 할 수 있다. Step 1. install.packages("installr") needjarvis.tistory.com 위 웹사이트를 참고했다. 1. install.packages("installr") installr을 설치한다. 2. library(installr) installr 불러오기. 아래 call을 사용한다. 3. check.for.up..

언어/R 2021.06.15

4. 그래프 그리기

R은 2차원, 3차원, 지도, 네트워크 등 다양한 그래프를 지원하는데 (그래서 인기있음!) 그래프를 그릴 때는 gglot2 패키지를 자주 사용한다. 1. ggplot의 그래프 ggplot문법은 레이어 구조로 구성되어있다. Theme Cooridnates Statistics Facets Geometries: 데이터를 표현할 도형 (ex. 그래프, 선, 막대 등) Aesthetics: 축 스케일, 색, 채우기 등 미적인 요소들 Data: 시각화하려는 데이터 코딩에서 사용하는 실제적인 단계는 다음과 같다: Step1 : 배경설정 ex) ggplot(data=mpg, aes(x=displ,y=hwy)) Step 2: 그래프 추가 ex) geom_point() Step 3: 설정 추가 ex) xlim(3,6)+y..

언어/R 2021.06.15

3. 데이터 전처리

데이터 전처리는 데이터를 사용하기 전 변형해야 하는데 이를 전처리라고 한다. 구체적으로, 1) 데이터를 필요에 따라 추출하거나 2) 종류별로 나누거나 3) 데이터를 합치는 가공 등을 의미한다. 데이터 전처리에는 dplyr 패키지를 사용한다. filter() select() Arrange() mutate() : 변수 추가 summarise() : 통계치 group_by() left_join() bind_rows() 이 함수들은 모두 %>% 연산자를 이용하여 데이터에 적용한다. %>% 은 Ctrl+Shift+M 으로 자동완성할 수 있다. 1. filter(조건) 은 조건에 따라 데이터를 추출하는 것 library(dprly) library(readxl) exam % filter(math>80) exam3 조..

언어/R 2021.06.15

2. 미국 인구 데이터(midwest) 실습

midwest 데이터 : ggplot2 패키지 안에 있는 미국 인구통계 데이터 과제 1) poptotal 변수명를 total로, popasian 변수명를 asian으로 바꾸기 2) total, asian을 이용해 '전체 인구 대비 아시아인 인구 비율' 파생 변수 생성하고, 히스토그램 만들기 3) 아시아 인구 백분율 전체 평균을 구하고, 평균을 초과하면 ‘large’, 그외에는 ‘small’로 하여 파생변수를 만들자. 4) large와 small에 해당하는 지역이 얼마나 되는지 빈도표와 빈도 막대 그래프를 그려 확인해 보자. 코드 1) 데이터 로드 ggplot2 패키지를 로드하고, midwest 데이터를 가져온다. 후에 원본이 필요할 수도 있으니 복사본을 만든다. rename()을 이용하기 위해서 dply..

언어/R 2021.06.15

0. R, R Studio설치 및 기본

0. R for what? R은 통계 계산 및 그래픽을 위한 프로그래밍 언어이자, 소프트웨어 환경.- 패키지를 추가해 기능을 확장할 수 있다. - 기본적인 패키지들은 R과 함께 설치되며, 추가적으로 패키지를 받을 땐 CRAN을 통해 받을 수 있다. * CRAN: the Comprehensive R Archive Network- 가장 특징적인 장점은 그래픽 기능을 통해 질 좋은 그래프를 생성할 수 있다는 것이다. - 행렬 계산을 위해서도 사용된다. 참고) https://ko.wikipedia.org/wiki/R_(%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%98%EB%B0%8D_%EC%96%B8%EC%96%B4) R (프로그래밍 언어) - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모..

언어/R 2021.06.15