목록Data Analysis (3)
yoongrammer
목차머신 러닝으로 시계열(Time Series) 데이터 예측하기머신 러닝은 시계열 데이터를 예측하는데 자주 사용됩니다.시계열(Time Series)란?Time series(시계열)란 일정 시간 간격으로 측정된 데이터의 시퀀스를 말합니다. 시간은 보통 초, 분, 시간, 일, 주, 월, 분기, 연도 등의 단위로 표현되며, 주식 가격, 기온, 수익률, 판매량, 웹 사이트 트래픽 등과 같은 많은 현실 세계의 데이터가 시계열로 표현됩니다. 다음은 책 판매량에 대한 시계열 데이터입니다.book_sales.head()plt.plot(book_sales)plt.ylabel('Book')plt.xlabel('Date')plt.title('Time Plot of Book Sales')Linear Regression wit..
목차판다스(Pandas) 데이터 선택하기 (Selection)Pandas는 DataFrame 또는 Series 개체의 특정 부분을 검색하고 조작할 수 있는 다양한 데이터 선택 방법을 제공합니다. select를 설명하기 위해 사용하는 DataFrame은 다음과 같습니다.Selecting ColumnsDataFrame에서 열의 하위 집합을 선택하려면 다음 구문을 사용해야 합니다.df[column_list]column_list: 선택하려는 열 이름의 목록다음은 A행을 가져오는 예입니다.df['A']# output2023-02-18 0.5094822023-02-19 0.9663992023-02-20 0.8579792023-02-21 0.7016112023-02-22 0.10203820..
목차판다스(Pandas) 데이터 구조 알아보기판다스(Pandas)는 python으로 만들어진 데이터 처리 및 분석을 위한 라이브러리입니다. 판다스 데이터 구조를 알아보기 위해선 아래와 같이 모듈을 import 합니다.import pandas as pdimport numpy as np 데이터 구조Pandas에서 데이터를 저장하기 위한 객체로 DataFrame과 Series가 있습니다. DataFramePandas에서는 데이터 테이블을 DataFrame이라고 합니다.DataFrame은 column label과 row label(=index)를 가지고 있는 2차원 배열 구조입니다.열에는 다양한 유형의 데이터(문자, 정수, 부동 소수점, 범주형 데이터 등)를 저장할 수 있습니다. DataFrame을 생성하는 ..