Pandas
구조화된 데이터, Array(배열) 계산, NumPy 라이브러리 기반 설계
Series데이터
import pandas as pd data = pd.Series([1,2,3,4]) print(data)
Index와 Data로 구성
Index → [0] 1 ← Data [1] 2 [2] 3 [3] 4
Data Type은 int64 정수형
Data는 values(값)을 ndarray형태로 가능
data = pd.Series([1,2,3,4], dtype = "float"
dtype 인자로 데이터 타입 지정 가능
data = pd.Series([1,2,3,4], index = ['a','b','c','d']) data['c'] = 5
Index 지정 가능, 선택해서 데이터 변경 가능
navi_dict= {'id1' : 12345, 'id2' : 67890, 'id3' : 13578} navi = pd.Series(navi_dict)
Dictionary로 Series 생성 가능
DataFrame데이터
여러 개의 Series가 모여 행과 열을 만든 데이터
만드는 방법 ① Dictionary를 활용
data = {'country' : ['china', 'korea', 'usa'] 'gdp' : [1409250000, 169320000, 2041280000], 'population' : [141500, 5180, 32676]} country = pd.DataFrame(data) country = country.set_index('country')
한 개의딕셔너리를 만들고, 데이터프레임을 만든 다음, 인덱스 지정하는 것이 중요!
만드는 방법 ② Series를 활용
gdp_dict = {'china' : 140925000, 'korea' : 169320000, 'usa' : 204128000} gdp = pd.Series(gdp_dict) pop_dict = {'china' : 141500, 'korea' : 5180, 'usa' : 32676} country = pd.DataFrame({'gdp' : gdp, 'population' : popuation})
여러 개의 딕셔너리를 만들고, 각 시리즈를 만든 다음, 데이터프레임을 만드는 것이 중요!
728x90
'배움 #Learn > 소프트웨어 #Software' 카테고리의 다른 글
문자열 포맷 지정 방법[파이썬] (0) | 2021.09.17 |
---|---|
문자열 슬라이싱[파이썬] (0) | 2021.09.17 |
랜덤 함수[파이썬] (0) | 2021.09.17 |
숫자형 함수[파이썬] (0) | 2021.09.17 |
[비전공자의 파이썬 독학]드디어 파이썬 시작! - 파이썬 입문과 크롤링 기초 강의 (0) | 2021.08.02 |