배움 #Learn/소프트웨어 #Software

Pandas의 Series데이터와 DataFrame데이터 만들기[파이썬]

MyLifecoding 2021. 9. 23. 13:39
Pandas

구조화된 데이터, Array(배열) 계산, NumPy 라이브러리 기반 설계

 

Series데이터
import pandas as pd
data = pd.Series([1,2,3,4])
print(data)​
Index [0] 1 Data
[1] 2
[2] 3
[3] 4
Index와 Data로 구성
Data Type은 int64 정수형
Data는 values(값)을 ndarray형태로 가능
data = pd.Series([1,2,3,4], dtype = "float"​

 

dtype 인자로 데이터 타입 지정 가능
data = pd.Series([1,2,3,4], index = ['a','b','c','d'])
data['c'] = 5​

Index 지정 가능, 선택해서 데이터 변경 가능

navi_dict= {'id1' : 12345, 
	    'id2' : 67890,
            'id3' : 13578}
navi = pd.Series(navi_dict)​

 

Dictionary로 Series 생성 가능

DataFrame데이터
여러 개의 Series가 모여 행과 열을 만든 데이터
만드는 방법 ① Dictionary를 활용
data = {'country' : ['china', 'korea', 'usa']
	'gdp' : [1409250000, 169320000, 2041280000],
        'population' : [141500, 5180, 32676]}
country = pd.DataFrame(data)
country = country.set_index('country')​

한 개의딕셔너리를 만들고, 데이터프레임을 만든 다음, 인덱스 지정하는 것이 중요!


만드는 방법 ② Series를 활용
gdp_dict = {'china' : 140925000, 'korea' : 169320000, 'usa' : 204128000}
gdp = pd.Series(gdp_dict)
pop_dict = {'china' : 141500, 'korea' : 5180, 'usa' : 32676}
country = pd.DataFrame({'gdp' : gdp, 'population' : popuation})​

 

여러 개의 딕셔너리를 만들고, 각 시리즈를 만든 다음, 데이터프레임을 만드는 것이 중요!

728x90