파이썬
[판다스] iloc, loc으로 인덱싱 하기
suky_da
2024. 1. 20. 19:44
iloc과 loc 은
row, column 순서로 선택
행, 열 순서!
레코드 단위로 선택 먼저 하고 칼럼을 선택한다!
따라서 iloc과 loc은 레코드 단위, 즉 가로 한 줄 단위로 데이터를 가져오는 게 더 쉽다
df.iloc[0]
>> 가로 한 줄을 가져옴. index가 0인 가로행 한 줄.
>> 가져온 데이터는 시리즈 타입이 됨
칼럼 단위, 세로로 한 줄을 가져오려면
df.iloc[:,0]
>> : 를 이용해서 일단 모든 row를 선택
>> 그 중에 0컬럼(첫번째 컬럼)을 선택
여기서 iloc과 loc의 차이점은
iloc은 인덱스 기준으로 데이터를 가져오고
loc은 레이블 기준으로 데이터를 가져옴.
중요한 점!
df.iloc[0:100]
>> 0~99까지 100개의 데이터를 가져옴
df.loc[0:100]
>> 0~100까지 101개의 데이터를 가져옴!!!!
여러 방법으로 데이터 가져오기
df['firstcolumn'].head(10)
df.firstcolumn.iloc[:10]
df.loc[:9,'firstcolumn]
>> 셋 다 firstcolumn의 첫 10개의 데이터를 가져오는 방법
참고
https://www.kaggle.com/code/residentmario/indexing-selecting-assigning
Indexing, Selecting & Assigning
Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources
www.kaggle.com