ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 파이썬 pandas
    DATA/_python 2017. 6. 14. 18:54

    Pandas


    Pandas는 구조화도니 데이터를 빠르고 쉽고 다양하게 가공할 수 있는 패키지다.

    numpy가 연산을 위한 패키지였다면 pandas는 데이터 분석환경을 만드는데 필요한 패키지다. 또 numpy에서는 array라는 배열을 사용했는데 pandas에서는 series와 dataframe(데이터프레임)을 사용한다.

    개인적으로 데이터 분석을 할 때 파이썬에서 pandas를 이용해 기본적인 데이터 전처리를 하고 R이나 SPSS, SAS와 같은 통계 프로그램으로 분석을 하는 것이 좋을 것 같다.


    Pandas도 파이썬 내에 기본으로 실행되는 패키지가 아니므로 import를 해주어야 한다.


    import pandas as pd

    pandas를 import 하는데 아래 코드부터는 pandas를 pd로 줄여서 사용하겠다는 뜻이다.



    # series 생성

    # list 출력

    # series 출력

    # 임의의 인덱스 부여

    # 인덱스 비교


    인덱스를 이용해 값을 찾는 방법은 at/iat, loc/iloc, ix가 있는데 ix가 어떠한 형태에도 적용이 가능하므로 이 메소드를 추천한다.

    iat와 iloc는 정수 인덱스에만 적용이 가능하다.



    Dataframe(데이터프레임)은 2차원 구조이므로 인덱스를 [0,0] 형태로 써야한다.

    pd.DataFrame()이라는 함수를 사용해 자료를 데이터프레임 구조로 바꿀 수 있다.


    # 데이터프레임 생성

    # 컬럼명 변경




    'DATA > _python' 카테고리의 다른 글

    파이썬 JSON  (1) 2017.06.23
    파이썬 CSV 파일  (0) 2017.06.21
    파이썬 numpy  (0) 2017.06.13
    파이썬 조건문과 반복문  (0) 2017.06.12
    파이썬 포맷팅  (0) 2017.06.10
Designed by Tistory.