분류 전체보기
-
파이썬 자료구조-딕셔너리, 셋DATA/_python 2017. 6. 9. 10:17
자료구조 딕셔너리(dictionary)- key(키)와 value(값)으로 이루어진 자료구조- { }으로 묶어주고 : 로 key와 value를 구분한다.- 튜플이나 리스트와 다르게 인덱스를 통하지 않고 key를 통해서 value를 얻는다.⇒ 순서가 상관이 없다. # 딕셔너리 생성 # key로 접근하여 내용 확인 # 딕셔너리 value 변경 및 확인 # 튜플로 묶인 객체 생성 # 딕셔너리 구조로 변경 # 리스트 생성 # 딕셔너리 구조로 변경 리스트를 생성할 때는 숫자가 2번째로 들어갔지만 딕셔너리에서는 첫번째로 보여진다. 딕셔너리는 순서와 관계가 없기 때문에 어떤 내용이 앞에 있는 지는 중요하지 않고 변경되어도 무관하다. # 딕셔너리 생성 # value(값)에 "long"을 포함한 key를 확인 위에서 c..
-
파이썬 자료형/자료구조-튜플, 리스트DATA/_python 2017. 6. 8. 10:31
파이썬은 1991년 귀도 반 로섬이 발표한 프로그래밍 언어로 C언어로 구현되어 있다. 이름은 프로그래머가 좋아하는 코미디 프로그램인 'Monty Python's Flying Circus'에서 유래했다. 파이썬은 인터프리터, 객체지향, 동적 타이핑의 특징을 가진 대화형 언어다.다양한 플랫폼에서 사용이 가능하며 라이브러리(모듈)이 풍부하다. 자료형 a = 1 # 정수형b = 1.2 # 실수형c = 3.1E10 # 실수형d = 0o14 # 8진수e = 0x20 # 16진수f = "hello" # 문자열 이스케이프 코드\n: 줄바꿈\t: 탭\': 단일 인용부호'\": 이중 인용부호"\r: 캐리지 리턴\f: 폼 피드\a: 벨소리\b: 백스페이스\000: null문자 자료구조 파이썬은 튜플, 리스트, 딕셔너리, 셋..
-
ADsP 3과목 데이터 분석 (2)DATA 2017. 6. 5. 08:56
3과목 데이터 분석 (2) 3-3. 정형 데이터 마이닝3-3-1. 데이터 마이닝 개요 - 데이터 마이닝: 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용- Supervised Learning(교사학습/지도학습); 의사결정나무, 인공신경망, 회귀분석, k-NN, 사례기반추론- Unsupervised Learning(비교사학습/비지도학습); 군집분석, 연관분석, OLAP, SOM- 데이터 마이닝 추진단계: 목적설정→데이터 준비→가공→기법적용→검증- 데이터 분할 1. Training data: 모델 구축용 데이터(50%) 2. Validation data: 모델 검증용 데이터(30%) 3. Test data: 모델 평가용 데이터(20%)- 모형 평가a는 우량, b는 불량인 상품일 때, 연..
-
ADsP 3과목 데이터 분석 (1)DATA 2017. 6. 1. 15:02
3과목 데이터 분석 (1) 3-1. R기초와 데이터 마트3-1-1. R기초 - R 1. 오픈소스; 도움 요청 쉬움, 패키지 수시 업데이트 2. S 통계언어 기반 (GNU S) 3. 모든 운영체제 사용가능 4. 객체지향언어 5. 함수형 언어; 깔끔한 코드, 빠른 속도, 디버깅 노력 감소- R Studio 1. 오픈소스 2. 변수와 타입 확인 가능 3. 스크립트 관리와 문서화 편함 4. 코딩을 해야 하지만 자동화 가능 5. 래틀(Rattle): R을 GUI 환경에서 편리하게 사용하도록 돕는 패키지- 화면 1. 스크립트; 입력 2. 콘솔; 실행 3. 워크스페이스; 변수와 데이터 4. 패키지, plot, help 등- 함수 - 데이터 구조 1. 벡터; 동질적(모든 원소는 같은 자료형 또는 모드) 2. 리스트; ..
-
ADsP 2과목 데이터 분석기회DATA 2017. 5. 31. 10:30
2과목 데이터 분석기회 * 정의와 함께 주관식으로 나올 수 있는 것은 밑줄 표시 2-1. 데이터 분석 기획의 이해2-1-1. 분석 기획 방향성 도출 - 분석기획을 위한 역량: 수학/통계학 지식, 정보기술, 도메인지식- 분석 대상과 방법에 따른 분석 유형분석 유형분석대상 O X 분석 방법 O Optimization Insight X Solution Discovery - 목표시점 별: 과제중심적 접근방식 vs 장기적인 마스터 플랜 방식- 분석 기획 시 고려사항1. 데이터에 대한 고려: 데이터 확보, 데이터 유형2. 적절한 비즈니스 유즈 케이스 탐색3. 장애요소에 대한 사전 계획 수립 2-1-2. 분석 방법론 - 분석방법론 모델1. 폭포수 모델: 순차적 진행으로 문제가 발견되면 피드백2. 나선형 모델: 반복을..
-
ADsP 1과목 데이터 이해DATA 2017. 5. 30. 11:14
1과목 데이터 이해 1-1. 데이터의 이해1-1-1. 데이터와 정보 - 데이터1. by 특성: 존재적(사실), 당위적(근거)2. by 유형: 정성적(언어, 문자), 정량적(수치, 도형, 기호)- 지식경영의 핵심 이슈1. 암묵지: 학습과 경험을 통해 내면화된 지식. 중요하지만 공유 어려움2. 형식지: 문서나 매뉴얼처럼 형상화된 지식. 전달과 공유 용이- DIKW1. 데이터: 객관적 사실 ex)연필 가격이 A에서 100원, B에서 200원2. 정보: 의미도출 ex)A가 싸다3. 지식: 유의미한 정보 분류 및 경험 결합 ex)저렴한 A에서 사겠다4. 지혜: 아이디어가 결합된 창의적 산물 ex)다른 상품도 A가 쌀 것이다 1-1-2. 데이터베이스 정의와 특징 - 용어의 역사1950년대: 미군에서 데이터베이스(d..