본문 바로가기

Lab Notes

(19)
Definition of stationary singal Stationary Signals The first natural division of all signals is into either stationary or non-stationary categories. Stationary signals are constant in their statistical parameters over time. If you look at a stationary signal for a few moments and then wait an hour and look at it again, it would look essentially the same, i.e. its overall level would be about the same and its amplitude distribu..
R을 이용한 상관관계 분석 기초적인 분석 방법 dataset을 test_data라 하면,간단히 상관계수만 알고 싶다면 (기본 pearson)cor(test_data) 상관계수 도출 메소드를 바꾸고 싶다면cor(test_data, method = "kendall") - pearson, kendall, spearman 중 선택 spearman : non-parametric test(rank), measure the degree of association between two variables (data distribution 고려 안함) kendall: non-parametric test(rank), measures the strength of dependence between two variables. 그래프와 상관계수를 함께 보고..
Stationary process, Cyclostationary process 출처http://en.wikipedia.org/wiki/Stationary_processhttp://en.wikipedia.org/wiki/Cyclostationary_process Stationary process (정상성(고정) 프로세스) 수학과 통계에서, Joint probability distribution (결합확률분포)가 시간축에서 쉬프트되더라도 변하지 않는 확률 과정(stochestic process)을 말한다. 따라서 평균이나 분산과 같은 파라미터들이 존재한다면 시간이 지남에 따라 변하거나 어떠한 경향들(trends)을 따르지 않는다. 확률과정에 대해서는 다음의 블로그 참고할 것: http://enginius.tistory.com/489 Stationarity는 Time series ana..
Quasiperiodic function (준주기적 함수) *Wikipedia 내용을 해석한 것이며 개인적인 관련지식 습득을 위해 작성된 자료로 학계에서 통용되어 쓰지 않는 한글 해석 용어가 포함되어 있을 수 있음. Ref:http://en.wikipedia.org/wiki/Quasiperiodic_functionhttp://en.wikipedia.org/wiki/Weierstrass%27s_elliptic_functionshttp://en.wikipedia.org/wiki/Elliptic_function 수학에서 주기함수(periodic function) 함수와 유사하나 엄격하게 그 정의를 만족하지 못하는 함수를 Quasiperiodic(준주기적) 이라 한다. f(z+ω) = g(z,f(z)), 이때 g는 f보다 "더 간단한 (simpler)" 함수이다 - s..
WEKA OutOfMemory 창이 뜰때 WEKA를 사용하다보면 트레이닝 데이터셋이 너무 크다던지.. 뭐 여러가지 이유로 OutOfMemory 창이 뜨면서 자바의 Xmx 옵션을 늘려라고 할 때가 있다. 윈도우를 쓰고 있다면 이때는 당황하지 말고 WEKA가 설치되어 있는 폴더로 가서 RunWeka.ini 파일을 연다. 셋팅 코드 중 maxheap=1024M 비슷하게 표시된 줄이 보일 것이다. 이것을 자신의 컴퓨터 메모리 사양을 고려하여 더 늘려주면 된다. 기가 급이라면 maxheap=2G 이렇게도 가능하다.
WEKA 결과 화면 분석 WEKA 툴을 사용하면서 항상 보는 분류 결과 써머리 화면... 나이가 들다보니 어떤 때엔 꼭 혼란에 빠진다. 이 참에 정리해 놓자. 먼저 간단한 예제 화면을 보자. Validation의 결과 화면으로서 총 22개의 인스턴스에 대한 분류 결과이다. (Correctly Classified Instances + Incorrectly Classified Instances = 18+4 = 22) 우선, 이 분류기의 정확도 (제대로된 클래스로 분류한 결과)는 Correctly Classified Instances. 즉 81.8182%이다. Kappa statistic은 Cohne's kappa 라고도 하는 통계량으로 두 명의 평가자가 있다고 했을 때 이를 평가한 결과의 일치도를 보는 통계량이다.(평가자간 일치도)..
파이썬 배포 패키지 생성 시 유의~ 파이썬에서 모듈 배포 준비를 위해 setup.py를 생성한다. 그 안의 내용은 편집기에서도 체크해 주지 않기 때문에 신경 쓸 것. 특히 py_modules ... 단수로 썼다가 계속 패키지 생성 및 로컬 인스톨 할 때 문제 발생. 문제점:배포 패키지 만든 후에도 build - library 구조의 폴더가 생성되지 않고 달랑 dist 폴더만 생성됨이 상태에서 모듈 사용을 위해 모듈을 import 시키면 에러가 발생됨. 이는 설치 시 모듈의 명확한 패스가등록되지 않아서 발생하는 문제. 실제로 모듈.py 파일을 임의로 lib 폴더에 복사하면 import 가능하였다. 결론. 철자에 유의!
conTEXT 와 Python 연동 최근 강력한 무료 텍스트 편집기인 conTEXT를 알게 되었다. 매우 큰 텍스트 데이터를 거침없이 읽어내는 좋은 툴이란다. (영국산) 다운로드는 여기 군더더기 없이 깔끔한 인터페이스가 좋다. 더불어 최근 Python을 좀 알아야 될 것 같아 개인적으로 공부 중인데 이 conTEXT를 Python용 편집기로 사용할 수 있다. 프로그램을 설치하고 1) Options -> Environmental Options -> Execute Keys 탭2) Add 버튼 클릭 -> py 입력3) py 아래로 생기는 트리에서 F9 선택4) 오른쪽 란에 다음을 입력 -Excute: C:\Python34\python.exe (이 경로는 각자의 설치 Path를 입력) -Start in: %p -Parameters: %f -Cap..