본문 바로가기

배우는 여자/코딩

데이터의 형태 정리 데이터는 범주형 데이터와 수치형 데이터로 이루어져 있다.범주형명목형대부분 글씨로 되어있음, 계산 불가능순서형서열 비교 가능수치형이산형셀 수 있음, 유한함연속형등간형, 비율형 독립변수 X수치형범주형종속변수 Y수치형상관분석, 회귀분석t-test, ANOVA범주형로지스틱 회귀분석카이제곱검정보통 데이터의 관계를 알아보기 위해 분석이 사용되며 로지스틱 회귀분석의 경우 분류에 많이 사용된다.데이터를 확인할 때에는 차트를 그려보면 한 눈에 파악하기 쉽다.일변량 차트범주형 - 파이 그래프, 바 차트수치형 - 히스토그램, 박스플랏 (분포, 모양, outlier 등을 알 수 있음)다변량 차트번주형 & 수치형 - 박스플랏수치형 & 수치형 - 산점도 플랏data의 관계를 알 수 있다.group의 존재 유무를 알 수 있음이상치.. 더보기
오픈소스 소프트웨어 라이센스 요즘 시기에는 개발을 하면서 오픈소스를 사용하지 않는게 더 어려운 시기인 것 같다. 상업적으로 사용이 될 경우에는 라이센스 관련 증빙도 해야할 일이 있는데 이에 대해 별 다른 교육 없이 스쳐지나가듯 들은 기억만 있어서 정리해 보았다.위의 그래프는 나무위키에서 가져온 오픈소스 라이센스 점유율 현황이다.각 라이센스에 대해 간단히 정리해보자.GPL 규약GNU General Public License강력하다. 일부 copy를 넣을 경우 내 code도 공개해야 한다. 전염력이 있어 사용시 내 코드도 GPL이 된다.적용 예시 - 리눅스 커널, x264, x265, FFMPEGBSD LicenseBerkeley Software Distribution License사용했다는 것을 명시해야함. 일부 코드 수정시 수정한 .. 더보기
[Algorithm] 병합 정렬, Merge sorting - 안정적이고 빠르다 데이터를 정렬하는데는 다양한 방법이 있는데 그 중 시간 복잡도가 O(n lon n) 인 알고리즘이 빠른 편이라고 알려져 있다. 동일한 시간 복잡도를 가진 알고리즘으로는 quick sorting, merge sorting, heap sorting 등이 있다. 그 중 heap sorting을 가장 많이 사용했던 것 같긴 한데 오늘은 안정적이면서 이해하기 쉽고 외우기도 쉬운 merge sorting을 복기해보았다. 병합 정렬은 전체 데이터를 반씩 반씩 균일하게 나누어서 가장 작은 단위까지 쪼갠 후에 다시 합쳐서 비교하는 방식으로 정렬한다. 예를 들면, {7, 1, 4, 3} 라는 데이터를 내림차순으로 정렬해보자. - {(7, 1), (4, 3)} // 2개씩 나눔 - {(1, 7), (3, 4)} // 각 나.. 더보기
c언어 입출력 기본 #include // printf 사용 #include #include printf("%d", int 변수); // int 변수 출력 printf("%s", str); // 문자열 변수 출력 fopen("___.txt", "r" or "w") // "r" 읽기 , "w" 쓰기 ("%[^\n]s", str) // 문자열 \n 까지 읽어들이기 더보기