목록전체 글 (38)
데이터 노가다 일지

https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART001074941 데이터 마이닝 적용을 통한 아파트 가격예측에 관한 연구이준용최미화이상엽 136를 건설함으로써 주택 보급률을 높이고 있으나, 특정지역은 실제로 거주하고자 하는 사람들보다는 재산의 증식이나 투자를 목적으로 하는 사람들에 의해서 아파트 가격www.kci.go.kr졸업 논문을 위해 읽어본 논문이다.대한국토. 도시계획학회에 출간된 논문이다.학회소개대한민국 국토 및 도시계획분야 연구의 가장 오랜 역사를 가진 학회인 대한국토‧도시계획학회는 지속가능한 국토의 계획 및 관리에 이바지할 국토‧지역‧도시계획의 연구 및 교육..

의사결정 나무란?주어진 입력값들의 조합에 대한 의사결정 규칙(rule)에 따라 출력값을 예측하는 모형으로 트리구조의 그래프로 표현하는 알고리즘이다.의사결정나무모형의 예측력은 다른 지도학습 기법들에 비해 대체로 떨어지지만, 해석이 수월하다는 장점이 있다.분류문제를 다루는 분류나무, 회귀문제를 다루는 회귀나무가 있다.의사결정나무모형에 사용되는 용어뿌리마디 (root node) : 시작되는 마디로 전체 자료를 포함자식마디 (child node) : 하나의 마디로부터 분리되어 나간 2개 이상의 마디들부모마디 (parent node) : 주어진 마디의 상위마디끝마디 (terminal node): 자식마디가 없는 마디중간마디 (internal node) : 부모마디와 자식마디가 모두 있는 마디가지(branch) :..

이전 논문을 리뷰하면서 LIME 알고리즘의 존재를 알았다해당 논문만으로 LIME 알고리즘을 이해하기엔 힘들었고, 또 블랙박스 모델의 해석이 중요하다고 판단하여 이 논문을 리뷰해 보았다. 2016년 8월 16일 출간되었으며 현재 기준으로 22840회 인용되었다.지금까지 여러 논문을 리뷰해 왔지만 하나하나 뜯어보면 개판인 연구과정이나 불가능한(?) 결과가 나오는 논문이 많았다.그러므로 이제 앞으로는 인용수 기준으로 리뷰해 볼 예정이다. https://arxiv.org/abs/1602.04938 "Why Should I Trust You?": Explaining the Predictions of Any ClassifierDespite widespread adoption, machine learning mod..

먼저 손실함수란 모델의 성능을 측정하는데 사용되는 함수이며 예측값 - 실제값의 차이를 수치화한다.즉, 손실값이 낮을수록 성능이 높고손실값이 높을수록 성능이 낮다고 해석할 수 있다. 손실함수는 여러가지가 있는데 해결하려는 문제(회귀, 분류, 클러스터링 등)에 따라 사용되는 손실함수가 다르다.이번 글에서는 MSE를 중점적으로 다뤄보겠다.MSE ( Mean Squared Error ) 란?주로 회귀문제에서 사용하는 손실함수이다.먼저 수식을 적어 보겠다. 수식을 말로 설명해보자면 실제값 - 예측값의 제곱의 평균을 구한다 이다. MSE의 특징에 대해 알아보겠다. 모든 오차들이 긍정적 으로 저리되어 오차의 크기를 과장한다.쉽게 설명해보겠다.실제값예측값오차1012+2108-2 이런식으로 결과가 나왔다고 가정해보자아직..

이번엔 숫자 맞추기 게임을 재작 해보았다.생각보다 많이 쉬웠다. 그리고 무려 지피티는 사용하지 않았다! 너무 쉬운 탓도 있겠지만 그래도 나 혼자만의 힘으로 만들었다.바로 코드 설명 들어가기 전에 대략 어떤 게임인지 간단하게 설명하겠다. 사실 설명할 것도 없다.1부터 100까지의 랜덤 한 숫자를 구한 다음사용자가 숫자를 입력하면서 업다운을 하는 것이다. 코드 설명 들어가겠다.from colorama import Fore, Style, Backimport art, randomprint(Fore.CYAN + art.logo)print(Style.BRIGHT + """Welcome to the Number Guessing Game!I'm thinking of a number between 1 and 100\..
이번 프로젝트는 파이썬을 이용해서 블랙잭을 만들어 볼 것이다.자꾸 강의에서 무섭다고 겁을 주는데 생각보다 생각보다 쉬웠지만... 지피티는 사용했다. 일단 내가 해본 카드게임이라고는 원카드, 조커뽑기라서 블랙잭 규칙에 대해서 조금 공부해봤다. https://namu.wiki/w/%EB%B8%94%EB%9E%99%EC%9E%AD(%ED%94%8C%EB%A0%88%EC%9E%89%20%EC%B9%B4%EB%93%9C)#s-4.1 블랙잭(플레잉 카드)플레잉 카드 로 즐길 수 있는 카지노 게임이다. 21에 딜러보다 더 가까이 만들면 이기는 게임이다. 그렇다고 숫자가namu.wiki혹시 규칙에 대해 궁금하다면 여기서 확인해보면 좋겠다. https://media.giphy.com/media/v1.Y2lkPTc5MG..

아래 최종 코드 올려놓겠다. 코드가 필요한 사람은 맨 아래로~ Pandas를 공부하던 중 신기한 기능이 있어서 블로그에 올려본다. 바로 웹으로부터의 데이터를 임포트 하는 방법이다.보통 나는 웹으로 데이터를 얻을 때는 크롤링으로 얻는다고 생각했는데다른 방법이 있다니 신기했다. 참고로 난 크롤링 할 줄 모른다.. import pandas as pdurl = "https://en.wikipedia.org/wiki/1976_Summer_Olympics_medal_table" 먼저 Pandas를 임포트 해준다.그 다음 연습용으로 1976년 올림픽 메달 리스트를 설명하는 위키피디아 웹사이트를 url 변수에 입력한다. https://en.wikipedia.org/wiki/1976_Summer_Olympics_me..

간단하고 다양한 함수들을 사용하여 간단한 계산기 프로그램을 만들어봤다. 함수부터 설명 시작하겠다.def add(n1, n2): return n1 + n2def sub(n1, n2): return n1 - n2def mul(n1, n2): return n1 * n2def div(n1, n2): if n2 == 0: return "Error! Division by zero is not allowed" return n1 / n2 워낙 간단한 함수라서 자세한 설명은 생략하겠다.operations = { '+' : add, # add()는 함수를 사용하는것이므로 ()를 제거한다. '-' : sub, '*' : mul, '/' : div} 연산자들이..

다른 여러 프로그래밍 언어와 마찬가지로 Python에도 딕셔너리 구조가 있다.흔히 말해 사전을 생각하면 쉽다.'apple'이라는 단어를 사전에서 찾으면'apple'의 대한 여러 뜻이 나오는 것처럼딕셔너리도 비슷한 구조이다.fruits = { 'apple' : 2 'banana' : 3 'orange' : 4}위와 같은 형태로 선언 가능하다.딕셔너리의 이름은 fruits이다.키는 'apple', 'banana', 'orange'와 같고값은 2, 3, 4이다 https://docs.python.org/ko/3/tutorial/datastructures.html#dictionaries 5. Data StructuresThis chapter describes some things you’ve lear..

과거에서부터 여러 중요한 정보를 암호화하려는 노력이 많았다.과거 약 기원전 100년경에 로마의 장군인 카이사르가 동맹군들과 소통하기 위해 만든 암호인카이사르 암호에 대해 간략히 설명하겠다. 카이사르 암호(Caesar cipher) 또는 시저 암호는 암호학에서 다루는 간단한 치환암호의 일종이다.카이사르 암호는 암호화하고자 하는 내용을 알파벳별로 일정한 거리만큼 일어서 다른 알파벳으로 치환하는 방식이다.아래 사진을 보면 더 이해가 잘 될 것이다. 더 자세한 내용은 아래 링크를 달아 두겠다.https://namu.wiki/w/%EC%95%94%ED%98%B8#s-2.1.2 import artprint(art.logo)alphabet = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h',..