목록전체 글 (261)
당니의 개발자 스토리
Gradient Descent(경사 하강법)은 기울기(gradient)를 따라 손실(loss)을 줄여가는 과정몇가지 가정을 해야하는데,내가 함수 f와 f' 혹은 l을 알 뿐만 아니라 l에 대한 Gradient 정보가 나한테 있다는 것을 가정해야함.내가 함수를 전체적으로 안다고 하면, 당연히 어디가 작은지 알 수 있을 것임. 그래서 이러한 Global View는 없다고 가정할 것임. 우리가 전체적인 함수의 개형을 모르고, 함수의 특정 값에 대한 특정 위치에서의 미분값만 계산할 수 있는 능력이 있다고 했을 때결국 Gradient Descent가 주장하는 것은 우리가 할 수 있는 건 산에서 슬로프를 따라 걸어 내려가는 것밖에 없다는 것임.Learning Rate(학습률)는 기계학습에서 모델이 한 번에 얼마나 ..
손실함수를 Mean-Squared Error 라고 하고 내 모델의 예측값과 정답 간 차이의 제곱을 비교하는 형태로 Loss를 계산하고,이 손실이 가장 작아지도록 하는, 즉 내 모델과 정답의 오차가 가장 적은 a와 b를 찾는 문제가 선형회귀 문제였음. 우리가 바라보게 될 Supervised Learning 문제들은 실제로 다차원인 경우가 많음.그림 같은 경우도 다차원 벡터임문제 같은 경우도 우리가 벡터로 Embedding 하게 된다면 굉장히 다차원 형태의 입력이 될 것임 그래서 수업에서는 다차원 입력에 대한 Linear regression을 다룰 것임이번엔 "키"와 "손 크기(hand size)" 두 가지 정보를 가지고 몸무게를 예측한다고 생각x = (x₁, x₂)에서x₁: 키x₂: 손 크기모델y = a₁..
영화의 리뷰가 주어져 있을 때 리뷰가 긍정적인지 부정적인지에 맞히는 문제 다음에 들어갈 단어를 맞추는 문제도 지도학습에서 설명할 거임 지금까지 보여준 예시 모두 어떠한 문제가 있고 그 문제에 대한 정답이 있을 때'문제와 정답 쌍'을 굉장히 다양하게 제공하는 형태로 학습을 진행 할게 될 것이다 x는 문제, 대부분 다차원 벡터y는 정답, 카테고리(ex. 비행기, 고양이, ...)라고 볼 수 있음. 열 개의 카테고리 중 하나라고 하면 10가지 값을 가지는 이산형 집합에서 나오는 값이 될 수 있음.다음날 주식을 예측하는 문제라고 하면 주식이 얼마인지를 맞추는 실수값이 될 수도 있음. 지도 학습에서 가장 중요한 점 중 하나는 이러한 정답과 입력의 pair들이 데이터로 여러개 존재 하는 상황을 가정하고,이 데이터를..
공급망 관리(SCM, Supply Chain Management)고객이 원하는 제품을 합리적인 가격으로 정확한 상점에서 정확한 수량과 시간에 맞추는 노력이 공급망 관리 라고 해요. 기억에 남았던 것은 최근에 '물류 4.0' 이라는 개념이 나왔대요.물류랑 4차 산업혁명 기술을 합친 말인데, 이제까지는 일반적으로 트럭 기사님이 직접 배송지 입력하고 창고를 관리하는 사람도 수기로 재고를 체크하는데앞으로 올 물류 4.0 시대에는 생성형 AI가 수요를 예측해서 재고를 자동으로 관리하고,로봇이 상품을 꺼내고 포장해주고 드론이나 자율주행차가 배송까지 한다고 해요.찾아보니까 실제로 Amazon이나 월마트 같은 기업에서는 이미 드론 배송까지 도입되고 있대요. 그리고 공급망은 어떤 요소로 이루어져 있는가 에서는효율성과 대..
현실에는 다양하고 복잡한 데이터가 존재따라서 공변량 조정(Covariate Adjustment) 방식 외에 보다 다양한 상황에서 사용할 수 있는 인과추론 방법들을 소개할 것임. 📌 슬라이드 1: IV under Linear Model핵심 아이디어:우리가 **공부량(X)**이 **시험점수(Y)**에 영향을 주는지를 알고 싶은 상황이라고 해봅시다.그런데 **지능(ε)**이라는 숨겨진 요소가 있어서 공부도 많이 하게 하고, 점수도 잘 받게 만듭니다.이럴 때 그냥 **선형 회귀(OLS)**로 X → Y 관계를 추정하면, 사실 지능이 중간에 껴 있어서 결과가 **왜곡(biased)**됩니다.예시:예: A라는 학생이 10시간 공부해서 95점, B라는 학생은 2시간 공부하고도 90점이라면,→ B는 공부는 적게 했..
조정 이라고 하는 인과추론을 하는 방법에 대해서 알아보자 단위 처리값 안정성 가정(SUTVA, Stable Unit Treatment Value Assumption) SUTVA가 가정하는 두가지1. 간섭(Interference)이 없어야 된다.: 한 유닛의 처치가 다른 유닛의 결과에 영향을 미치면 안 된다. 2. 하나의 처치가 여러방식으로 구현 되어서는 안 된다. 예를 들어서 수술의 경우 어떤 의사가 하느냐에 따라서 다르게 수행 되면 안 된다. 🔷 수식 설명1. 관측된 데이터 XiX_iXi=1X_i = 1: i번 사람이 치료 받음Xi=0X_i = 0: i번 사람이 치료 안 받음2. 관측된 결과 YiY_i는 무엇인가?핵심 질문:“나는 결과 Yi를 봤는데, 이게 과연 Yi(1)일까, Yi(0)일까?”만약..
인과성이 무엇인지 설명하고 인과성과 상관성에 대한 차이를 설명 할 것임.그리고 인과 추론을 하기 위한 기본적인 프레임워크에 관해서 설명 할 거임. 1부에서는 통계적 상관 관계 와 인간성이 무엇이 다른지 알아 볼 거다.2부에서는 인과 추론의 2가지 주요 프레임워크를 소개하고 인과 효과 식별과 추정에 대해서 다룰 예정3부에서는 다양한 인과 추론 방법들을 소개, 각각의 특징에 관해서 얘기할 거다. 인과 추론을 하기 위해서는 왜 이론적 틀인 프레임워크가 필요하고 가정이 필요한지에 대해 알아보자.이것성은 어떤 한 사건이나 상태 혹은 객체가 다른 어떠한 결과를 일으키는 데 영향을 주는 것을 말한다.이때 즉 원인이 결과에 어떻게 기여 하는지를 말하는 거다. 이에 반해서 어떤 거는 다른 것과 연관 관계가 있다, 상관..
수요예측의 다양한 기법들을 바탕으로 실제 사례를 가지고 사례 분석을 하고, 수요 예측을 하는 시간 실제 사례는 한국토지주택공사에서 사용했던 식사 비율 예측 데이터를 가지고앞에서 공부했던 전통적 통계 기반 모델, 인공지능 모델, 시계열 모델 등을 활용해서실제 코딩도 해보고 수요예측을 해보면서 성과를 측정해보는 시간을 가질 것임. 정제되지 않은 데이터가 있음. 정원 수에서 휴가자 수라든지, 출장자 수를 빼야 함.그래서 실제로 식사를 할 수 있는 직원들의 수가 필요하고 오른쪽에는 실제 메뉴들이 주어져 있음. Target Value 목표 값은 식사한 인원 비율 이라고 생각하면 됨. 그래서 데이터를 분석해 보면 이론 시간에 배웠던 추세를 볼 수 있음. 빨간색 꺾은 선 그래프는 실제 인원들이 증가하고 있다는 것을 ..