회귀 분석은 둘 이상의 변수 간의 관계를 보여주는 통계적 방법입니다. 일반적으로 그래프로 표현되는 이 방법은 종속 변수와 독립 변수 간의 관계를 테스트합니다. 일반적으로 독립 변수는 종속 변수에 따라 변경되며 회귀 분석은 해당 변경에서 가장 중요한 요소에 대한 답을 찾으려고 시도합니다.
회귀 분석의 예
현실 세계에서 회귀 분석이 사용되는 시나리오는 다음과 같을 수 있습니다.
소매 기업은 다음 달(또는 종속 변수)의 판매 수치를 예측해야 합니다. 날씨, 새 모델 출시, 경쟁업체가 수행하는 작업 또는 외부 포장 도로에서 진행 중인 유지 관리 작업 등을 포함하여 그 수치를 둘러싼 변수(독립 변수)가 너무 많기 때문에 알기가 어렵습니다.
계정의 Bob이나 영업 현장에서 10년 동안 일한 Rachel과 같은 많은 사람들이 자신의 견해를 가지고 있을 수 있습니다. 그러나 회귀 분석은 측정 가능한 모든 변수를 정렬하고 어떤 변수가 영향을 미칠 것인지 논리적으로 나타낼 수 있습니다. 분석을 통해 판매에 영향을 미치는 요인과 변수가 서로 상호 작용하는 방식을 알 수 있습니다. 이는 기업이 더 나은 데이터 기반 의사 결정을 내리는 데 도움이 됩니다.
이 소매 기업 예에서 종속 변수는 판매이고 독립 변수는 날씨, 경쟁자 행동, 보도 유지 관리 및 새 모델 출시입니다.
회귀 분석에서 회귀선 사용
회귀 분석을 시작하기 위해 데이터 사이언티스트는 변수에 대해 필요한 모든 데이터를 수집합니다. 여기에는 상당한 기간 동안의 판매량 수치와 같은 기간의 강우량을 포함한 날씨가 포함될 것입니다. 그런 다음 데이터를 처리하여 차트로 표시합니다.
분석에서 Y축에는 항상 종속 변수 또는 테스트하려는 항목이 포함됩니다. 이 경우 매출 수치. X축은 독립변수인 강우량 인치를 나타냅니다. 이 간단한 가상 차트를 보면 비가 올 때 매출이 증가한다는 것을 알 수 있습니다. 이는 양의 상관 관계입니다. 그러나 강우량이 특정한 값을 가질 때 얼마를 팔 수 있는지 정확히 알수는 없습니다. 이 문제는 회귀선을 추가하여 해결할 수 있습니다.
이것은 데이터에 가장 잘 맞는 것과 종속변수와 독립변수 사이의 관계를 보여주는 선입니다. 이 예에서 회귀선이 데이터 사이로 지나는 것을 볼 수 있으며, 강우량에 관계없이 어떤 일이 일어날지 시각적으로 예측합니다.
회귀선은 공식을 사용하여 예측을 계산합니다. Y = A + BX. Y는 종속변수(매출), X는 독립변수(강우량), B는 선의 기울기, A는 Y가 선을 가로막는 점입니다.
데이터 사이언스에서 정교한 프로그램은 이러한 모든 계산을 1초 만에 실행하여 매우 정확한 데이터 기반 예측을 생성합니다.
'개발자 TIL' 카테고리의 다른 글
tensorflow karas pytorch (0) | 2023.01.30 |
---|---|
conda 에러 (0) | 2023.01.26 |
프로그래머스 문제풀이. (0) | 2023.01.10 |
payhere 과제전형 마치며. (0) | 2023.01.06 |
payhere 과제 (0) | 2023.01.04 |