벡터의 기하학적 의미

N 차원 벡터 a는 N 차원의 공간에서

  • 벡터 a의 값으로 표시되는 점
  • 원점과 벡터 a의 값으로 표시되는 점을 연결한 화살표(길이와 방향을 고정시킨 평행이동가능)

벡터의 길이

  • 벡터 a의 길이 = \(\|a\| = \sqrt{a^Ta} = \sqrt{a_1^2 + \cdots + a_N^2}\)

스칼라와 벡터의 곱

  • 양의 스칼라 x 벡터: 방향은 바뀌지 않고, 스칼라 크기만큼 벡터의 길이가 커짐
  • 음의 스칼라 x 벡터: 방향이 반대가 되고, 스칼라 크기만큼 벡터의 길이가 커짐

단위벡터

  • 길이가 1인 벡터 (unit vector)
  • ex) \(\begin{bmatrix}1 \\ 0\end{bmatrix}, \begin{bmatrix}0 \\ 1\end{bmatrix}, \begin{bmatrix}1 \over \sqrt2 \\ 1 \over \sqrt2 \end{bmatrix}, \cdots\)
  • \(x \over \|x\|\): 벡터 x가 가리키는 단위벡터 (영벡터 제외)

벡터의 합

  • 두 벡터를 이웃하는 변으로 가지는 평생사변형의 대각선 벡터
  • 한 벡터를 평행이동하여 다른 벡터의 끝점과 이은 벡터

벡터의 선형조합

  • \(c_1x_1 + c_2x_2 + \cdots + c_Nx_N\) (\(c\): 스칼라, \(x\): 벡터)

벡터의 차

  • 한 벡터가 가리키는 점으로부터 다른 벡터가 가리키는 점을 연결하는 벡터

Word2Vec

  • 단어들 사이의 관계로 벡터로 표현
  • ex) 일본 = 도쿄 + (한국 - 서울)
    • (한국 - 서울): 서울에서 한국으로 향하는 벡터 = 수도 이름을 나라 이름으로 바꾸는 벡터

유클리드 거리

  • 두 벡터가 가리키는 점 사이의 거리 (Euclidean distance)
  • 유클리드 거리 = 두 벡터의 차의 길이
  • \[\|a-b\| = \sqrt{\sum_{i=1}(a_i - b_i)^2} = \sqrt{\|a\|^2 + \|b\|^2 - 2a^Tb}\]
  • \[\|a-b\|^2 = \|a\|^2 + \|b\|^2 - 2a^Tb\]

벡터의 내적과 삼각함수

  • \[a^Tb = \|a\|\|b\|cos \theta\]

직교

  • 두 벡터 a와 b가 이루는 각이 90도이면 서로 직교, \(a \bot b\)
  • \[a^Tb = b^Ta = 0 \leftrightarrow a \bot b\]

정규직교

  • N 개의 단위벡터 \(v_1, v_2, \cdots, v_N\)가 서로 직교할 때 (orthonormal)
  • \[\|v_i\| = 1 \leftrightarrow v_i^Tv_i = 1\]
  • \[v_i^Tv_J = 0 (i \neq j)\]

코사인 유사도

  • 두 벡터 사이의 각의 코사인값
  • 두 벡터가 같은 방향을 가리킬수록 코사인 유사도가 높아진다. (최대값 1)
  • cosine similarity = \(cos \theta = {x^Ty \over \|x\|\|y\|}\)
  • cosine distance = 1 - cosine similarity = \(1 - {x^Ty \over \|x\|\|y\|}\)

벡터의 분해와 성분

  • 어떤 두 벡터 a, b의 합이 다른 벡터 c가 될 때, c가 두 벡터 성분 a, b로 분해된다

투영성분과 직교성분

  • 벡터 a를 다른 벡터 b에 직교하는 성분과 벡터 b에 평행한 성분으로 분해할 때, 평행한 선분은 벡터 b에 대한 투영성분(projection), 벡터 b에 직교하는 성분을 벡터 b에 대한 직교성분(rejection)
  • Projection: \(a^{\|b}\)
  • Rejection: \(a^{\bot b}\)
  • 0
  • 투영성분의 길이: \(\|a^{\|b}\| = \|a\|cos \theta = {\|a\|\|b\| cos \theta \over \|b\|} = {a^Tb \over \|b\|} = {b^Ta \over \|b\|} = a^T {b \over \|b\|}\)
  • 벡터 b가 단위벡터라면, \(\|a^{\|b}\| = a^Tb\), \(a^{\|b} = {a^Tb \over \|b\|}{b \over \|b\|} = {a^Tb \over \|b\|^2}b, a^{\bot b} = a - a^{\|b}\)

직선의 방정식

  • 어떤 벡터 w가 있을 때, 원점에서 출발한 벡터 w가 가리키는 점을 지나면서 벡터 w에 수직인 직선의 방정식
    • \(w^T(x-w) = 0\) (\(x\): 위의 임의의 점을 가리키는 벡터)
    • \[=> w^Tx - \|w\|^2 = 0\]
    • 이 직선과 원점 사이의 거리: \(\|w\|\)
  • 벡터 w에 수직인 직선의 방정식
    • \(w\)와 방향이 같고 길이가 다른 벡터 \(w^\prime = cw\)을 지남
    • \[w^{\prime T}x = \|w \prime \|^2 = cw^Tx - c^2\|w\|^2 = 0\]
    • \(c\|w\|^2\)는 스칼라이므로, \(w^Tx - w_0 = 0\) (\(w_0\): 임의의 수)
    • 이 직선과 원점 사이의 거리: \(c\|w\| = {w_0 \over \|w\|}\)

직선과 점의 거리

  • 벡터 \(w\)에 대한 벡터 \(x\prime\)의 투영성분
    \(\|x \prime ^{\|w}\| = {w^Tx \prime \over \|w\|}\)
  • 직선과 점 \(x\prime\) 사이의 거리 \(|{\|x\prime^{\|w} -\|w\|}| = |{w^Tx\prime\over\|w\|}-\|w\|| = {|w^Tx\prime - \|w\|^2 \over \|w\|} = {|w^Tx\prime - w_0| \over \|w\|}\)

연습문제

  • 3.1.1
    • 1
  • 3.1.2
    • 남자배우 = 여자배우 + (남자 - 여자)
  • 3.1.3
    • 3
  • 3.1.4
    • 4
  • 3.1.5
    • 5
  • 3.1.6
    • 6_1
    • 6_2
  • 3.1.7
    • 7
  • 3.1.8
    • 8
  • 3.1.9
    • 9
  • 3.1.10
    • 10
  • 3.1.11
    • 11



이 글은 ‘데이터 사이언스 스쿨 수학편’을 정리한 것입니다. 질문이나 오류가 있다면 댓글 남겨주세요.