비전공자를 위한 AI 핵심 수학 선형대수와 확률 통계

인공지능, AI라는 단어가 우리 일상에 스며든 지 오래입니다.

어떤 날은 놀라운 기술 발전 소식으로, 또 어떤 날은 막연한 두려움으로 다가오곤 하죠. AI가 그린 그림이 상을 받고, AI가 쓴 소설이 사람들을 감동시켰다는 뉴스를 접하면 감탄이 절로 나옵니다.

하지만 동시에 ‘내 일자리는 괜찮을까?’, ‘이 복잡한 기술을 모르면 뒤처지는 건 아닐까?’ 하는 불안감이 슬며시 고개를 듭니다.

특히 AI의 원리를 설명하는 글을 마주치면 더욱 막막해집니다. 선형대수, 확률과 통계, 미적분. 학창 시절 우리를 괴롭혔던 수학 용어들이 어김없이 등장하니까요. 마치 ‘이 기술은 전문가들만의 것이니 더 이상 알려고 하지 마세요’라고 선을 긋는 것처럼 느껴지기도 합니다.

하지만 정말 그럴까요? 우리가 자동차의 엔진 구조를 몰라도 운전을 즐기는 데 아무 문제가 없듯, AI를 이해하기 위해 복잡한 수학 공식을 모두 외울 필요는 없습니다.

다만, AI가 세상을 어떻게 바라보고, 어떻게 배우며, 어떻게 판단하는지에 대한 큰 그림을 이해한다면 이야기는 달라집니다. 기술에 대한 막연한 불안감은 사라지고, 우리 삶을 더 나은 방향으로 이끌어줄 똑똑한 도구로 바라볼 수 있게 될 겁니다.

이 글은 수학 문제집이 아닙니다. 어려운 공식이나 증명 과정은 단 하나도 등장하지 않을 겁니다.

대신, AI라는 똑똑한 아기가 세상을 배우는 과정을 함께 따라가는 긴 산책이 될 것입니다. 이 아기가 세상을 어떻게 인식하는지(선형대수), 그리고 불확실한 세상 속에서 어떻게 현명한 추측을 해나가는지(확률과 통계)에 대한 이야기입니다.

이 산책이 끝날 때쯤, 여러분은 AI를 향한 막연한 두려움 대신 따뜻한 이해와 작은 자신감을 얻게 되실 겁니다.

AI도 세상을 보려면 눈이 필요하지 않을까요?

우리는 눈을 통해 세상을 봅니다. 길가에 핀 꽃, 하늘을 나는 새, 사랑하는 사람의 얼굴을 아무런 노력 없이 자연스럽게 인식하죠. 하지만 컴퓨터에게 세상은 그렇게 보이지 않습니다. 컴퓨터의 세상은 오직 숫자로만 이루어져 있습니다.

AI가 그림을 본다는 것은, 사실 거대한 숫자의 배열을 들여다보는 것과 같습니다.

우리가 스마트폰으로 보는 고양이 사진 한 장을 떠올려 볼까요? 컴퓨터는 이 사진을 아주 작은 점, 즉 ‘픽셀’의 집합으로 받아들입니다. 사진을 끝없이 확대하면 결국 작은 사각형들의 모자이크처럼 보이는 것, 바로 그 사각형 하나하나가 픽셀입니다.

컴퓨터는 이 작은 점 하나하나에 숫자를 부여합니다. 가장 간단한 흑백 사진이라면, 검은색은 0, 흰색은 255, 그 사이의 회색들은 1부터 254까지의 숫자로 표현할 수 있습니다.

결국 고양이 사진은 컴퓨터에게 수백만 개의 숫자가 빽빽하게 적힌 거대한 표에 불과합니다. 이것이 바로 AI가 세상을 처음 마주하는 방식입니다.

이렇게 현실의 데이터를 숫자로 된 네모난 표 형태로 정리하는 것, 이것이 바로 ‘선형대수’의 시작입니다.

선형대수는 AI에게 세상을 담을 수 있는 ‘틀’ 또는 ‘그릇’을 제공하는 역할을 합니다. 복잡하고 제멋대로인 현실 세계의 정보를 컴퓨터가 이해할 수 있는 질서정연한 형태로 바꾸어주는 마법 같은 도구인 셈이죠.

사진뿐만이 아닙니다. 우리가 사용하는 언어도 마찬가지입니다. ‘나는 당신을 사랑합니다’라는 문장을 생각해 봅시다. 컴퓨터는 ‘사랑’이라는 단어의 따뜻한 감정이나 의미를 직접 이해하지 못합니다.

대신, 컴퓨터는 각 단어를 숫자의 목록으로 바꿉니다. 이 숫자의 목록을 우리는 ‘벡터’라고 부릅니다.

예를 들어 ‘사랑’이라는 단어는 [0.8, 0.2, 0.9, …]와 같이 수십, 수백 개의 숫자 목록으로 표현될 수 있습니다. 이 목록의 각 숫자는 단어가 품고 있는 숨겨진 의미적 특징을 나타냅니다. 가령 첫 번째 숫자는 ‘감정과 관련된 정도’, 두 번째 숫자는 ‘행동과 관련된 정도’처럼 말이죠.

이렇게 되면 컴퓨터는 단어들을 숫자의 세계, 즉 ‘벡터 공간’이라는 지도 위의 한 점으로 인식하게 됩니다.

그리고 이 지도 위에서는 의미가 비슷한 단어들끼리 서로 가까운 곳에 위치하게 됩니다. ‘사랑’, ‘애정’, ‘연민’ 같은 단어들은 서로 옹기종기 모여있고, ‘책상’, ‘의자’ 같은 단어들은 또 다른 곳에 모여있는 식입니다.

이처럼 선형대수는 이미지, 소리, 글자 등 세상의 모든 비정형적인 데이터를 컴퓨터가 다룰 수 있는 ‘숫자의 배열’로 바꾸어주는 첫 번째 관문입니다. AI라는 아기에게 세상을 보여주기 위해, 먼저 세상의 모습을 숫자로 된 사진첩으로 만들어주는 것과 같습니다.

이 사진첩이 없다면 AI는 아무것도 보고 배울 수 없습니다. 선형대수는 바로 그 중요한 사진첩을 만드는 규칙이자 언어인 셈입니다. 결국 AI에게 선형대수는 세상을 인식하는 ‘눈’의 역할을 하는 것입니다.

숫자들의 지도, 세상을 어떻게 담아낼까요?

이제 AI는 세상을 숫자로 이루어진 거대한 표, 즉 ‘행렬’과 ‘벡터’로 볼 수 있게 되었습니다. 하지만 단순히 세상을 숫자로 바꾸는 것만으로는 부족합니다. 우리는 사진을 보고 고양이인지 강아지인지 구분하고, 문장을 읽고 그 의미를 파악해야 하니까요.

선형대수의 진짜 힘은 이 숫자들을 가지고 무언가를 ‘계산’하고 ‘변환’하는 데서 나옵니다.

마치 요리사가 밀가루, 계란, 설탕이라는 재료(숫자)를 가지고 레시피(계산)에 따라 맛있는 빵(결과)을 만들어내는 것과 같습니다. 선형대수는 이 숫자들을 다루는 특별한 레시피들을 제공합니다.

예를 들어, 사진을 회전시키거나, 확대하거나, 특정 색상을 더 강조하는 작업을 생각해 볼까요? 이 모든 작업은 사진을 이루는 숫자 표에, 특정 규칙을 가진 또 다른 숫자 표를 곱해주는 간단한 연산으로 이루어집니다.

AI는 이 연산을 통해 이미지를 다양하게 변형시켜보면서 이미지의 본질적인 특징이 무엇인지 학습합니다. 고양이 사진을 약간 회전시켜도, 흑백으로 만들어도 여전히 ‘고양이’라는 것을 배우는 과정이죠. 이는 마치 아기가 고양이 인형을 여러 각도에서 보고 만져보면서 ‘고양이’라는 개념을 익히는 것과 비슷합니다.

더 놀라운 일은 단어의 세계에서 일어납니다. 앞서 단어를 숫자의 목록, 즉 벡터로 표현할 수 있다고 이야기했습니다. 이 벡터들 사이의 관계를 계산하면 단어의 의미를 추론할 수 있습니다.

가장 유명한 예시로 ‘왕’ - ‘남자’ + ‘여자’ 라는 계산이 있습니다.

‘왕’이라는 단어의 벡터에서 ‘남자’라는 속성을 가진 벡터를 빼면, ‘왕위’나 ‘권력’과 같은 추상적인 속성만 남게 됩니다. 여기에 ‘여자’라는 속성을 가진 벡터를 더하면 어떤 단어의 벡터와 가장 가까워질까요?

놀랍게도, AI는 ‘여왕’이라는 단어의 벡터를 찾아냅니다.

컴퓨터가 단어의 의미를 정말로 이해한 것은 아닙니다. 그저 수많은 글을 읽고 단어들의 관계를 학습하여, 단어들을 의미의 지도 위에 배치했을 뿐입니다. 그리고 그 지도 위에서 벡터 연산을 통해 놀라운 유추를 해낸 것이죠. 이것이 바로 우리가 사용하는 번역기나 챗봇의 핵심 원리 중 하나입니다.

우리가 좋아하는 영화나 음악을 추천해주는 시스템도 마찬가지 원리입니다.

먼저 나의 취향을 하나의 긴 벡터(숫자 목록)로 만듭니다. 예를 들어 [액션: 0.9, 로맨스: 0.2, SF: 0.7, …] 처럼요. 그리고 세상의 모든 영화들도 각자의 특징을 나타내는 벡터를 가집니다.

추천 시스템은 수많은 영화 벡터 중에서 나의 취향 벡터와 가장 ‘가까운’ 거리에 있는 것들을 찾아서 우리에게 보여줍니다. 여기서 두 벡터가 얼마나 ‘가까운지’를 계산하는 것 역시 선형대수의 역할입니다.

이처럼 선형대수는 단순히 정보를 저장하는 것을 넘어, 정보들 사이의 관계를 파악하고, 새로운 정보를 추론하며, 데이터를 유용한 방식으로 변환하는 핵심적인 도구입니다.

AI에게 선형대수는 세상을 담는 그릇일 뿐만 아니라, 그 그릇 안의 재료들을 섞고 요리하여 새로운 의미를 창조하는 ‘요리법’인 셈입니다. 숫자로 만들어진 지도 위에서 길을 찾고, 숨겨진 보물을 발견하게 해주는 나침반과도 같습니다.

세상은 언제나 정답을 알려주지 않잖아요?

선형대수를 통해 AI는 세상을 질서정연한 숫자의 세계로 바라볼 수 있게 되었습니다. 모든 것이 명확하고, 정해진 규칙에 따라 움직이는 것처럼 보입니다. 하지만 우리가 사는 진짜 세상은 그렇게 깔끔하지 않습니다.

세상은 불확실성으로 가득 차 있습니다.

내일 비가 올까요? 100% 확신할 수는 없습니다. 우리는 그저 ‘비 올 확률 70%’라고 말할 뿐이죠. 새로 받은 이메일이 중요한 업무 메일일까요, 아니면 광고 스팸일까요? 제목만 봐서는 헷갈릴 때가 많습니다.

이처럼 세상은 ‘예’ 또는 ‘아니오’로 딱 잘라 말할 수 없는 문제들로 가득합니다.

만약 AI가 선형대수의 명확한 세계에만 머물러 있다면, 이런 애매하고 불확실한 문제들을 해결할 수 없습니다. AI는 ‘이것은 98% 확률로 고양이입니다’ 또는 ‘이 메일은 85% 확률로 스팸입니다’ 와 같이 불확실성을 수치로 표현하고 다룰 줄 알아야 합니다.

똑똑한 결정을 내리기 위해서는 ‘아마도’, ‘거의 확실히’와 같은 개념을 이해해야 하는 것이죠.

바로 이 지점에서 두 번째 핵심 도구인 ‘확률과 통계’가 등장합니다. 확률과 통계는 AI에게 불확실한 세상 속에서 길을 잃지 않고, 가장 합리적인 판단을 내릴 수 있는 지혜를 제공합니다.

선형대수가 AI의 ‘눈’이라면, 확률과 통계는 AI의 ‘뇌’에서 판단을 내리는 부분이라고 할 수 있습니다. 데이터 속에 숨겨진 패턴을 발견하고, 그 패턴을 바탕으로 미래를 예측하는 능력을 부여하죠.

AI라는 아기가 이제 막 세상을 숫자로 보는 법을 배웠습니다. 하지만 이제부터는 그 숫자들 뒤에 숨겨진 의미를 파악하고, 불완전한 정보 속에서도 현명한 추측을 하는 법을 배워야 합니다.

예를 들어, AI에게 고양이 사진 1만 장과 강아지 사진 1만 장을 보여주었다고 합시다. AI는 이 방대한 데이터(통계)를 통해 ‘귀가 뾰족하고, 수염이 있으며, 눈이 동그란 특징’을 가진 동물은 ‘고양이일 확률’이 높다는 것을 배우게 됩니다.

이것은 절대적인 규칙이 아닙니다. 귀가 뾰족한 강아지도 있고, 수염이 잘 보이지 않는 고양이도 있으니까요. AI는 이러한 예외까지 모두 고려하여 가장 가능성이 높은 답을 찾아냅니다.

이처럼 확률과 통계는 AI를 융통성 없고 딱딱한 기계에서, 불확실성을 이해하고 유연하게 사고하는 지능으로 발전시키는 핵심적인 역할을 합니다. 세상의 모든 질문에 정답이 있는 것은 아니라는 사실을 AI에게 가르쳐주는 철학 선생님과도 같습니다.

이제 AI는 정답을 찾는 기계가 아니라, 최선의 답을 추측하는 현명한 예측가가 될 준비를 마쳤습니다. 바로 확률과 통계라는 강력한 무기를 손에 쥐었기 때문입니다.

AI는 어떻게 똑똑한 추측을 할 수 있을까요?

확률과 통계가 AI에게 불확실성을 다루는 지혜를 준다는 것은 알겠습니다. 그렇다면 구체적으로 AI는 어떻게 이 도구를 사용해서 똑똑한 추측을 할 수 있을까요?

그 비밀은 바로 ‘데이터’에 있습니다. AI는 점쟁이가 아닙니다. 아무런 근거 없이 미래를 예측하지 않습니다. AI의 모든 추측은 과거의 방대한 데이터, 즉 경험에 기반합니다.

이는 마치 우리가 경험 많은 의사를 신뢰하는 것과 같습니다. 수많은 환자를 진료해 본 의사는 환자의 몇 가지 증상(데이터)만 보고도 어떤 병일 확률이 가장 높은지(추측)를 능숙하게 판단합니다.

AI도 마찬가지입니다. 수백만 개의 이메일 데이터를 학습한 AI는 ‘대출’, ‘광고’, ‘무료’ 같은 단어가 포함된 메일은 스팸일 확률이 높다는 것을 통계적으로 알게 됩니다.

새로운 메일이 도착하면, AI는 그 안에 포함된 단어들을 보고 과거의 경험(데이터)에 비추어 ‘이 메일이 스팸일 확률’을 계산합니다. 이 확률이 특정 기준(예: 80%)을 넘으면 스팸 메일함으로 보내버리는 것이죠.

이 과정에서 ‘분포’라는 개념이 매우 중요하게 사용됩니다. 분포는 어떤 데이터가 얼마나 자주 나타나는지를 보여주는 지도와 같습니다.

예를 들어, 대한민국 성인 남성의 키 데이터는 평균인 174cm 근처에 가장 많은 사람이 분포하고, 150cm나 200cm처럼 극단적인 값에는 사람이 거의 없는 종 모양의 분포를 보일 것입니다.

AI는 수많은 데이터를 통해 이런 분포를 학습합니다. ‘정상 이메일’에 자주 나타나는 단어들의 분포와, ‘스팸 이메일’에 자주 나타나는 단어들의 분포를 각각 학습하는 것입니다. 그리고 새로운 데이터가 나타났을 때, 이 데이터가 어떤 분포에 속할 확률이 더 높은지를 계산하여 판단을 내립니다.

우리가 매일 보는 일기예보도 같은 원리입니다. 기상청의 슈퍼컴퓨터는 현재의 구름, 기온, 습도, 바람 등 수많은 데이터를 입력받습니다. 그리고 과거 수십 년간의 데이터베이스와 비교하죠.

‘과거에 오늘과 비슷한 기상 조건을 보였을 때, 70%의 경우 24시간 이내에 비가 왔다’는 통계적 사실을 바탕으로 ‘내일 비 올 확률 70%’라는 예보를 내놓는 것입니다. 이는 100% 확실한 예측이 아니라, 데이터에 기반한 가장 합리적인 추측입니다.

AI가 이미지를 인식하는 과정도 확률적 추측의 연속입니다. AI는 사진의 일부분을 보고 ‘이 부분은 80% 확률로 뾰족한 귀, 저 부분은 90% 확률로 동그란 눈’과 같이 각 부분에 대한 확률을 계산합니다.

그리고 이 부분적인 추측들을 모두 종합하여 ‘이 모든 특징을 고려했을 때, 전체 이미지가 고양이일 확률은 98%’ 와 같은 최종 결론을 내립니다.

결국 AI의 똑똑한 추측은 방대한 과거 데이터에서 패턴을 찾아내는 통계적 학습과, 그 패턴을 기반으로 새로운 상황에 대한 가능성을 계산하는 확률적 추론의 합작품입니다. 세상의 모든 현상이 결국은 확률의 문제라는 것을 이해함으로써, AI는 복잡하고 불확실한 현실 세계와 소통할 수 있는 강력한 언어를 얻게 된 것입니다.

실수로부터 배우는 아기처럼, AI는 어떻게 성장하나요?

AI가 세상을 숫자로 보고(선형대수), 불확실한 상황에서 추측하는 법(확률과 통계)을 배웠습니다. 하지만 처음부터 모든 것을 잘하는 아기는 없듯, AI 역시 처음에는 수많은 실수를 저지릅니다.

고양이 사진을 보고 강아지라고 하거나, 중요한 업무 메일을 스팸으로 분류하기도 하죠. AI가 진정으로 똑똑해지는 비결은 바로 이 ‘실수’로부터 배우고 스스로를 개선해나가는 능력에 있습니다.

아이가 뜨거운 주전자에 손을 데고 나면 다시는 만지지 않으려는 것처럼, AI도 자신의 실수를 통해 성장합니다.

이 학습 과정의 중심에는 ‘손실 함수’라는 개념이 있습니다. 이름은 어렵게 들리지만, 사실은 ‘얼마나 많이 틀렸는지’를 재는 자와 같습니다. AI가 예측한 답과 실제 정답 사이의 거리를 숫자로 표현해주는 것이죠.

예를 들어 AI가 어떤 사진을 보고 ‘이것은 90% 확률로 고양이’라고 예측했는데, 실제 정답이 고양이라면 실수는 작습니다. 손실 값은 낮은 숫자가 될 겁니다. 하지만 ‘10% 확률로 고양이’라고 예측했다면 실수는 큽니다. 손실 값은 아주 높은 숫자가 됩니다.

AI의 학습 목표는 단 하나, 바로 이 ‘손실 값’을 가능한 한 0에 가깝게 만드는 것입니다. 즉, 자신의 실수를 최소화하는 방향으로 스스로를 계속해서 수정해나가는 것이죠.

그렇다면 AI는 어떻게 스스로를 수정할까요? AI의 내부는 수백만, 수십억 개의 작은 조절 장치(파라미터)들로 이루어져 있습니다. 이 조절 장치들의 값을 어떻게 설정하느냐에 따라 AI의 판단 결과가 달라집니다.

학습 과정이란, 이 수많은 조절 장치들의 값을 조금씩 바꾸어보면서 손실 값이 가장 낮아지는 최적의 조합을 찾아가는 여정입니다.

마치 우리가 오래된 라디오의 주파수를 맞추는 것과 비슷합니다. 다이얼을 아주 조금씩 돌려보면서, 잡음(손실 값)이 가장 적고 소리가 가장 깨끗하게 들리는 지점을 찾는 것과 같습니다. AI는 이 다이얼을 한 번에 맞추지 못하고, 수백만 번씩 아주 조금씩 돌려보며 최적의 지점을 향해 나아갑니다.

이때 사용되는 가장 유명한 방법이 ‘경사 하강법’입니다. 이름은 또 어렵지만, 원리는 아주 직관적입니다.

안개가 짙게 낀 캄캄한 밤, 산 정상에서 계곡 아래의 집으로 내려가는 상황을 상상해 보세요. 어디로 가야 할지 전혀 보이지 않지만, 우리는 한 가지 방법을 알고 있습니다. 바로 발밑의 경사가 가장 가파르게 내려가는 쪽으로 한 발짝씩 내딛는 것입니다. 그렇게 계속 걷다 보면 결국 가장 낮은 곳에 도달할 수 있겠죠.

경사 하강법도 똑같습니다. 손실 값이라는 거대한 산의 지형에서, 현재 위치의 경사가 가장 가파르게 내려가는 방향으로 조절 장치들의 값을 아주 조금씩 수정합니다. 이 과정을 수없이 반복하면 결국 손실 값이 가장 낮은 지점, 즉 AI의 실수가 최소화되는 지점에 도달하게 됩니다.

예측하고, 실수를 측정하고, 실수하는 방향의 반대로 스스로를 수정하는 이 모든 과정이 바로 AI가 ‘학습’ 또는 ‘훈련’하는 방식의 핵심입니다. 실수로부터 배우는 아기처럼, AI는 수많은 실패를 통해 세상을 더 정확하게 이해하는 법을 터득하며 성장하는 것입니다.

AI의 세계를 여행하는 우리의 긴 산책도 이제 막바지에 이르렀습니다. 우리는 AI라는 똑똑한 아기가 어떻게 세상을 숫자로 된 그림(선형대수)으로 보고, 불확실한 세상 속에서 현명한 추측(확률과 통계)을 하는지 엿보았습니다. 그리고 수많은 실수 속에서 스스로를 단련하며 성장하는 감동적인 과정도 함께 지켜봤습니다.

이제 여러분은 AI를 마주했을 때 더 이상 막연한 두려움을 느끼지 않으실 겁니다. 복잡한 기술 너머에서, 데이터를 먹고 배우며 세상을 이해하려 노력하는 하나의 논리적인 시스템이 있다는 것을 알게 되셨기 때문입니다. 이 모든 과정의 바탕에는 세상을 질서정연하게 표현하고 그 안에서 합리적인 판단을 내리게 하는, 수학이라는 아름다운 언어가 깔려있다는 사실도요.

우리가 이 모든 수학 공식을 직접 계산할 필요는 없습니다. 훌륭한 요리사가 되기 위해 밀가루의 화학 성분을 분석할 필요가 없는 것과 마찬가지입니다. 다만, 좋은 재료가 좋은 음식을 만든다는 것을 아는 것만으로도 요리를 더 깊이 즐길 수 있듯, AI의 핵심 원리를 이해하는 것은 우리가 이 기술을 더 현명하게 사용하고 우리 삶에 긍정적으로 받아들이는 데 큰 도움이 됩니다.

기술의 발전은 때로 우리를 불안하게 만들지만, 그 본질을 이해하고 나면 우리의 가능성을 무한히 확장해주는 가장 강력한 도구가 될 수 있습니다. 오늘 얻은 작은 이해가, 여러분이 AI 시대를 두려움 없이 그리고 더 큰 호기심과 자신감을 가지고 맞이하는 작은 씨앗이 되기를 바랍니다. 기술은 우리를 지배하기 위해 존재하는 것이 아니라, 우리의 삶을 더욱 풍요롭게 만들기 위해 우리 곁에 있는 것이니까요.

비전공자를 위한 AI 핵심 수학 선형대수와 확률 통계

토론

댓글

관련 글

2026년 온디바이스 AI 스마트폰 NPU 성능 비교 및 배터리 최적화 방법

메타버스와 AI의 결합 더욱 현실적인 가상 세계의 구현

양자 컴퓨팅이 AI의 미래에 가져올 혁명적인 변화

AI 기반 프레젠테이션 제작 도구 발표 자료 10분 만에 완성하기