[딥러닝] 1주차 - 딥러닝, 인공지능, 기계학습, 퍼셉트론

왜 딥러닝을 배워야 할까?

최근 인공지능 트렌드

대형 언어 모델(LLM, Large Language Model)과 ChatCPT의 등장
산업 전반에 걸쳐 딥러닝을 통한 기술 혁신 확산
AGI(Artificial General Intelligence) 인간을 능가하는 지능의 등장 현실화

딥러닝이 중요한 이유

방대한 데이터 처리, 패턴 인식에 강점
자연어 처리, 컴퓨터 비전, 음성 인식 등 다양한 분야 적용
AI 모델 개발 및 활용 능력은 미래 핵심 역량

인공지능 Artificial Intelligence

개념

인간의 지능을 모방하여 문제를 해결하거나 학습하는 능력을 가진 시스템
인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현하려는 컴퓨터 과학의 세부 분야

인공지능과 딥러닝의 역사

➡️병렬 연산에 뛰어난 GPU(그래픽 처리 장치)의 발전과 빅데이터의 폭발적 증가로 성과를 거두기 시작

➡️딥러닝이 이후 인공지능 분야를 대표하는 핵심 기술로 발전

➡️다양한 세부 기술들이 진화하면서 자연어 처리, 음성 인식, 자율주행 등 여러 산업 분야에서 활용

튜링 테스트 Turing Test
: 인공지능을 판별하는 방법
: 1950년 앨런 튜링이 논문 'computing machinery and intelligence'에서 제안
: 기계가 인간과 같은 지능을 가질 수 있는지를 평가하기 위한 방법론으로 제시

인공지능 기술의 예시

영상 추천 서비스 ➡️ Youtube
- 시청/검색 기록, 좋.댓.구 등의 데이터를 분석하여 영상 추천
- 딥러닝 기반의 추천 시스템을 사용하여 동영상의 제목, 태그, 메타데이터 등도 고려
- 사용자가 특정 시간대에 많이 시청하는 콘텐츠, 시청 시간, 댓글, 공유 활동까지 분석
영상 추천 서비스 ➡️ Netflix
- 사용자가 시청한 영화, 시리즈, 시청 시간, 평점, 장르 선호도를 바탕으로 맞춤형 추천 제공
- 사용자가 콘텐츠를 끝까지 보았는지, 도중에 멈췄는지의 정보를 바탕으로 시청자의 관심도 파악
- 협업 필터링 + 콘텐츠 기반 필터링 + 강화 학습 등 복합적인 기법을 사용
인공지능 스피커 : 음성 인식 기술을 기반으로 사용자와 상호작용할 수 있는 스마트 기기
- 음성 명령을 통해 음악 재생, 날씨 정보 제공, 기기 제어 등 다양한 작업 수행
- 자연어 처리(NLP) 기술을 통해 요청에 맞는 답변을 제공하거나 처리
- 인공지능 비서 역할로 사용자의 일정 관리, 알람 설정, 리마인더 기능 제공
- 대부분 클라우드 기반 AI 플랫폼과 연결되어 지속적으로 데이터 학습
인공지능 번역기
대규모 언어 모델(LLM; Large Language Model)
- 대규모 텍스트 데이터(뉴스, 책, 웹 페이지)를 학습하여 자연어를 생성하는 기술
- 기계가 인간의 언어 패턴을 학습하도록 설계 ➡️ ChatGPT
- 단순한 문장 생성 뿐만 아니라, 다양한 자연어 처리 작업(번역, 요약, 응답, 감정분석)도 수행
- 인간의 언어 사용 패턴을 학습하여 자연스러운 응답을 제공
- 모델의 응답이 부정확하거나 비논리적일 수 있고, 훈련 데이터의 편향에 따라 오답 생성 가능성도 존재

기계학습 Machine Learning

데이터를 통해 학습하여 미래 결과를 예측하거나 결정을 내리는 인공지능의 한 분야
명시적인 프로그래밍 없이도 데이터에서 패턴을 학습하여 예측과 의사 결정을 자동화

Tom Mitchell의 정의

컴퓨터 프로그램이 어떤 작업 T에 대해, 성능 척도 P를 기준으로, 경험 E를 통해 성능이 향상된다면, 그 프로그램은 해당 작업과 관련하여 경험으로부터 학습하고 있다고 할 수 있다.

예시) 체스 프로그램

작업 T : 체스 두기

성능 척도 P : 상대를 이길 확률

경험 E : 스스로 연습 게임하기

자신과의 연습 게임(E)을 통해

상대방을 이길 확률(P)이 향상된다면,

이 프로그램은 체스를 두는 작업(T)에 대해

학습하는 것

절차적 코딩과 머신러닝

전통적 프로그래밍

프로그래머가 문제 해결을 위한 명시적인 규칙과 알고리즘을 작성
사람이 모든 단계를 세밀하게 정의하여 컴퓨터가 실행할 수 있도록 프로그래밍
➡️"X 조건이 참이면 Y 동작을 수행한다" 같은 조건/반복문을 통해 특정 동작을 구현

문제 해결을 위한 고정된 알고리즘을 작성
고정된 입력에 대해 항상 같은 출력과 결과를 생성

명시적으로 프로그래밍 된 경우에만 문제 해결
새로운 유형의 문제가 생기는 경우 개발자가 직접 코드를 수정해야 함

명시적인 규칙에 따라 확실한 출력을 제공
특정 입력에 대한 결과가 언제나 일정하게 출력

문제 해결을 위해 프로그래머가 도메인 지식을 명시적으로 알고 있어야 함

머신러닝

컴퓨터가 주어진 데이터를 바탕으로 규칙을 스스로 학습
컴퓨터가 직접 주어진 훈련 데이터에서 패턴과 통계를 이용해 최적의 모델을 학습
➡️손글씨를 인식할 때, 이미지와 레이블(정답)을 학습하여 스스로 구분하는 방식을 학습

모델 성능은 학습 데이터와 학습 방법에 따라 변화
입력 데이터가 달라지면 모델의 출력도 달라질 수 있고, 훈련 과정에 따라 결과가 개선될 수 있음

일반화된 해결책을 제공
모델이 충분한 데이터를 학스뱄다면, 새로운 유형의 문제에서도 자동으로 적용

결과가 확률적으로 결정 (확률적 예측 제공)
모델의 학습 정도와 데이터 품질에 따라 예측 결과가 다르며, 출력에 불확실성이 존재

충분한 데이터가 주어진다면, 도메인 지식이 없어도 컴퓨터가 데이터를 통해 스스로 학습

머신러닝의 장점

명시적으로 프로그램된 규칙 기반 시스템에 비해 유지보수가 쉬움 ➡️ 데이터에서 패턴을 학습하기 때문
명시적으로 정의하기 어려운 매우 복잡한 문제도 데이터를 기반으로 패턴을 인식하여 해결
모델이 학습된 패턴을 바탕으로 기존에 본 적 없는 새로운 데이터에서도 문제를 해결
대량의 데이터를 분석하여 사람이 미처 발견하지 못했던 패턴이나 통찰을 도출

머신러닝의 단점

데이터의 양과 질에 따라 모델의 성능이 크게 차이나므로, 학습 데이터가 많이 필요
모델을 학습시키는 것은 매우 많은 계산을 필요로 하므로 학습에 시간이 오래 걸릴 수 있음
왜 특정 결론을 내렸는지 사람이 해석하기 어려운 경우가 많음 ➡️ Black Box 문제
모델이 학습하는 데이터가 편향된 경우, 편향을 그대로 학습하여 잘못된 결론을 내릴 가능성 존재
모델이 학습 데이터에 지나치게 적응하여 새로운 데이터에 대해 일반화된 성능을 내지 못함 ➡️Overfitting 문제
GPU, TPU 같은 고성능의 하드웨어가 필요할 수 있음

신경세포와 퍼셉트론

신경세포와 인공 신경망

인간의 뇌는 수많은 신경세포(뉴런)의 상호작용을 통해 생각하고 결정
뉴런은 자극을 받으면 신호를 전달하며, 학습 과정에서 연결이 강화되거나 약화
딥러닝은 이러한 원리를 모방하여 인공 신경망(Artificial Neural Network, ANN)을 사용해 데이터를 처리
인공 신경망은 여러 개의 인공 뉴런이 연결된 네트워크로 구성

퍼셉트론 Perceptron

퍼셉트론은 신경세포의 구조를 흉내 낸 인공 신경세포 모델
작동 방식
1. 입력 노드가 외부 자극(입력값)을 받음
2. 각 입력값에 가중치(weight)를 곱한 후 합산
3. 이 합이 임계값(threshold) 이상이면 활성화, 아니면 비활성화
4. 활성화된 뉴런은 다음 뉴런으로 신호를 전달
가중치는 퍼셉트론의 학습에 중요한 조정 가능한 파라미터

심층 신경망 DNN; Deep Neural Network

심층 신경망(DNN)은 여러 개의 은닉층을 가진 신경망
은닉층이 많을수록 더 복잡한 패턴을 학습할 수 있음
기울기 소실 문제(Vanishing Gradient Problem)로 인해 하위층이 제대로 학습되지 않는 문제가 발생
이를 해결하기 위해 역전파(Backpropagation) 알고리즘이 개발

역전파 알고리즘
: 신경망의 가중치를 업데이트하는 학습 방법

순전파 Forward Propagation - 입력 데이터를 신경망을 통해 전달하여 예측값 계산
오차 계산 - 예측값과 실제값의 차이(손실 함수)를 구함
역전파 Backward Propagation - 오차를 출력층에서 입력층 방향으로 전파아며, 각 가중치에 대한 기울기를 계산
가중치 업데이트 - 경사 하강법 등을 사용해 가중치를 조정하여 오차를 줄임

➡️ 이렇게 오차를 최소화하도록 가중치를 반복적으로 조정하면서 신경망을 학습시키는 과정

신경망 구조

단순 신경망: 입력층, 은닉층(1개), 출력층으로 구성된 신경망
심층 신경망: 2개 이상의 은닉층을 가진 신경망
딥러닝은 심층 신경망을 학습시키는 알고리즘을 지칭하는 용어로 사용

'빅데이터 & AI' 카테고리의 다른 글

[딥러닝] 3주차 - 파이썬, 딥러닝 라이브러리, 넘파이 Numpy, 행렬 연산 (0)	2025.04.01
[딥러닝] 2주차 - 머신러닝의 종류, 회귀와 분류 (0)	2025.03.31
[크롤링] Selenium을 이용한 네이버 뉴스 크롤링 (1) - 환경 설정 (0)	2025.03.25
[크롤링] Selenium을 이용한 네이버 뉴스 크롤링 (0) - Crawling & Selenium (0)	2025.03.25

모르는 게 너무 많아

[딥러닝] 1주차 - 딥러닝, 인공지능, 기계학습, 퍼셉트론

왜 딥러닝을 배워야 할까?

인공지능 Artificial Intelligence

인공지능 기술의 예시

기계학습 Machine Learning

절차적 코딩과 머신러닝

신경세포와 퍼셉트론

'빅데이터 & AI' 카테고리의 다른 글

티스토리툴바

[딥러닝] 1주차 - 딥러닝, 인공지능, 기계학습, 퍼셉트론

왜 딥러닝을 배워야 할까?

인공지능 Artificial Intelligence

인공지능 기술의 예시

기계학습 Machine Learning

절차적 코딩과 머신러닝

신경세포와 퍼셉트론

'빅데이터 & AI' 카테고리의 다른 글

관련글

티스토리툴바