** ACTA 고급과정: 생성형 AI 이론과 응용 (Gen-AI 과정) – Type B

 

* 10주 프로그램, 총 100시간

(1주일 10시간: 주중 야간줌수업 3시간씩 2회, 토 4시간 대면수업)

 

 

Part A: Advanced Mathematics for Generative AI

  * 4주 프로그램, 총 40시간

강사 풀: 최종현, 전세영, 강유, 윤성로, 문태섭, 정교민

 

Part A-1: ML관점에서의 확률통계 (2주 프로그램, 총 20시간)

 

1. Probability Theory

  – Applications: Probabilistic classifiers, such as Naive Bayes, rely on foundational probability principles to make predictions based on input data.

* 확률 이론은 머신 러닝에서 필수적인 기초 원리 제공.

* 확률적 분류기(Probabilistic Classifiers)는 예측 시 확률 원리를 활용.

* Naive Bayes는 조건부 확률을 기반으로 작동.

* 입력 데이터로부터 최적의 예측을 수행.

* 데이터의 불확실성을 정량화하고 분석에 활용.

 

2. Random Variables and Probability Distributions

– Applications: Modeling data distributions helps in selecting appropriate algorithms and in understanding the behavior of data under different conditions.

* 랜덤 변수와 확률 분포는 데이터 특성 및 행동 이해에 필수.

* 데이터 분포를 모델링하면 적합한 알고리즘 선택에 도움.

* 다양한 조건에서 데이터의 행동을 예측 가능.

* 불확실성을 정량화하여 모델의 성능 향상.

* 이상치 탐지, 예측 모델링 등 다양한 응용 가능.

 

3. Descriptive Statistics

– Applications: These measures are essential for exploratory data analysis, helping to identify patterns, anomalies, and informing preprocessing steps.

* 기술 통계는 탐색적 데이터 분석(EDA)에 필수적.

* 데이터의 패턴과 이상치를 식별하는 데 도움.

* 전처리 단계에서 필요한 정보를 제공.

* 데이터의 중심 경향(평균, 중앙값 등)과 분포(분산, 범위 등) 파악.

* 데이터 이해 및 모델 준비 과정에 활용.

 

 

4. Bayesian Inference

– Applications: Techniques like Recursive Bayesian Estimation are used in dynamic systems to continuously update predictions based on new data.

 

* 베이지안 추론은 동적 시스템에서 예측 업데이트에 활용.

* Recursive Bayesian Estimation은 새로운 데이터를 기반으로 연속적 예측

* 확률 분포를 업데이트하며 데이터의 불확실성 반영.

* 시계열 분석, 필터링(Kalman Filter) 등에 적용.

* 데이터 변화에 따라 모델 적응력을 높이는 데 기여.

 

5. Hypothesis Testing

– Framework: Procedures to test assumptions about data, using metrics like p-values to determine statistical significance.

 

* 가설 검정은 데이터에 대한 가정을 검증하는 절차.

* p-value를 사용해 통계적 유의성을 평가.

* 데이터가 특정 분포나 조건을 따르는지 확인.

* 모델 성능 비교 및 특성 선택에 활용.

* 통계적 검정을 통해 데이터 분석의 신뢰도 향상.

 

 

6. Maximum Likelihood Estimation (MLE)

– Applications: MLE is widely used for fitting models to data, ensuring the most probable parameters are chosen for predictions.

* MLE는 데이터에 모델을 적합시키는 데 사용.

* 관측 데이터를 기반으로 최적의 파라미터를 추정.

* 확률 기반 예측 모델의 정확도 향상에 기여.

* 지도학습에서 회귀 및 분류 모델의 파라미터 학습에 활용.

 

 

7. Information Theory

– Applications: Feature selection methods leverage information theory to identify the most informative attributes for model building.

 

* 정보 이론은 모델 구축 시 중요한 특성 선택에 활용.

* 정보량(Entropy)을 사용해 중요한 특성을 식별.

* 상호정보량(Mutual Information)으로 특성 간 관계 평가.

* 모델의 효율성과 성능 향상에 기여.

 

8. Sampling Methods

– Applications: Sampling is crucial for training machine learning models, especially when working with large datasets or when performing cross-validation.

* 샘플링은 대규모 데이터셋에서 모델 학습에 필수적.

* 크로스밸리데이션 시 데이터 분할에 활용.

* 데이터의 대표성을 유지하며 연산 효율성 증가.

* 학습 및 테스트 데이터 구성에 사용.

 

9. Covariance and Correlation

– Applications: Understanding these relationships aids in feature selection and in identifying multicollinearity in datasets.

 

공분산과 상관계수는 데이터 간 관계를 이해하는 데 필수.

특성 선택 과정에서 중요한 변수 식별에 활용.

데이터셋의 다중공선성 문제를 탐지.

변수 간 상관 구조 분석으로 모델 성능 개선에 기여.

 

 

 

 

Part A-2: ML관점에서의 선형대수 (2주 프로그램, 총 20시간)

 

 

Matrix Multiplication는 머신 러닝과 데이터 분석에서 다음상황에 사용

 

  Feature Transformation: 데이터 변환 및 특성 결합.

  Linear Models: 선형 회귀와 신경망에서 입력과 가중치 계산

  PCA: 데이터 행렬과 고유벡터 곱으로 주성분 계산.

  Recommendation Systems: 사용자-아이템 관계 모델링.

  State Transition: Markov Chains에서 상태 전이 계산.

 

 

 

Vector Inner Product는 머신 러닝과 데이터 분석에서 다음상황에 사용

 

  유사도 측정: 코사인 유사도 계산으로 벡터 간 관계 분석.

  Projection: 한 벡터를 다른 벡터 방향으로 투영.

  Linear Models: 선형 회귀 및 분류기에서 예측 값 계산

  Gradient 계산: 최적화 문제에서 경사 하강법 수행.

  Neural Networks: 뉴런의 활성화 값 계산.

 

 

 

Matrix Determinant는 머신 러닝과 데이터 분석에서 다음상황에 사용

 

  선형 독립성 판별: 행렬식이 0이 아니면 선형 독립성 보장.

  시스템 해 판별: 선형 방정식 Ax=b의 해 존재 여부 확인.

  행렬 안정성 분석: 공분산 행렬의 안정성이나 분산 크기 평가.

  Gaussian Distribution: Multivariate Gaussian에서 확률 밀도 계산.

  행렬 성질 확인: 가역성 여부와 데이터의 특성 평가.

 

 

 

 

Inverse Matrix는 머신 러닝과 데이터 분석에서 다음상황에 사용

 

  선형 회귀: 계수 계산

  Ridge Regression: 정규화된 행렬 역행렬 계산으로 다중공선성 완화.

  Gaussian Processes: 공분산 행렬의 역행렬로 확률 계산.

  Optimization: Hessian Matrix 역행렬로 최적화 문제 해결.

  Pseudo-Inverse: 비정칙 행렬에 대해 유사 역행렬로 대체 사용.

 

 

 

LU Decomposition은 머신 러닝과 데이터 분석에서 다음상황에 사용

 

  선형 방정식 풀이: Ax=b를 효율적으로 계산 (전방/후방 대입 사용).

  역행렬 계산: 행렬의 역행렬을 간접적으로 계산.

  Determinant 계산: 상삼각 행렬 U의 대각선 원소로 determinant 계산.

  Optimization: Hessian Matrix를 활용한 최적화 문제 해결.

  Sparse Matrices: 희소 행렬에서 효율적 연산.

  행렬 분해 기반 분석: 시스템 안정성 평가와 데이터 구조 분석.

 

 

 

Eigenvector와 Eigen Decomposition은 머신 러닝과 데이터 분석에서 다음상황에 사용

 

 PCA: 데이터 차원 축소와 주요 방향(주성분) 탐지.

 Clustering: Spectral Clustering에서 데이터 구조 분석.

 Recommendation Systems: 행렬 분해로 잠재 요인 추출.

 Graph Analysis: 그래프 구조에서 중요 노드 식별.

 Optimization: Hessian Matrix 분석으로 안정성 평가.

 Covariance Analysis: 데이터 분산과 상관 구조 파악.

 필요한 핵심 방향을 요약하는 데 매우 유용

 

 

 

 

PCA (Principal Component Analysis)은 머신 러닝과 데이터 분석에서 다음상황에 사용

 

 차원 축소: 데이터의 변동성을 보존하며 차원 감소.

 데이터 시각화: 고차원 데이터를 2D/3D로 변환하여 패턴 분석.

 노이즈 제거: 작은 고유값에 해당하는 노이즈 제거.

 Feature Selection: 중요한 특성만 선택해 모델 성능 향상.

 데이터 압축: 저장 공간 절약 및 복원 가능한 데이터 표현.

 

SVD (Singular Value Decomposition)은 머신 러닝과 데이터 분석에서 다음상황에 사용

 

 추천 시스템: 사용자-아이템 희소 행렬의 잠재 요인 추출.

 텍스트 분석: LSA를 통해 문서 간 유사성 분석.

 이미지 압축: 중요하지 않은 작은 특이값 제거로 데이터 압축.

 Pseudo-Inverse 계산: 비정칙 행렬의 유사 역행렬 생성.

 차원 축소: 행렬 분해로 데이터의 저차원 표현 제공.

 

 

 

 

 

 

 

 

 

 

 

 

 

Part B: 생성형 AI 이론, 실제, 그리고 구현 (60시간)

 

1. 기초 이론 (20시간) : 생성형 AI의 이론적 배경을 제공

 

1.1 생성형 AI 개요 (3시간) : 생성형 AI의 정의, 역사, 활용 사례
  주요 기술 (GAN, VAE, Diffusion, GPT 등) 개요
  생성형 AI의 윤리적 이슈 및 사회적 영향
 
1.2 기초 머신러닝/딥러닝 개념 (3시간)
  딥러닝의 기본 구조 (손실 함수, 최적화)
  생성형 모델이 사용하는 핵심 알고리즘 개요
    Transformer 아키텍처: Attention 메커니즘, 데이터특징 학습
    확률 모델링: 다음 단어 예측, 노이즈 제거 및 확률적 샘플링 과정
 
1.3 생성형 AI 모델의 유형 (10시간)
  GAN 작동원리 / 주요 변형모델: DCGAN, CycleGAN, StyleGAN
  VAE (Variational Autoencoder) :  작동 원리
  Transformer 기반 모델  : 작동 원리, GPT와 BERT등과의 차이
  Diffusion 모델 : 작동 원리,  DDPM 모델, Score기반 모델
  VLM 모델 : 작동 원리, VLIP-2 멀티모달 모델 
 
1.4 Python 환경 설정 및 필수 라이브러리 (4시간)
  Python, TensorFlow/PyTorch, Hugging Face, OpenAI API
 
 
 
2. 실습 및 모델 구현 (20시간) : 실제 코드를 작성하며 모델을 학습
2.1 GAN 모델 실습 (3시간)
  GAN 모델 구현 / DCGAN, StyleGAN으로 이미지 생성
 
2.2 VAE 모델 실습 (3시간)
  VAE 구현 및 데이터 복원 / 이미지 데이터의 잠재 공간 탐험
 
2.3 Transformer 기반 모델 실습 (4시간)
   HuggingFace 사용법 / GPT모델기반 텍스트생성 / Fine-Tuning 실습
 
2.4 Diffusion 모델 실습 (6시간)
   노이즈 추가 및 제거 단계를 시각화
   다양한 조건(텍스트 프롬프트 등)에 따른 결과물 생성 실험
   하이퍼파라미터 튜닝을 통해 모델 성능의 변화
 
2.5 VLIP-2 멀티모달 모델 실습 (4시간)
   이미지 설명 생성 및 텍스트 기반 이미지 검색
       
3. 응용 사례 연구 (10시간)
생성형 AI의 실제 적용 사례와 프로젝트를 통해 실질적 활용 능력을 강화
3.1 이미지 생성 응용 (3시간)
  생성형 AI를 활용한 아트/디자인
  얼굴 생성, 패션 디자인, 의료 이미지 응용
 
3.2 텍스트 생성 응용 (3시간)
  자동 기사 작성, 문학 창작 / 챗봇, 번역 및 요약
  텍스트 기반 게임 개발
 
3.3 멀티모달 생성 AI 응용 (2시간)
  텍스트에서 이미지 생성 (DALL-E, Stable Diffusion)
  텍스트-음성 변환(TTS), 음악 생성
 
3.4 팀 프로젝트 설명 (2시간)
 
4. 고급 주제 및 전망 (10시간)
최신 연구 동향과 고급 기술을 소개하며, 실질적 응용 방법과 한계를 다룸
 
4.1 최신 생성형 AI 기술 및 동향 (3시간)
  생성형 AI의 연구 트렌드
  Zero-shot, Few-shot 학습 개념
 
4.2 생성형 AI의 한계와 윤리적 고려 (3시간)
  Deepfake 및 데이터 편향 문제
  AI의 책임성과 규제
 
4.3 팀 프로젝트 발표 (3시간)
  프로젝트 발표 및 피드백 세션
 
4.4 필기시험 (1시간)