본문 바로가기

분류 전체보기43

AdaBalGAN 논문리뷰 AdaBalGAN: An Improved Generative Adversarial Network With Imbalanced Learning for Wafer Defective Pattern Recognition( Junliang Wang , Zhengliang Yang , Jie Zhang, Qihua Zhang, and Wei-Ting Kary Chien )Abstrack제안 배경 : 불균형 데이터가 있는 웨이퍼 맵의 불량 패턴 인식을 위해 적응적 균형생성적대 네트워크(AdaBalGAN)라는 새로운 딥러닝 모델을 제안하였다주요 토픽으로는 범주형 생성형 적대 네트워크를 개선하였고 적응형 생성 컨트롤러를 설계하였다.(->더 높은 정확도와 안정성 확보)추가 비교 실험 : 웨이퍼 맵의 DPR에서 모.. 2024. 8. 14.
Fixmatch 코드 리뷰 (+코드 리뷰 방법) @연구실 미팅을 하면서FixMatch는 준지도학습을 위한 방법으로, unlabel data와 label data를 함께 사용하여 모델의 성능을 향상시키는 기술이다. [핵심 이론] label data : 일반적인 지도학습과 같은 방식의 손실함수를 사용한다 unlabel data : 두가지 데이터 증강기법(약한증강, 강한증강)을 사용하여 Pseudo label을 생성하고, 이를 학습시킨다 약한 증강( Weak Augmentation) 을 적용한 이미지데이터를 모델에 돌린 뒤, pseudo labeling을 시행한다. 강한 증강( Strong Augmentation) 을 적용한 이미지데이터를 모델에 넣어 예측된 확률 값들을 산정한다 Weak Augmentation에서 생성한 pseudo label와 Stron.. 2024. 7. 28.
CAM @객체탐지를 위해 IN-GPS의 TASK를 하며 시행한 논문리뷰CAM은 객체탐지를 위해 사용하는 기술로, 이미지 분류 모델이 입력 이미지에서 어떤 부분에 주목하여 특정 클래스로 분류했는지를 알 수 있다.  [등장 배경]CAM은 기존 CNN모델의 문제점을 해결하면서 등장하였다. 이를 위해CNN모델을 다시 알아보면..구성을 크게 두가지로 나눌 수 있다. Feature Extraction : Input이미지의 중요한 Feature를 요약하여 Feature Map을 얻는다. 그 후  Feature Map의 값을 일렬로 연결하여 Classfication 단계의 Input으로 사용한다Classification : 요약된 Feature을 분류한다. 그렇다면 이 CNN모델에서의 문제점은 무엇일까? 내부 작동방식이 불투.. 2024. 7. 15.
Attention값 계산하기 @Transformer논문리뷰 중 기존 Seq2seq모델의 문제를 해결하기 위해 Attention이 도입되었다. Seq2seq의 문제점 : 긴 시퀀스로인한 정보소실 문제, 기울기 소실 문제Attention의 핵심 아이디어'디코더에서 출력 단어를 예측하는 매 시점(time step)마다. 인코더에서 전체 입력 문장을 다시 한번 참고하여 해당 시점에서 예측해야 할 단어와 연관이 있는 입력 단어 부분을 좀 더 집중(attention)해서 보기'라는 아이디어를 가지는 개념이다.  그렇다면 Attention은 무슨 작동원리를 가질까?Attention MechanismAttention 메커니즘은 Seq2Seq모델의 한계를 극복하기 위해 도입되었다. 이로인해 모델의 성능이 크게 향상되었고, 더 나아가 Self-Att.. 2024. 7. 8.
시계열 분석 @비타민 24-1학기 시계열 분석 분야에 대한 팀 프로젝트를 진행하였다.  기존의 미세먼지 추세를 분석하여 미래 미세먼지를 예측해보자. ARIMA모델과 SARIMA모델을 활용하여 시계열 분석을 진행해 보았다. 시계열 분석 처음이기에  기본적인 내용만 ARIMA시계열 데이터를 분석하고 예측하는 통계적 모델로, 세가지 구성요소를 결합하였다. 각각의 구성요소가 시계열 데이터의 패턴을 설명한다. (구성요소 : 자기회귀, 차분, 이동평균) SARIMA는 ARIMA모델에 계절성이 추가된 것이다. 데이터서울 열린데이터 광장의 '서울시 월별 평균 대기오염도 정보' 1. 데이터 전처리전처리 및 구조화필요없는 칼럼 명('측정소 명')을 제거. '년'과'월'을 추출하여 새로운 칼럼을 추가. 2002년부터 20023년까지의 .. 2024. 6. 22.
wav2vec2.0 @고급기계학습과목 Teamproject를 하면서 Wav2Vec 2.0은 페이스북 AI 리서치에서 개발한 모델로, 음성 데이터의 자동 음성 인식(Automatic Speech Recognition, ASR)을 목표로 하고 있다. 작동크게 두가지로 나뉜다첫째, 음성의 원시 파형에서 의미있는 특성을 추출하는 비지도 학습 과정둘째, 학습된 특성을 사용하여 음성인식이나 다른 오디오 기반의 분류 작업에 적용하는 지도 학습 과정  이론https://arxiv.org/abs/2006.11477Word Embedding기존 정수 인코딩 한계- 단어 사이의 연관성 파악 어려움원핫인코딩 한계 - 희소표현(원핫인코딩된 벡터는 대부분의 요소가 0인 희소벡터이다. 범주의 수가 많아질수록 벡터의 차원이 커져서 대부분의 값이 0인 .. 2024. 5. 27.
YOLO 모델 YOLO모델의 전반적인 개괄YOLO는 실시간 객체 감지 알고리즘이다. 이미지를 단 한번만 보고 객체의 종류와 위치를 예측한다. 이에 빠르고 효율적이다특징초고속 처리 : 이미지를 한번에 전체적으로 분석하여 빠른속도로 객체 감지 가능정확성 : 기존 방식보다 정확도 높고 실시간 적용이 가능함간단한 구조 : 상대적으로 단순하기에 구현이 용이 장점 및 단점장점기존의 객체 감지 모델보다 빠른 처리 속도프레임 감지 이후 회귀 문제로 다루기에 복잡한 파이프라인이 필요하지 않음실시간으로 객체 감지가 가능하여 자율주행 등 다양한 분야에 활용이 가능정확도가 높음모델의 크기가 작아 메모리와 계산 자원을 적게 사용(경량화)객체의 일반화가 가능한 표현을 학습함YOLO는 일반화 가능성이 높기 때문에 새로운 도메인이나 예상치 못한 .. 2024. 5. 20.
비지도 학습 학습 유형지도학습 : 모든 샘플이 레이블 정보를 가짐비지도 학습 : 모든 훈련 샘플이 레이블 정보를 가지지 않음준지도 학습 : 레이블을 가진 샘플과 가지지 않은 샘플이 섞여 있음기계 학습이 사용하는 지식훈련집합사전지식매니폴드 가정 : 고차원 공간에 주어진 실제 세계의 데이터는 고차원 입력 공간에 내재한 훨씬 저차원인 매니폴드의 인근에 집중되어 있다. (매니폴드는 고차원 공간에 내재한 저차원 공간. 보통 비선형 공간이지만 지역적으로 살피면 선형 구조)매끄러움 가정 : 샘플은 어떤 요인에 의해 변화한다. 비지도 학습과 준지도 학습은 사전 지식을 더 명시적으로 이용비지도 학습 군집화 : 유사한 샘플을 모아 같은 그룹으로 묶는 일맞춤광고, 영상 분할, 유전자 데이터 분석 등에 이용밀도 추정 : 데이터로부터 확률.. 2024. 5. 6.
ResNet의 전이학습 @https://www.youtube.com/watch?v=4BVNULkThDQ 를 참고했습니다 전이학습 사전 훈련 모델의 결과를 그대로 가져와서 나에게 맞게 fine-tuning 코드 구현 import numpy as np import matplotlib.pyplot as plt import torch import torch.nn as nn import torch.nn.functional as F from torch import FloatTensor as FT from torch import LongTensor as LT from torch.autograd import Variable from torchvision import models, transforms #resnet18을 불러오는 것. from.. 2024. 4. 1.