LLM모델

@생성형 AI 활용방안 모색을 위한 사전 조사

생성형 AI

방대한 양의 데이터를 학습하여 텍스트, 이미지, 오디오, 비디오 등 새로운 콘텐츠를 만들어내는 인공지능 기술.
(Chat GPT의 경우 대규모의 데이터를 학습한 언어 모델 기반의 서비스)

생성되는 콘텐츠의 종류에 따라 언어모델, 이미지모델, 비디오 모델로 분류됨.
- 멀티모달 : 텍스트와 이미지를 동시에 학습하는 모델. ->기초모델( Foundation Model )로 자리잡아가고 있음.

텍스트, 이미지, 음성, 정형데이터, 3D시그널 등 구분하지 않고 학습에 이용.

파운데이션 모델이라는 용어는 연구자들이 광범위한 일반화된 데이터와 레이블이 지정되지 않은 데이터에 대해 훈련되고 언어 이해, 텍스트 및 이미지 생성, 자연어 대화와 같은 다양한 일반 작업을 수행할 수 있는 ML 모델을 설명하기 위해 만들어졌습니다.

방대한 양의 데이터를 기반으로 사전 학습된 초대형 딥러닝 모델.

등장 배경
- LLM의 정보 제한성( 정보 부족으로 인해 제한된 답변 능력을 보임)과 환각문제(모델이 자신이 모르는 정보를 지어내어 이야기)
정보를 데이터베이스에 저장하고, 필요한 정보를 검색하여 LLM에 전달하는 방식으로 구현
- LLM에 미리 질문과 관련된 참고자료를 제공하여 사용하는 방식이기 때문에 보다 신뢰성있는 답변 생성.
데이터 처리 과정
- 원본 데이터를 청크 단위의 작은 조각으로 나누기
- 임베딩

임베딩
- 컴퓨터가 단어를 숫자로 표현하여 컴퓨터가 작업할 수 있도록 하는 기술.
- 작동 방식 -Word2vec, GloVe, fasText, ELMo, TF-IDF

프롬프트(Prompt) : ChatGPT에서 대화 시에 하는 질문이나 요청.