3회차 교안을 정리하고, 이번 강의에서 좀더 다루고자 하는 LLM과 생성성 AI에 대해 틈틈히 정리하고 있다.
그리고, 틈틈히 공부하고 살펴보는 내용
트랜스포머 모델에서의 어텐션 메커니즘은 입력 문장을 처리하는 과정에서 각 단어가 서로 다른 단어들과 어떤 정도로 연관되어 있는지를 파악하고 이를 바탕으로 각 단어의 중요성을 계산한다. 이를 통해 모델은 문장 내에서 다양한 단어 간의 상호작용을 고려하여 문맥을 이해하고 효과적으로 표현할 수 있다.
여기서 어텐션 메커니즘은
1) 쿼리(Query), 키(Key), 값(Value)의 생성: 입력 문장의 각 단어들에 대해 쿼리, 키, 값 벡터를 생성. 각각은 해당 단어의 표현을 나타내며, 쿼리는 어떤 단어에 집중할지를 결정하고, 키와 값은 다른 단어들과의 상호작용을 위한 정보를 제공.
2) 어텐션 스코어 계산: 각 쿼리와 키 벡터 간의 유사도를 측정하여 어텐션 스코어를 계산. (쿼리 단어와 다른 단어들 간의 상대적인 관련성)
3) 어텐션 가중치 계산: 어텐션 스코어를 소프트맥스 함수를 통과시켜 각 단어의 중요성을 나타내는 어텐션 가중치를 계산. (각 단어가 전체 문맥에서 차지하는 상대적인 중요성)
4) 가중 평균 계산: 값 벡터와 어텐션 가중치를 곱하여 각 단어의 가중 평균을 계산합. 이를 통해 모델은 각 단어의 중요성을 고려하여 문맥을 표현.
과 같이 동작한다. 이러한 과정을 모든 단어에 대해 반복하여 전체 문장의 특성을 적절하게 반영한 표현을 얻고 어텐션 메커니즘을 통해 트랜스포머 모델은 문장을 더 잘 이해하고 다양한 자연어 처리 작업을 수행할 수 있게 된다.
올 가을 쯤 논문을 작성하려고 한다. 지금은 그 과정을 즐기고 있는 상황 ^^
'DevSmile 하는 일 > 데이터분석-인공지능-자동화' 카테고리의 다른 글
2학기 강의 - AI딥러닝실무를 시작한다. (0) | 2024.04.24 |
---|---|
[YOLO] 파이썬으로 YOLOv4 빠르게 확인해 보기 (9) | 2021.02.09 |
[수학] 데이터 분석을 본격적으로 공부해 보려 한다. (0) | 2020.01.03 |
[파이썬] 이미지에서 텍스트 추출하기 - tesseract (0) | 2019.11.18 |