본문 바로가기

ML & DL

(10)

RAG 개념 및 사용 예제 언어 모델과 LLM언어모델텍스트를 이해하고 생성할 수 있는 인공지능 모델주어진 문장의 다음 단어를 예측하거나, 문장을 완성하거나, 질문에 답변을 제공하는 등의 작업이 가능 LLM(Large Language Model)대규모의 텍스트 데이터로 학습된 언어 모델수억~수조 개의 매개변수(parameters)를 가지고 있어 매우 복잡하고 정교한 언어 이해와 생성 능력이 있음 pretrained model, foundation model이미 대규모 데이터로 학습을 완료한 상태의 모델새로운 작업에 맞게 fine-tuning 하여 활용할 수 있음RAG검색 증강 생성(Retrieval-Augmented Generation)외부 지식 소스(카탈로그, 제품 가격 등)를 LLM과 연동하여 원하는 답을 이끌어 내는 방법외부 ..

Batch Size와 모델 성능의 상관관계 Batch Normalization 위 수식을 자세히 알 필요는 없고, 미니배치의 평균, 분산을 이용하여 값을 구한다는 것만 알면 된다. 관심이 간다면 아래 Reference에 링크해뒀으니 논문을 읽어봐도 좋을 것이다. 그래서 결론은 다음과 같다. 결국 Batch Normalization(이하 배치 정규화)는 미니배치의 평균, 분산에 영향을 받는다. 평균, 분산은 미니배치의 크기에 따라 달라지므로 Batch Size에 따라 미니배치의 평균, 분산이 변한다는 것. 따라서 Batch Size는 배치 정규화에 영향을 미친다. 즉, Batch Size에 따라 모델의 성능이 달라질 수 있다! Batch Size 정리 Batch Size가 커질수록.. Batch Size가 작아질수록.. 노이즈 ↓ 노이즈 ↑ 일반화..

Grounded Segment Anything(Grounded SAM)을 사용한 auto-labeling (autodistill) Grounded Segment Anything을 이용해 auto-labeling을 해보자. 이후 해당 데이터로 YOLOv8 학습까지 진행해본다. 공식 github https://github.com/autodistill/autodistill GitHub - autodistill/autodistill: Images to inference with no labeling (use foundation models to train supervised models) Images to inference with no labeling (use foundation models to train supervised models) - GitHub - autodistill/autodistill: Images to inferenc..

Custom Dataset으로 YOLOv5/YOLOv7 학습하기 (22.12.07 Update) (22.12.07) YOLOv7 추가Custom Dataset 준비자신이 가지고 있는 데이터를 사용하고 싶다! → labelImglabeling이 귀찮다! → 존재하는 dataset을 사용한다. 1. LabelImgLabelImg를 사용해 데이터셋을 생성하는 방법은 다음을 참조한다. LabelImg 설치 및 사용방법Image Labeling을 쉽게 할 수 있는 툴인 LabelImg를 알아보자. 설치 공식 github의 Installation을 보고 사용하는 OS에 맞게 설치해준다. GitHub - tzutalin/labelImg: 🖍️ LabelImg is a graphical image annota..ssun-g.tistory.com 이 글에서는 roboflow에서 제공하는 dataset을 사용해 학..

YOLOv5 / YOLOv7 특정 object(class) 탐지 다음 argument를 설정해줌으로써 특정 object만 탐지할 수 있다.하나의 클래스 뿐만 아니라 여러 개의 클래스를 필터링 할 수도 있음. YOLOv7의 경우 weight값만 변경하여 같은 command로 실행 가능# example (only person class)python detect.py --weight yolov5n.pt --source 0 --classes 0 class id는 다음 링크에서 확인 (id 1부터 시작) What Object Categories / Labels Are In COCO Dataset?One important element of deep learning and machine learning at large is dataset. A good dataset will ..

[강화 학습 PyTorch] Reinforcement Learning Tutorial (Part 2) 강화 학습 (Reinforcement Learning) 에이전트는 주어진 환경에서 행동을 선택하고, 그 환경에서 상태와 보상이 만들어진다. 에이전트의 목표는 주어진 환경에서 상태, 행동을 통해 얻어지는 보상을 최대화 하는 것. 에이전트는 보상을 최대화 하기 위해 어떤 선택이 가장 좋은 선택일지 학습하게 된다. 에이전트가 이런 과정으로 행동을 선택하는 것을 행동 정책(action policy)이라고 한다. 또한 에이전트가 행동을 선택하는 과정과 행동 정책을 구현하는 과정에서 Deep Q Network, epsilon-greedy 정책을 가장 흔히 사용한다. Q-Learning Q-table Q-Learning은 값에 기반하여 어떤 행동을 선택하는 것이 좋을지 에이전트에게 알려주는 방식이다. 행동을 선택하기..

[강화 학습 PyTorch] Reinforcement Learning Tutorial (Part 1) gym library의 CartPole을 사용하여 강화 학습에 입문해보자. CartPole 게임이란? 마찰이 없는 트랙에 카트(cart)하나와 카트에 연결된 막대(pole)가 하나 있다. 막대가 세워진 상태로 게임이 시작되며, 목표는 막대가 넘어지지 않도록 하는 것이다. 막대는 조작할 수 없으며 오직 카트만 조작 가능하고, 막대가 서 있는 매 시간 스텝마다 +1의 보상이 주어진다. 에피소드가 종료되는 조건은 다음과 같다. 막대가 수직으로부터 12도 이상 기울어짐. (-12 ~ 12) 카트가 중심으로부터 2.4이상 벗어남 (-2.4 ~ 2.4) 시간 스텝이 200보다 커짐 (CartPole-v1의 경우 500보다 커졌을 때) 100번의 시도에서 평균 195.0 이상의 보상을 얻으면 게임을 해결했다고 정의..

[Object Detection] 커스텀 모델로 Detection 하기 데이터셋은 다음 링크의 MNIST 데이터를 사용하였다.https://www.kaggle.com/competitions/digit-recognizer/data Dataset데이터셋이 위와 같은 .csv 파일이므로 이미지 출력을 위해 2차원 array로 만들어 준다. def show_img_from_df(df, index): plt.imshow(np.reshape(np.array(df.iloc[index, 1:]), (28, 28)), cmap="gray") show_img_from_df(train_df, 17) Object Detection 하기 위한 새로운 이미지를 생성한다. 아이디어는 다음과 같다.(90, 90) 사이즈의 새로운 빈 이미지를 생성한다.사이즈 범위 내의 랜덤한 (x, y) ..

목록 더보기

티스토리툴바