논문: https://arxiv.org/html/2407.20892v1
What is YOLOv5: A deep look into the internal features of the popular object detector
What is YOLOv5: A deep look into the internal features of the popular object detector Rahima Khanam* and Muhammad Hussain Department of Computer Science, Huddersfield University, Queensgate, Huddersfield HD1 3DH, UK; *Correspondence: rahima.khanam@hud.ac.u
arxiv.org
Title
What is YOLOv5: A deep look into the internal features of the popular object detector
Authors
Rahima Khanam, Muhammad Hussain
arXiv preprint arXiv:2407.20892, 2024
논문 리뷰 발표용 PPT 자료이며, 슬라이드에 제시된 내용 외에 추가 설명이 필요한 부분은 텍스트로 보충하였습니다.





Darknet은 연산량이 빠르지만 유연성이 낮다는 이유와 PyTorch의 개발 편의성 때문에 PyTorch를 이용하게 되었다.

작은 객체를 탐지할 수 있게 되는 이유
Scaling: 학습 시 이미지 크기를 랜덤 하게 축소하면서 작은 객체도 학습
Color space manipulation: 작은 객체는 픽셀 수가 적어서 색상 정보에 대한 의존도가 높기 때문
Mosaic augmentation: 여러 객체들이 더 작은 크기로 한 장에 나오며 작은 객체를 인식




CSP의 단점: 구현이 복잡하며 메모리 오버헤드가 발생할 수 있다.

PANet의 장점: 원본 데이터의 손실을 최소화하며 의미 정보와 위치 정보를 모두 활용할 수 있다.





'AI > Paper Review' 카테고리의 다른 글
| Generative Hints (0) | 2025.12.16 |
|---|---|
| Deep Residual Learning for Image Recognition (0) | 2025.12.12 |
| CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features 정리 (0) | 2025.12.12 |
| Distilling the Knowledge in a Neural Network 리뷰 (0) | 2025.09.14 |
| Exploring Better Food Detection via Transfer Learning 리뷰 (0) | 2025.09.07 |