분류 전체보기
-
Resonsible AI - Studying Bias in GANs through the Lens of RaceAI/Analysis 2025. 3. 28. 21:40
ECCV 2022Studying Bias in GANs through the Lens of Race본 논문은 Responsible AI (RAI)에 관한 논문으로 데이터 편향의 GAN에 미치는 영향에 대한 분석을 한 논문이다.요즘 신뢰성, 강건성을 가지는 AI 모델에 대한 고민을 하게 되며 관심을 해당 분야에 관심이 생겨 읽어보게 된 논문이다. DOI: https://doi.org/10.48550/arXiv.2209.02836 Studying Bias in GANs through the Lens of RaceIn this work, we study how the performance and evaluation of generative image models are impacted by the racial..
-
ReZero is All You Need: Fast Convergence at Large DepthAI/Vision 2025. 3. 4. 17:03
PMLR ReZero is All You Need: Fast Convergence at Large Depth Thomas Bachlechner∗ , Bodhisattwa Prasad Majumder∗ , Huanru Henry Mao∗ , Garrison W. Cottrell, Julian McAuley본 논문은 large depth model에서 vanishing/exploding gradient 없이 안정적이고 빠르게 수렴하는 방법에 대한 방법을 제안하는 논문이다. doi: https://arxiv.org/abs/2003.04887 ReZero is All You Need: Fast Convergence at Large DepthDeep networks often suffer from vanishi..
-
Data-centric AI 개념AI 2025. 1. 21. 17:58
이번 포스팅에서는 Data-centric AI에 대해서 설명하고 이야기해보고자 한다.연구보다는 실무 쪽에서 많이 강조되고 필요로하는 패러다임이다. 그렇기 때문에 실제 AI system을 개발하고자 한다면, 알고 있어야 하는 내용이라 생각한다. 해당 글을 위해 참고한 논문 및 영상자료는 아래와 같다.1. 논문: Data-centric AI: Perspectives and ChallengesDoi: https://doi.org/10.48550/arXiv.2301.04819 Data-centric AI: Perspectives and ChallengesThe role of data in building AI systems has recently been significantly magnified by the..
-
Fourier-based augmentation with applications to domain generalizationAI/Vision 2024. 12. 12. 18:04
Pattern RecogntionFourier-based augmentation with applications to domain generalization Qinwei Xu, Ruipeng Zhang, Ziqing Fan, Yanfeng Wang, Yi-Yan Wu, Ya Zhang본 논문은 Domain Generalization (DG)을 위해 데이터 증강 방법을 제안한 연구이다. 특히, 논문에서 Frequency 기반 증강을 수행할 때, Phase와 Amplitude의 역할을 분석하고 이를 증강 기법에 활용하는 접근법이 좋다고 생각한다. DOI: https://doi.org/10.1016/j.patcog.2023.109474 Redirecting linkinghub.elsevier.com1. Int..
-
3D Gaussian Splatting for Real-Time Radiance Field RenderingAI/Vision 2024. 11. 25. 18:09
SIGGRAPH 20233D Gaussian Splatting for Real-Time Radiance Field Rendering Bernhard Kerbl Georgios Kopanas Thomas Leimkühler George Drettakis본 논문은 새로운 3D scene 생성 방법을 제시하는 논문이다. 기존 NeRF 보다 빠르고 더 좋은 화질의 3D scene을 생성할 수 있기 때문에 많은 주목을 받았던 논문이며, 해당 방법을 활용한 후속연구들이 활발히 이루어지고 있다. Porject: https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/ 3D Gaussian Splatting for Real-Time Radiance Field R..
-
Planar Geometry - 1AI/3D 인공지능 기하학 2024. 10. 24. 18:09
부산대학교 박진선 교수님의 "3차원 인식을 위한 다중시점 기하학과 인공지능" K-MOOC 강의를 듣고 정리한 글입니다.https://www.kmooc.kr/view/course/detail/13676?tm=20241024172605 K-MOOC 자료실 www.kmooc.krPlanar GeometryPlanar geometry (평면 기하학) 은 기하학의 한 분야로, 2차원 평면 위에서 점, 선, 각 도형 등을 다룬다. 평면 기하학은 주로 유클리드 기하학에 기반하여 도형의 길이, 각도, 면적 등의 성질을 연구한다. 이를 통해, 우리는 평면 내에서 모양의 변환(이동, 회전, 반사 및 크기 조정 등)을 다룰 수 있다. 이러한 변환은 perspective camera로 평면을 이미징할 때 발생하는 기하학적 왜..
-
2. 정렬 - (1)자료구조/자료구조 기초 2024. 10. 8. 15:08
1. 선택정렬 선택정렬은 정렬되지 않은 데이터들에 대해 가장 큰(작은) 데이터를 찾아 가장 뒤(앞)의 데이터와 교환해나가는 방식이다. 선택 정렬의 순서는 아래와 같다.1. 배열 A[1~n] 에서 가장 큰 원소를 찾아 맨 뒤로 이동시킨다.2. 맨 뒤의 원소는 가장 큰 원소로 채워지므로 더이상 신경쓰지 않는다.3. 맨 뒤에서 하나씩 앞으로 이동하면서 같은 작업을 반복한다. 선택 정렬의 파이썬 코드를 확인하고 시간복잡도를 구해보면 아래와 같다. 위와 같이, 배열 A[1...n] 에서 n-1회 반복해하며, 이때 가장 큰 수를 찾는 과정도 배열의 길이 만큼 탐색을 해야하므로 n-1회 반복되야 한다.그러므로, 이를 계산하면 O(n^2)의 시간복잡도를 가지게 된다. 2. 버블정렬 버블 정렬은 선택정렬과 같이 가장 큰..
-
FastSpeech2: FAST AND HIGH-QUALITY END-TO-END TEXT TO SPEECHAI/Audio and Speech Processing 2024. 10. 4. 18:17
ICLR 2021 FastSpeech2: FAST AND HIGH-QUALITY END-TO-END TEXT TO SPEECHYi Ren, Chenxu Hu, Xu Tan, Tao Qin, Sheng Zhao, Zhou Zhao, Tie-Yan LiuZhejiang University | Microsoft Research Asia | Microsoft Azure SpeechTTS 모델을 구현하여 프로젝트를 진행할 때 일반적으로 많이 사용하는 모델이기 때문에 알아두는 것이 좋은 논문인 것 같다.꽤 시간이 지난 논문임에도 준수한 속도와 성능을 보인다고 생각한다. DOI: https://doi.org/10.48550/arXiv.2006.04558 FastSpeech 2: Fast and High-Quality..