본문 바로가기
반응형

분류 전체보기93

Flux 이해하기: Stable Diffusion의 이미지 생성 기술 깊이 알아보기 Stable Diffusion은 최근 몇 년간 AI 기반 생성 예술 분야에서 혁신을 이끌어 온 기술 중 하나입니다. 간단한 텍스트 프롬프트를 입력하여 예술적이고 고품질의 이미지를 생성할 수 있는 이 기술은 많은 관심을 받고 있습니다. 그러나 이 기술을 제대로 이해하고 활용하려면, 특히 Flux라는 개념을 이해하는 것이 필수적입니다. Flux는 AI가 이미지를 생성할 때 중요한 일관성과 스타일을 유지하는 데 핵심적인 역할을 합니다.이 글에서는 Flux가 무엇인지, Stable Diffusion에서 Flux가 어떻게 작동하는지, 그리고 Flux를 조절해 AI 생성 이미지의 품질을 극대화하는 방법을 심도 있게 알아보겠습니다. Flux 개념을 잘 이해하면 AI로 예술 작품을 창작할 때 더욱 조화롭고 일관된 결과.. 2024. 11. 7.
[1페이지 논문읽기] FreeCustom: Tuning-Free Customized Image Generationfor Multi-Concept Composition 해당 논문은 multi-concept에서의 이미지 생성에 대한 연구이다. 예를 들어, 아래 그림에서 보는 것과 같이, 강아지와 선글라스, 모자의 이미지를 가지고 각각 합성된 이미지를 그려내는 등의 task를 하도록 하는 연구이다.특히, 이러한 task를 tuning-free 방법으로 해결했는데, 이 과정에서 어떠한 문제점을 어떻게 해결했고, 어떤 한계점을 가지고 있는지를 알아보겠다. 기존 연구의 한계점Custom concept 을 이용해 이미지를 생성하는 연구는 크게 아래의 두가지 방법으로 진행되어 왔다. 컨셉 이미지를 가지고 fine-tuning하는 tranining 기반의 방법과 거대한 이미지-텍스트 데이터셋에서 task에 맞게 다시 학습한 모델을 사용하는 tailored model 기반의 방법들이 .. 2024. 10. 23.
[1페이지 논문읽기] RealCustom: Narrowing Real Text Word for Real-Time Open-DomainText-to-Image Customization 원하는 이미지를 가지고 합성하는 연구는 꾸준히 진행되고 있다. 저자들은 기존 연구들이 레퍼런스 이미지와의 similarity와 프롬프트대로 합성하는 controllability 사이에서 상충한다는 dual-optimum 패러독스 때문에 합성이 제대로 되지 않는다는 문제점을 발견했고, 이를 해결하기 위해 RealCustom 아키텍처를 제안했다. 기존 연구들의 한계점과 이를 해결하기 위해 저자들이 제안한 방법을 알아보겠다. 기존 방법의 한계점앞서 얘기한 것처럼, 기존 유사한 연구들은 레퍼런스 이미지와의 similarity와 프롬프트대로 합성하는 controllability 를 모두 충족시키지 못하고, 저자들은 이를 dual-optimum 패러독스라고 명명했다. 저자들은 그 원인을 sks나 vkv 같은 pse.. 2024. 10. 23.
[1페이지 논문읽기] MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance Dreambooth, Textual Inversion 등으로 대표되는 stable diffusion과 같은 foundataion 모델에서 학습하지 않은 custom concept을 적은 데이터셋으로 학습해 원하는 이미지를 만드는 연구는 계속되고 있지만, 특히 여러개의 concept에 대해 제대로 합성하지 못하는 한계점이 많이 보인다. 또한, 여러장의 데이터가 필요한데, MS-Diffusion에서 저자들은 zero shot 환경에서 concept들의 디테일한 부분과 위에서 언급한 여러개의 concept을 제대로 합성하지 못하는 문제를 해결하고자 했다. MS-Diffusion의 저자들 어떠한 문제점을 어떻게 해결했는지 아래에 간단히 살펴보겠다. 해결하고자 하는 문제Dreambooth로 대표되는 fine-tu.. 2024. 10. 23.