반응형 전체 글87 [1페이지 논문읽기] DisEnVisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation 해당 논문은 인풋으로 입력되는 subject를 이용해 원하는 이미지를 생성하는 연구이다. 저자들은 DisEnVisioner 라는 아키텍쳐를 제시해 별도의 tuning 과정 없이 단 한장의 이미지 만으로 아래와 같은 성능을 보인다고 한다. 그러면, 저자들이 어떤 문제점을 어떠한 방법으로 해결했는지 알아보자. 기존 연구의 한계점기존의 유사한 연구는 fine-tuning을 하는 방법들과 하지 않는 방법 크게 두 가지 방법으로 연구가 진행되고 있으나, 두 방법 모두 subject의 속성들을 제대로 해석해서 그려내는데 어려움을 겪고 있다. 이로 인해 subject의 디테일을 제대로 그려내지 못하거나, 프롬프트대로 생성이 안되게 된다. 아래 그림에서 맨 오른쪽 column을 제외하고는 전부 1) 원본이랑 비슷하.. 2024. 11. 9. Hugging Face library와 Flux를 이용한 AI 이미지 생성 실습 Flux는 AI 기반 이미지 생성에서 일관성과 스타일 유지에 중점을 둔 새로운 도구로, 생성형 AI와 창작 분야에서 큰 관심을 받고 있습니다. 특히 Hugging Face의 Diffusers 라이브러리와 결합되면서 Flux는 높은 품질의 이미지를 생성하고, 사용자가 원하는 스타일을 지속적으로 유지할 수 있는 강력한 기능을 제공합니다. 이 글에서는 Flux의 개념과 기능, 그리고 Hugging Face의 Diffusers에 적용하는 방법을 알아보고, Flux의 주요 활용 방안을 제시하겠습니다. Flux와 관련해 보다 자세한 내용을 알고싶으시면, 아래 글을 참고해주세요.Flux 이해하기: Stable Diffusion의 이미지 생성 기술 깊이 알아보기 Flux 이해하기: Stable Diffusion의 이미.. 2024. 11. 8. Flux 이해하기: Stable Diffusion의 이미지 생성 기술 깊이 알아보기 Stable Diffusion은 최근 몇 년간 AI 기반 생성 예술 분야에서 혁신을 이끌어 온 기술 중 하나입니다. 간단한 텍스트 프롬프트를 입력하여 예술적이고 고품질의 이미지를 생성할 수 있는 이 기술은 많은 관심을 받고 있습니다. 그러나 이 기술을 제대로 이해하고 활용하려면, 특히 Flux라는 개념을 이해하는 것이 필수적입니다. Flux는 AI가 이미지를 생성할 때 중요한 일관성과 스타일을 유지하는 데 핵심적인 역할을 합니다.이 글에서는 Flux가 무엇인지, Stable Diffusion에서 Flux가 어떻게 작동하는지, 그리고 Flux를 조절해 AI 생성 이미지의 품질을 극대화하는 방법을 심도 있게 알아보겠습니다. Flux 개념을 잘 이해하면 AI로 예술 작품을 창작할 때 더욱 조화롭고 일관된 결과.. 2024. 11. 7. [1페이지 논문읽기] FreeCustom: Tuning-Free Customized Image Generationfor Multi-Concept Composition 해당 논문은 multi-concept에서의 이미지 생성에 대한 연구이다. 예를 들어, 아래 그림에서 보는 것과 같이, 강아지와 선글라스, 모자의 이미지를 가지고 각각 합성된 이미지를 그려내는 등의 task를 하도록 하는 연구이다.특히, 이러한 task를 tuning-free 방법으로 해결했는데, 이 과정에서 어떠한 문제점을 어떻게 해결했고, 어떤 한계점을 가지고 있는지를 알아보겠다. 기존 연구의 한계점Custom concept 을 이용해 이미지를 생성하는 연구는 크게 아래의 두가지 방법으로 진행되어 왔다. 컨셉 이미지를 가지고 fine-tuning하는 tranining 기반의 방법과 거대한 이미지-텍스트 데이터셋에서 task에 맞게 다시 학습한 모델을 사용하는 tailored model 기반의 방법들이 .. 2024. 10. 23. 이전 1 2 3 4 5 6 7 8 ··· 22 다음