Báo cáo tin tức Công nghệ
16 Tháng hai, 2023

ControlNet giúp bạn có những bàn tay hoàn hảo với Stable Diffusion 1.5

Tóm lại

ControlNet là một cách dễ dàng để tinh chỉnh Stable Diffusion.

Nó có thể được sử dụng để phát triển các mô hình nhằm kiểm soát SD tốt hơn.

ControlNet là mã nguồn mở và có thể được sử dụng cùng với WebUI để đạt được Stable Diffusion.

Một điều mà các trình tạo AI chuyển văn bản thành hình ảnh đang gặp khó khăn là bàn tay. Mặc dù hình ảnh nhìn chung rất ấn tượng, nhưng bàn tay lại kém ấn tượng hơn, với những ngón tay thừa thãi, các khớp bị uốn cong một cách kỳ lạ và sự thiếu hiểu biết rõ ràng về bàn tay được cho là trông như thế nào trên phần của AI. Tuy nhiên, điều này không nhất thiết phải xảy ra vì sản phẩm ControlNet mới sẵn sàng trợ giúp Stable Diffusion tạo ra bàn tay hoàn hảo, thực tế.

ControlNet là một công nghệ mới cho phép bạn sử dụng bản đồ phác thảo, phác thảo, độ sâu hoặc bình thường để hướng dẫn các nơ-ron dựa trên Stable Diffusion 1.5. Điều này có nghĩa là giờ đây bạn có thể có trong tay gần như hoàn hảo trên bất kỳ mẫu xe 1.5 tùy chỉnh nào, miễn là bạn có hướng dẫn phù hợp. ControlNet có thể được coi là một công cụ mang tính cách mạng, cho phép người dùng kiểm soát tối đa các thiết kế của họ.

Để có được bàn tay hoàn hảo, hãy sử dụng tiện ích mở rộng A1111 với ControlNet, cụ thể là mô-đun Độ sâu. Sau đó, chụp một vài ảnh cận cảnh bàn tay của bạn và tải chúng lên tab txt2img của ControlNet UI. Sau đó, tạo lời nhắc đơn giản về hình dạng giấc mơ, chẳng hạn như “tác phẩm nghệ thuật tưởng tượng, cận cảnh người đàn ông Viking giơ tay” và thử nghiệm sức mạnh của ControlNet. Thử nghiệm với mô-đun Depth, tiện ích mở rộng A1111 và tab txt2img của ControlNet UI sẽ cho kết quả là các bàn tay trông đẹp và chân thực.

Bài viết được đề xuất: Shutterstock thưởng cho các nghệ sĩ đóng góp cho các mô hình AI sáng tạo

ControlNet tự chuyển đổi hình ảnh mà nó được cung cấp thành độ sâu, quy tắc hoặc bản phác thảo để sau này có thể sử dụng hình ảnh đó làm mô hình. Tuy nhiên, tất nhiên, bạn có thể trực tiếp tải lên bản đồ độ sâu hoặc bản phác thảo của riêng mình. Điều này cho phép linh hoạt tối đa khi tạo cảnh 3D, cho phép bạn tập trung vào phong cách và chất lượng của hình ảnh cuối cùng.

Chúng tôi thực sự khuyên bạn nên nhìn vào sự xuất sắc hướng dẫn ControlNet mà Aitrepreneur đã xuất bản gần đây.

ControlNet cải thiện đáng kể khả năng kiểm soát đối với Stable Diffusionkhả năng chuyển hình ảnh sang hình ảnh của

Mặc dù Stable Diffusion có thể tạo hình ảnh từ văn bản, nó cũng có thể tạo đồ họa từ mẫu. Đường dẫn hình ảnh đến hình ảnh này thường được sử dụng để nâng cao ảnh đã tạo hoặc tạo hình ảnh mới từ đầu bằng các mẫu.

Trong khi Stable Diffusion 2.0 cung cấp khả năng sử dụng dữ liệu độ sâu từ hình ảnh làm mẫu, nhưng việc kiểm soát quá trình này khá hạn chế. Cách tiếp cận này không được hỗ trợ bởi phiên bản trước đó, 1.5, vẫn được sử dụng phổ biến do số lượng lớn các mô hình tùy chỉnh, trong số các lý do khác.

Trọng lượng của mỗi khối từ Stable Diffusion được ControlNet sao chép thành biến thể có thể huấn luyện và biến thể bị khóa. Dạng bị chặn giữ các khả năng của mô hình khuếch tán sẵn sàng sản xuất, trong khi biến thể có thể đào tạo có thể tìm hiểu các điều kiện mới để tổng hợp hình ảnh bằng cách tinh chỉnh với các tập dữ liệu nhỏ.

Kiểm soát Stable DiffusionKhả năng image-to-image của ControlNet được tăng cường đáng kể

Stable Diffusion hoạt động với tất cả các mô hình ControlNet và cung cấp khả năng kiểm soát đáng kể hơn đối với AI chung. Nhóm cung cấp các mẫu về một số biến thể của người trong các tư thế cố định, cũng như các ảnh nội thất khác nhau dựa trên sự sắp xếp không gian của mô hình và các biến thể của hình ảnh chim.

Đọc thêm về AI:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm

Những người sáng lập ví Samourai bị buộc tội tạo điều kiện cho các giao dịch Darknet trị giá 2 tỷ USD

Sự e ngại của những người sáng lập Ví Samourai thể hiện một bước thụt lùi đáng chú ý đối với ngành, nhấn mạnh sự kiên trì ...

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Pantera Capital đầu tư vào TON Blockchain, bày tỏ sự tin tưởng vào tiềm năng mở rộng khả năng tiếp cận tiền điện tử của Telegram
Kinh doanh Báo cáo tin tức Công nghệ
Pantera Capital đầu tư vào TON Blockchain, bày tỏ sự tin tưởng vào tiềm năng mở rộng khả năng tiếp cận tiền điện tử của Telegram
2 Tháng Năm, 2024
Mitosis huy động được 7 triệu đô la tài trợ từ Amber Group và các dự án có tầm nhìn xa để nâng cao giao thức thanh khoản mô-đun của nó
Kinh doanh Báo cáo tin tức Công nghệ
Mitosis huy động được 7 triệu đô la tài trợ từ Amber Group và các dự án có tầm nhìn xa để nâng cao giao thức thanh khoản mô-đun của nó
2 Tháng Năm, 2024
Galxe hợp tác với Jambo để mở rộng khả năng tiếp cận toàn cầu tới Web3
Kinh doanh Báo cáo tin tức Công nghệ
Galxe hợp tác với Jambo để mở rộng khả năng tiếp cận toàn cầu tới Web3
2 Tháng Năm, 2024
Med-Gemini của Google sẵn sàng mang lại khởi đầu thuận lợi cho GPT-4 Với hiệu suất vượt trội trong chăm sóc sức khỏe
AI Wiki Tin tức Phần mềm Công nghệ
Med-Gemini của Google sẵn sàng mang lại khởi đầu thuận lợi cho GPT-4 Với hiệu suất vượt trội trong chăm sóc sức khỏe
2 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH