Inihayag ng Lambda Labs ang isang AI image mixer na maaaring pagsamahin ang hanggang limang larawan
Sa madaling sabi
Ang AI mixer ay binuo sa Stable Diffusion Imahen Variations model, na na-optimize para tumanggap ng maraming CLIP image embeddings.
Ang Lambda Labs, isang AI research lab, ay nag-anunsyo ng bago Panghalo ng imahe ng AI na maaaring pagsamahin ang hanggang limang larawan. Ang panghalo ng imahe ay batay sa Stable Diffusion Modelo ng Mga Pagkakaiba-iba ng Imahe, na na-fine-tune para kumuha ng maramihang CLIP na pag-embed ng larawan. Ang tool, na tinatawag na “Image Mixer,” ay idinisenyo upang tulungan ang mga user na lumikha ng mga bagong larawan sa pamamagitan ng paghahalo at pagtutugma ng mga kasalukuyang larawan.
Ang bagong image mixer na ito ay nagbibigay-daan para sa mas mataas na antas ng kontrol at pag-customize kung ihahambing sa iba pang image-mixing software sa merkado. Gamit ang kakayahang itakda ang lakas ng bawat indibidwal na larawan, ang mga user ay maaaring lumikha ng natatangi at kawili-wiling mga timpla na iniayon sa kanilang mga partikular na pangangailangan. Ang mixer ay may kakayahang mag-output ng mga imahe sa isang mas mataas na resolution kaysa sa karamihan ng iba pang software, na ginagawa itong perpekto para sa paggamit sa mga propesyonal na setting.
Mga kaugnay na balita: Midjourney hayaang pagsamahin ang dalawang larawan sa isa at makakuha ng mga kagila-gilalas na resulta |
---|
Sinasabi ng Lambda Labs na ang Image Mixer ay maaaring gamitin upang lumikha ng "nobela" na mga imahe o upang lumikha lamang ng mga bagong bersyon ng mga kasalukuyang larawan. Ang mga larawan ay maaaring ma-upload ng user o makuha mula sa isang URL.
Sa panahon ng pagsasanay, hanggang limang random na pananim ang kinuha mula sa mga larawan ng pagsasanay, at ang mga CLIP na pag-embed ng imahe ay nakalkula. Ang mga ito ay pinagsama-sama at ginamit bilang conditioning para sa modelo. Sa oras ng hinuha, ang mga pag-embed ng larawan mula sa maraming larawan ay maaaring pagsamahin upang paghaluin ang kanilang mga konsepto. Ang text encoder ay maaari ding gamitin upang magdagdag ng mga konsepto ng teksto.
Ang modelo ay sinanay sa isang subset ng LAION Improved Aesthetics sa isang resolution na 640×640 at sinanay gamit ang 8xA100 GPU sa Lambda GPU Cloud.
Habang ang panghalo ng imahe ay nasa maagang yugto pa lamang, ito ay may malaking potensyal para magamit sa iba't ibang larangan, tulad ng graphic na disenyo, advertising, at maging sa medisina. Sa kakayahang lumikha ng makatotohanan at masalimuot na mga timpla ng mga imahe, ang mga posibilidad ay halos walang katapusang.
Magbasa pa tungkol sa AI:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.