Lapkritis 03, 2023

Teksto į 3D AI modelis

Paskelbta: 03 m. lapkričio 2023 d. 9:21 Atnaujinta: 05 m. lapkričio 2023 d. 12:09

Kas yra teksto į 3D AI modelis?

Teksto į 3D DI modelis yra technologija, kuri tekstinius aprašymus ar instrukcijas paverčia trimačiais (3D) vaizdiniais vaizdais arba modeliais. Šis AI modelis gali naudoti tekstinę įvestį, kuri gali apibūdinti objektus, scenas ar sąvokas ir paversti jį atitinkamu 3D modeliu. Jis veikia natūralios kalbos apdorojimo (NLP) ir kompiuterinės grafikos sankirtoje, naudodamas pažangius algoritmus 3D turiniui generuoti pagal pateiktą tekstą.

Susijęs: 10 ir daugiau geriausių dirbtinio intelekto 3D generatorių 2023 m.: tekstas į 3D, vaizdas į 3D, vaizdo įrašas į 3D

Teksto į 3D AI modelio supratimas

Norint suprasti teksto į 3D AI modelį, reikia suvokti pagrindinius mechanizmus, kaip jis interpretuoja ir konvertuoja teksto duomenis į 3D formas ir struktūras. Tam reikia žinių apie NLP metodus, 3D modeliavimą ir specifinę modelio architektūrą, naudojamą šiai užduočiai atlikti. Šie AI modeliai randa taikomųjų programų įvairiose srityse, įskaitant kompiuterinį projektavimą, virtualią realybę, žaidimus ir architektūrinę vizualizaciją, leidžiančią sklandžiai perkelti tekstinius aprašymus į apčiuopiamus 3D vaizdus.

presto-player>

Teksto į 3D pasaulis

Įvairiose platformose gausu diskusijų dėl 3D modelių generavimo iš teksto aprašymų ar net pavienių vaizdų, žadančių atverti galimybių pasaulį. Bet nulupkime sluoksnius ir patyrinėkime, kas slypi po paviršiumi.

Visų pirma, būtina pripažinti, kad 3D nėra tik sritis, kurioje gyvena sudėtingi erdvėlaiviai ir protu nesuvokiamos simuliacijos; jis taip pat yra praktiniame kasdienių programų pasaulyje. 3D esmė yra akių, sudėtingų tinklų kūrimas define 3D objekto struktūra, leidžianti toliau manipuliuoti ir sąveikauti. Šiuo metu esami moksliniai straipsniai ir projektai siūlo metodus, kurie, šiek tiek supaprastintai tariant, apima teksto ar vaizdo įvestį, kelių vaizdų generavimą iš skirtingų kampų ir fotogrametrijos, skaičiavimo burtų ir esamų 3D atkūrimo metodų sintezę. objektą iš įvesties duomenų.

Nors šie metodai padarė didelę pažangą gerinant tekstūros kokybę ir tikslumą, vis dar išlieka nuolatinis iššūkis. Lieka klausimas, kam mums reikalingi šie 3D modeliai? Nors jie randa praktinių pritaikymų, pvz., sukasi produktų vaizdus internetinėms parduotuvėms, visas 3D tekstūros ir detalių potencialas dažnai yra nepakankamai išnaudojamas, todėl atsiranda daugybė „TikTok“ vaizdo įrašų ir memų.

Kaip veikia teksto į 3D AI modeliai?

Teksto į 3D DI modeliai susilaukė dėmesio dėl jų galimybės tekstinius aprašymus paversti trimačiais (3D) vaizdais. Tačiau kaip vyksta šis procesas ir kokie iššūkiai laukia?

Procesą galima suskirstyti į tris pagrindinius etapus. Pirma, AI modelis yra išmokytas atpažinti tam tikrą 3D objekto klasę ar tipą, remiantis duotu duomenų rinkiniu. Jis analizuoja duomenų rinkinį ir funkcijas, kurios define tą klasę, leidžiančią suprasti, kaip tos kategorijos objektai yra struktūrizuoti. Šis žingsnis sudaro pagrindą būsimai AI 3D kartai.

Antrasis žingsnis apima esamų 3D modelių naudojimą kaip nuorodas. Šie modeliai veikia kaip AI šablonas, leidžiantis generuoti naujus 3D objektus su panašiais atributais ir struktūromis. Šis nuorodomis pagrįstas metodas supaprastina generavimo procesą ir padeda išlaikyti išvesties nuoseklumą.

Trečiasis žingsnis yra šiek tiek labiau specializuotas ir pirmiausia taikomas tokioms kategorijoms kaip žmogaus avatarai. Čia AI daugiausia dėmesio skiria tam tikroms 3D modelių klasėms, pvz., skirtingų tipų galvoms. Sukūrę didelį 3D galvučių duomenų rinkinį ir apmokydami dirbtinį intelektą jame, kūrėjai gali efektyviai generuoti tikroviškas 3D galvutes. Nors šiuo metodu gaunami aukštos kokybės tinkleliai, jis taikomas tik siaurai objektų klasei.

Svarbu pažymėti, kad ši technologija nesukuria galutinio, šlifuoto rezultato, pavyzdžiui, statinio vaizdo ar vaizdo įrašo. Vietoj to, jis sukuria tarpinį 3D išteklius, kuris gali būti toliau tobulinamas po gamybos arba naudojamas gamyboje. Dėl šio universalumo jis yra vertingas įrankis įvairioms programoms – nuo 3D išteklių kūrimo vaizdo žaidimams iki turinio gamybos supaprastinimo.

Nepaisant pažadų teksto į 3D AI modelius, vis dar reikia įveikti iššūkius. Viena iš pagrindinių kliūčių yra poreikis susiaurinti objektų, kuriuos AI gali efektyviai generuoti, kategorijas. Be šio dėmesio AI sunku pasiekti prasmingų rezultatų.

Be to, yra daugybė 3D duomenų rinkinių, tačiau ne visi jie tinkami naudoti po gamybos. Daugelis jų yra per triukšmingi ir sunkūs praktiniam naudojimui. Ši problema paskatino ieškoti aukštos kokybės duomenų rinkinių, kurie galėtų padėti kurti geresnius AI modelius.

Be to, kuriant teksto į 3D modelius, kurie generuoti turtą tinka konkrečioms užduotims ar programinei įrangai yra sudėtingas procesas. Tam dažnai reikia specializuoto požiūrio, nes „parametrai“ arba specifikacijos įvairiose programose labai skiriasi.

Pastaruoju metu, „Luma AI“ pristatė naujausią savo kūrinį „Genie“. – revoliucinis neuroninis tinklas, sukurtas 3D modeliavimo pasaulį užvaldyti. Genie, Luma Ai sumanytojas, puikiai įžengė į AI sritį, o jos galimybės neabejotinai paliks jus sužavėtas. Ši novatoriška technologija, kurią pristatė Luma AI, gali be vargo per kelias sekundes sukurti sudėtingus 3D modelius. teksto raginimas. Greitis ir efektyvumas, kuriuo Genie veikia, yra įspūdingi. Ši novatoriška plėtra reiškia didelį šuolį į priekį AI sukurto 3D modeliavimo pasaulyje. Priešingai nei daugelis kitų paslaugų, Genie yra ne tik stebėtinai greita, bet ir visiškai nemokama. Vartotojai gali sklandžiai generuoti 3D modelius be jokių išlaidų, todėl jie yra prieinami visiems. Tai keičia žaidimą, o galimybės yra neribotos.

Teksto į 3D kūrimo srityje neretai tenka susidurti su kai kuriomis vyraujančiomis klaidingomis nuostatomis. Daugeliui kūrėjų 3D koncepcija gali atrodyti tokia pat sunkiai suprantama kaip paprasta debesis taškų. Veidai, kraštai, viršūnės, UV, Tris/Quads ir kiti pagrindiniai elementai kartais nepastebimi, paliekant supratimo spragą. Tai panašu į tai, kad vaizdas yra ne kas kita, kaip pikselių tinklelis, mažai dėmesio skiriant sudėtingesniems aspektams, tokiems kaip alfa, Z kanalas ir kompozicija. Dall-E 3, žymus šios srities veikėjas, žino skaidrumą ir alfa, tačiau nuolankiai pripažįsta, kad alfa kanalas išlieka šiek tiek mįslingas. Rezultatas? Komiškas Photoshop stiliaus manevravimo bandant derinys pašalinti fonus. Mes gilinamės į šias klaidingas nuomones, kad atskleistume pagrindinius teksto į 3D kūrimo pagrindus.

Paskutinės naujienos apie teksto į 3D AI modelį

„Google“ pristatė TextMesh, naujas teksto į 3D metodas, kuris tobulinamas Stable Diffusion- pagrįsta teksto į 3D modelių generavimas. Šis metodas generuoja kelis kampus iš 2D įvesties ir naudoja neuroninio spinduliavimo laukų (NeRF) metodą, kad sukurtų 3D tinklelį. „TextMesh“ siūlo patogią išvestį, tikroviškus 3D tinklelius ir išvengia didelio sodrumo efektų. SDF karkasas patobulina tekstūrą, pagerina aiškumą ir vengia persotinimo.
Nvidia paleista Magic3D, teksto į 3D turinio kūrimo programinė įranga, kuri paverčia teksto aprašymus į 3D skaitmeninius modelius. Programinė įranga naudoja neuroninį tinklą, parengtą naudojant didelį 3D modelių duomenų rinkinį, ir gali generuoti 3D modelius iš vieno 2D vaizdo arba 2D vaizdų serijos. Jis siūlo vartotojams naujus būdus valdyti 3D sintezę ir gali sukurti aukštos kokybės 3D tinklelio modelius dvigubai greičiau nei DreamFusion.
„Google“ sukūrė neuroninį tinklą, vadinamą DreamFusion, kuri gali generuoti 3D modelius iš teksto aprašymų naudojant iš anksto paruoštą 2D teksto į vaizdą sklaidos modelį. Šis metodas įveikia didelio masto duomenų rinkinių ir veiksmingos 3D duomenų architektūros slopinimo apribojimus. „DreamFusion“ naudoja gradiento nusileidimą, kad optimizuotų atsitiktinai inicijuotą 3D modelį, todėl gaunami puikiai apšviečiami 3D modeliai, kurių išvaizda, gylis ir normalūs. Sistema naudoja Score Distillation Sampling (SDS), kad optimizuotų mėginius bet kurioje parametrų erdvėje, pvz., 3D erdvėje.

Ką tu manai apie Stability AInaujas stabilus 3D teksto į 3D ir vaizdo į 3D modelis? pic.twitter.com/PITVzQ0xtM
- Tsarathustra (@tsarnick) Lapkritis 1, 2023

Generatyvus dirbtinio intelekto tekstas į 3D modelį + VR/AR + tinkle sujungta virtuali 3D erdvė žiniatinklio naršyklėje. Kodas ir demonstracija internete adresu https://t.co/NrX2LlHLsZ #trys #GenAI #webxr #webgl pic.twitter.com/cY1m3gM2XY
- takahiro (John Smith) (@superhoge) Lapkritis 3, 2023

Ar galime sukurti 3D sceną su vienu 360 laipsnių vaizdu? Siekdami išspręsti šią problemą, pristatome PERF.

Programos: 1) Panorama-to-3D; 2) Tekstas į 3D; 3) Įveskite 3D stilizaciją.

Popierius: https://t.co/OSnaV3w5ey
Projekto puslapis: https://t.co/f2z8XzBW1f
kodas: https://t.co/d4kV4qbp9m pic.twitter.com/TPPRP7VHlR
- Guangcong Wang (@GuangcongW) Spalis 26, 2023

Gana patrauklus tekstas į 3D. Raginimas buvo „šiuolaikinė purpurinė sofa“. Sugeneruojama per 14 sekundžių (su 3 kitais), o GLB importuojamas į Blender dar per 5 sekundes.

Išbandykite prisijungę prie „Discord“: https://t.co/z0ZwTIz4AS https://t.co/wCE7R5TiAF pic.twitter.com/tiKxzind71
– Andrew Price (@andrewpprice) Lapkritis 2, 2023

«Grįžti į žodynėlio rodyklę

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.

Daugiau straipsnių

Damiras Jalalovas