November 03, 2023

Tekst-3D-AI mudel

Avaldatud: 03. november 2023 kell 9:21 Värskendatud: 05. november 2023 kell 12:09

Mis on tekstist 3D-ks tehisintellekti mudel?

Text-to-3D AI mudel on tehnoloogia, mis tõlgib tekstilised kirjeldused või juhised kolmemõõtmelisteks (3D) visuaalseteks esitusteks või mudeliteks. See AI-mudel võib kasutada tekstisisendit, mis võib kirjeldada objekte, stseene või kontseptsioone, ja teisendada selle vastavaks 3D-mudeliks. See töötab loomuliku keele töötlemise (NLP) ja arvutigraafika ristumiskohas, kasutades täiustatud algoritme, et luua pakutud teksti põhjal 3D-sisu.

seotud: 10. aasta 3+ parimat AI 2023D-generaatorit: tekstist 3D-ks, pildist 3D-ks, videost 3D-ks

Tekst-3D-AI mudeli mõistmine

Tekstist 3D-ks AI mudeli mõistmine hõlmab tekstiandmete 3D-kujunditeks ja -struktuurideks tõlgendamise ja teisendamise aluseks olevate mehhanismide mõistmist. See nõuab teadmisi NLP-tehnikate, 3D-modelleerimise ja selle ülesande jaoks kasutatava mudeli spetsiifilise arhitektuuri kohta. Need AI mudelid leiavad rakendusi erinevates valdkondades, sealhulgas arvutipõhises disainis, virtuaalreaalsuses, mängimises ja arhitektuurilises visualiseerimises, võimaldades sujuvat tõlkimist tekstiliste kirjelduste ja käegakatsutavate 3D-esituste vahel.

presto-mängija>

3D-teksti maailm

Erinevatel platvormidel on palju arutelusid 3D-mudelite loomise üle tekstikirjeldustest või isegi üksikutest piltidest, mis lubavad avada võimaluste maailma. Kuid koorime kihid tagasi ja uurime, mis on pinna all.

Eelkõige on oluline mõista, et 3D ei ole pelgalt valdkond, kus elavad keerulised kosmoseaparaadid ja mõistusevastased simulatsioonid; see asub ka igapäevaste rakenduste praktilises maailmas. 3D põhiolemus hõlmab võrgusilmade, keeruliste võrkude loomist define 3D-objekti struktuur, mis võimaldab edasist manipuleerimist ja interaktsiooni. Praeguse seisuga pakuvad olemasolevad uurimistööd ja projektid meetodeid, mis mõnevõrra lihtsustatult öeldes hõlmavad tekstilise või visuaalse sisendi võtmist, mitme kujutise genereerimist erinevatest nurkadest ning seejärel fotogrammeetria, arvutusvõlurite ja olemasolevate tehnikate ühendamist 3D rekonstrueerimiseks. objekt sisendandmetest.

Kuigi need lähenemisviisid on teinud olulisi edusamme tekstuuri kvaliteedi ja täpsuse parandamisel, on endiselt püsiv väljakutse. Jääb küsimus, miks meil neid 3D-mudeleid vaja on? Kuigi nad leiavad praktilisi rakendusi, nagu veebipoodide jaoks pöörlevad tootepildid, on 3D-tekstuuri ja detailide kogu potentsiaal sageli alakasutatud, mille tulemuseks on TikToki videote ja meemide meri.

Kuidas tekstist 3D-ks AI mudelid töötavad?

Tekst-3D-AI mudelid on pälvinud tähelepanu nende potentsiaali tõttu tõlkida tekstilised kirjeldused kolmemõõtmelisteks (3D) esitusteks. Kuid kuidas see protsess toimib ja millised väljakutsed ootavad ees?

Protsessi võib jagada kolmeks põhietapiks. Esiteks, tehisintellekti mudelit õpetatakse ära tundma kindlat klassi või tüüpi 3D-objekti antud andmekogumi põhjal. See analüüsib andmestikku ja funktsioone, mis defiseda klassi, võimaldades tal mõista, kuidas sellesse kategooriasse kuuluvad objektid on üles ehitatud. See samm paneb aluse tehisintellekti tulevasele 3D põlvkonnale.

Teine samm hõlmab olemasolevate 3D-mudelite kasutamist viidetena. Need mudelid toimivad tehisintellekti mallina, võimaldades tal luua uusi sarnaste atribuutide ja struktuuridega 3D-objekte. See viitepõhine lähenemine muudab genereerimisprotsessi sujuvamaks ja aitab säilitada väljundi järjepidevust.

Kolmas samm on veidi spetsialiseerunud ja kehtib peamiselt selliste kategooriate kohta nagu inimeste avatarid. Siin keskendub AI konkreetsetele 3D-mudelite klassidele, näiteks erinevat tüüpi pead. Luues suure andmestiku 3D-peadest ja treenides tehisintellekti sellel, saavad arendajad tõhusalt luua realistlikke 3D-päid. Kuigi see lähenemisviis annab kvaliteetsed võrgusilmad, piirdub see kitsa objektide klassiga.

Oluline on märkida, et see tehnoloogia ei anna lõplikku poleeritud tulemust, nagu staatiline pilt või video. Selle asemel loob see vahepealse 3D-vara, mida saab järeltootmises täiendavalt täiustada või tootmisprotsessis kasutada. See mitmekülgsus muudab selle väärtuslikuks tööriistaks erinevate rakenduste jaoks, alates videomängude jaoks 3D-varade loomisest kuni sisu tootmise sujuvamaks muutmiseni.

Hoolimata tekstist 3D-ks tehisintellekti mudelite lubadustele, on veel probleeme, mida ületada. Üks peamisi takistusi on vajadus kitsendada objektide kategooriaid, mida AI saab tõhusalt genereerida. Ilma selle fookuseta on tehisintellektil keeruline anda sisukaid tulemusi.

Lisaks on saadaval palju 3D-andmekogumeid, kuid mitte kõik neist ei sobi tootmisjärgseks kasutamiseks. Paljud neist on praktiliste rakenduste jaoks liiga mürarikkad ja rasked. See probleem on ajendanud otsima kvaliteetseid andmekogumeid, mis toetaksid paremate tehisintellekti mudelite väljatöötamist.

Lisaks tekstist 3D-vormingus mudelite loomine, mis varasid genereerida konkreetsete ülesannete või tarkvara jaoks sobiv on keeruline protsess. See nõuab sageli spetsiaalset lähenemist, kuna "parameetrid" või spetsifikatsioonid on erinevates rakendustes väga erinevad.

Hiljuti Luma AI avalikustas oma uusima loomingu Genie – revolutsiooniline närvivõrk, mis on loodud 3D-modelleerimise maailma tormiliseks vallutamiseks. Genie, Luma Ai vaimusünnitus, on teinud märkimisväärse sissepääsu tehisintellekti valdkonda ja selle võimalused jätavad teid kindlasti aukartusse. See uuenduslik tehnoloogia, mille tutvustas Luma AI, saab vaevata mõne sekundiga meisterdada keerulisi 3D-mudeleid. tekstiviipa. Genie töökiirus ja tõhusus on muljetavaldavad. See murranguline areng tähistab olulist edasiminekut tehisintellekti loodud 3D-modelleerimise maailmas. Erinevalt paljudest muudest teenustest pole Genie mitte ainult hämmastavalt kiire, vaid ka täiesti tasuta. Kasutajad saavad ilma kuluta sujuvalt luua 3D-mudeleid, muutes need kõigile kättesaadavaks. See muudab mängu ja võimalused on piiramatud.

Tekstist 3D-vormingusse arendamise valdkonnas ei ole harvad levinud eksiarvamused. Paljude arendajate jaoks võib 3D-kontseptsioon tunduda sama tabamatu kui lihtsalt pilv punktidest. Näod, servad, tipud, UV, Tris/Quads ja muud põhielemendid jäetakse mõnikord tähelepanuta, jättes arusaamises tühimiku. See sarnaneb kujutise käsitlemisega vaid pikslite ruudustikuna, võttes vähe arvesse keerukamaid aspekte, nagu alfa, Z-kanal ja komposiit. Dall-E 3, selle valdkonna silmapaistev tegelane, on teadlik läbipaistvusest ja alfast, kuid tunnistab alandlikult, et alfakanal jääb mõnevõrra mõistatuslikuks. Tulemus? Koomiline segu Photoshopi stiilis manööverdamisest katsetel taustade eemaldamine. Süveneme nendesse väärarusaamadesse, et valgustada tekstist 3D-vormingus arendamise põhialuseid.

Viimased uudised tekstist 3D-ks tehisintellekti mudeli kohta

Google tutvustas TextMesh, uus teksti-3D-meetod, mis täiustab Stable Diffusion-põhine tekstist 3D-mudeli genereerimine. See meetod genereerib 2D-sisendist mitu nurka ja kasutab 3D-võrgu loomiseks NeRF-i (Neural Radiance Fields) lähenemisviisi. TextMesh pakub kasutajasõbralikku väljundit, realistlikke 3D-võrke ja väldib kõrgeid küllastusefekte. SDF-raamistik täpsustab tekstuuri, parandades selgust ja vältides üleküllastumist.
Nvidia on käivitunud Magic3D, tekstist 3D sisu loomiseks mõeldud tarkvara, mis teisendab tekstikirjeldused 3D-digitaalseteks mudeliteks. Tarkvara kasutab närvivõrku, mis on koolitatud suurel 3D-mudelite andmekogumil ja suudab luua 3D-mudeleid ühest 2D-kujutisest või 2D-piltide seeriast. See pakub kasutajatele uusi viise 3D-sünteesi juhtimiseks ja suudab toota kvaliteetseid 3D-silmamudeleid kaks korda kiiremini kui DreamFusion.
Google on välja töötanud närvivõrgu nimega DreamFusion, mis suudab tekstikirjeldustest genereerida 3D-mudeleid, kasutades eelnevalt väljaõpetatud 2D-tekst-pildiks difusioonimudelit. See meetod ületab suuremahuliste andmekogumite ja tõhusate 3D-andmearhitektuuride müra summutamise piirangud. DreamFusion kasutab juhuslikult lähtestatud 3D-mudeli optimeerimiseks gradiendi laskumist, mille tulemuseks on taasvalgustavad 3D-mudelid, millel on kõrge täpsusega välimus, sügavus ja normaalsed näitajad. Süsteem kasutab SDS-i ( Score Distillation Sampling ) proovide optimeerimiseks mis tahes parameetriruumis, näiteks 3D-ruumis.

Mis sa arvad? Stability AIKas uus stabiilne 3D-tekst-3D-mudel ja pilt-3D-mudel? pic.twitter.com/PITVzQ0xtM
- Tsarathustra (@tsarnick) November 1, 2023

Generatiivne AI-tekst 3D-mudeliks + VR/AR + võrgustatud virtuaalne 3D-ruum veebibrauseris. Kood ja veebidemo aadressil https://t.co/NrX2LlHLsZ #kolm #GenAI #webxr #webgl pic.twitter.com/cY1m3gM2XY
— takahiro (John Smith) (@superhoge) November 3, 2023

Kas saame luua 3D-stseeni ühe 360-kraadise pildiga? Selle probleemi lahendamiseks tutvustame PERF-i.

Rakendused: 1) Panorama-to-3D; 2) Text-to-3D; 3) 3D stiliseerimise juurutamine.

Paber: https://t.co/OSnaV3w5ey
Projekti leht: https://t.co/f2z8XzBW1f
kood: https://t.co/d4kV4qbp9m pic.twitter.com/TPPRP7VHlR
— Guangcong Wang (@GuangcongW) Oktoober 26, 2023

Üsna köitev tekst 3D-ks. Prompt oli "kaasaegne lilla diivan". Genereeriti 14 sekundiga (koos 3 teisega) ja GLB impordib Blenderisse veel 5 sekundiga.

Proovige Discordiga liitudes: https://t.co/z0ZwTIz4AS https://t.co/wCE7R5TiAF pic.twitter.com/tiKxzind71
— Andrew Price (@andrewpprice) November 2, 2023

«Tagasi sõnastiku indeksi juurde

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.

Veel artikleid

Damir Jalalov