Deci og Qualcomm partner for at demokratisere generativ kunstig intelligens på tværs af industrier
Kort sagt
Deci annoncerede et samarbejde med Qualcomm Technologies om at udvikle avancerede generative AI-modeller til Qualcomm Cloud AI 100.
AI-løsningsfirmaet Deci annoncerede et samarbejde med Qualcomm Technologies om at udvikle avanceret generativ AI modeller til Qualcomm Cloud AI 100. Samarbejdet har til formål at gøre AI mere tilgængelig for en bredere vifte af applikationer og demokratisere kraften i generativ AI for udviklere.
Ved at skræddersy modeller specifikt til Qualcomm Cloud AI 100-løsningen har virksomhederne til hensigt at låse op for omkostningseffektiv AI-behandling i realtid. Cloud AI 100 er Qualcomms løsning bygget til at optimere ydeevnen til generativ AI-inferencing, herunder store sprogmodeller (LLM'er).
"Nogle af hovedudfordringerne i det nuværende generative AI-landskab vedrører tilgængeligheden af computerkraft til behandlingen af disse enorme modeller og de enorme omkostninger ved at køre dem," fortalte Yonatan Geifman, CEO og medstifter af Deci. Metaverse Post. "Ved at udnytte Decis modeller kan Qualcomm-brugere få mest muligt ud af deres hardwareinvestering med modeller, der sikrer maksimal hardwareudnyttelse, samtidig med at de leverer høj hastighed og nøjagtighed."
Deci vil samarbejde med Qualcomm Technologies om at lancere to modeller, nemlig DeciCoder-6B og DeciDiffusion 2.0.
Ifølge meddelelsen er DeciCoder-6B en 6 milliarder parametermodel til kodegenerering, der understøtter otte programmeringssprog og udkonkurrerer etablerede modeller, samtidig med at hukommelsen og beregningseffektiviteten bevares.
På den anden side er DeciDiffusion 2.0 en tekst-til-billede spredningsmodel på 732 millioner parametre, der sætter nye standarder ved at levere billeder i høj kvalitet med øget hastighed og effektivitet.
Hvad adskiller Decis AI-modeller
Når du bruger LLM'er i applikationer fra den virkelige verden er det afgørende at organisere data effektivt på de servere, der foretager forudsigelser. Hovedformålet er at håndtere så mange brugerønsker på samme tid som muligt. At finde den rette balance mellem mængden af data, der behandles på én gang (batchstørrelse) og den tid, det tager at få et svar (latency), afhænger af to nøgleting: modellens design og evnerne af den hardware, der bruges til at lave forudsigelser.
"DeciCoder-6B har et mindre parameterantal end sine modstykker, hvilket resulterer i et reduceret hukommelsesfodaftryk og frigør ekstra 2 GB hukommelse sammenlignet med CodeGen 2.5 7B og 7 milliarder parametermodeller. Modellen udmærker sig i hukommelse og beregningseffektivitet, hvilket giver mulighed for effektiv skalering af batchbehandling uden væsentligt hukommelsesforbrug eller bemærkelsesværdige stigninger i latens,” sagde Decis administrerende direktør Yonatan Geifman.
Han forklarede yderligere, "DeciDiffusion 2.0 leverer billeder i høj kvalitet i 40 % færre iterationer og anvender en mindre og hurtigere U-Net-komponent sammenlignet med Stable Diffusion 1.5. Det kan producere billeder af høj kvalitet med færre diffusionstidstrin under inferensprocessen."
Modellen reducerer effektivt antallet af nødvendige trin for at generere et kvalitetsbillede fra 16 til kun 10.
Decis Neural Architecture Search Technology – AutoNAC – har spillet en afgørende rolle for modellernes effektivitet og skalerbarhed. Det automater søgeprocessen på en beregningseffektiv måde, der adskiller den fra traditionelle metoder. Denne teknologi gjorde det muligt for Deci at frigive en række state-of-the-art modeller inden for en kort tidsramme, med lavere udgifter til computere til træning sammenlignet med andre store udviklere af sprogmodeller.
DeciCoder-6B: Skræddersyet præcision til industriel ekspertise
DeciCoder-6B's evne til at understøtte otte programmeringssprog placerer den som en go-to-model til en bred vifte af applikationer. Geifman delte nogle af de forskellige måder, modellen kan udnyttes på.
"Inden for softwareudvikling kan det hjælpe med kodegenerering og kodefuldførelse, hvilket reducerer udviklingstiden betydeligt og øger produktiviteten. Yderligere kan DeciCoder-6B bruges til at undervise i programmering, catering til en række sprog og sværhedsgrader. Studerende kan bruge det til at tjekke deres arbejde og som en løsningsmanual,” sagde Decis Geifman Metaverse Post.
"Derudover, inden for cybersikkerhed, kan modellen finjusteres til at hjælpe med at skrive og analysere scripts til sårbarhedsscanning med mulighed for at automatisere sikkerhedstjek på tværs af forskellige programmeringsmiljøer," tilføjede han.
Samarbejdet mellem Deci og Qualcomm Teknologier markerer et væsentligt skridt i retning af at demokratisere kraften i Generativ AI. Med optimerede modeller, effektiv teknologi og en forpligtelse til åbenhed har partnerskabet til formål at styrke udviklere og industrier verden over med tilgængelige og omkostningseffektive AI-løsninger.
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Kumar er en erfaren teknisk journalist med speciale i de dynamiske skæringspunkter mellem AI/ML, marketingteknologi og nye områder som krypto, blockchain og NFTs. Med over 3 års erfaring i branchen har Kumar etableret en dokumenteret track record i at skabe overbevisende fortællinger, udføre indsigtsfulde interviews og levere omfattende indsigt. Kumars ekspertise ligger i at producere indhold med stor gennemslagskraft, herunder artikler, rapporter og forskningspublikationer til fremtrædende industriplatforme. Med et unikt færdighedssæt, der kombinerer teknisk viden og historiefortælling, udmærker Kumar sig ved at kommunikere komplekse teknologiske koncepter til forskellige målgrupper på en klar og engagerende måde.
Flere artiklerKumar er en erfaren teknisk journalist med speciale i de dynamiske skæringspunkter mellem AI/ML, marketingteknologi og nye områder som krypto, blockchain og NFTs. Med over 3 års erfaring i branchen har Kumar etableret en dokumenteret track record i at skabe overbevisende fortællinger, udføre indsigtsfulde interviews og levere omfattende indsigt. Kumars ekspertise ligger i at producere indhold med stor gennemslagskraft, herunder artikler, rapporter og forskningspublikationer til fremtrædende industriplatforme. Med et unikt færdighedssæt, der kombinerer teknisk viden og historiefortælling, udmærker Kumar sig ved at kommunikere komplekse teknologiske koncepter til forskellige målgrupper på en klar og engagerende måde.