Novice Tehnologija
September 25, 2023

OpenAIJe ChatGPT Razkriva večjo nadgradnjo, dodaja glasovni pogovor in slikovni klepet

Na kratko

OpenAI bo uvedel nove glasovne in slikovne zmogljivosti ChatGPT v naslednjih dveh tednih.

Te funkcije bodo na voljo samo uporabnikom Plus in Enterprise.

OpenAI je danes objavil, da bo uvedel nove glasovne in slikovne zmogljivosti v ChatGPT. Nove funkcije bodo uporabnikom omogočile glasovni pogovor z ChatGPT ali klepetajte s chatbotom prek slik.

Obvestilo sledi trditvam uporabnikov Reddita, ki so trdili, da so pridobili dostop do OpenAImodelov uporabnika in nato te informacije delil na platformi. Redditor FeltSteam je opisal model AI z delovnim imenom Arrakis, ki naj bi uporabnikom omogočal "vnos poljubne kombinacije besedila, zvoka in videa."

"Novo glasovno zmogljivost poganja nov model besedila v govor, ki je sposoben ustvariti človeški zvok iz samo besedila in nekaj sekund vzorčnega govora," je zapisal Open AI v blog post. »Pri ustvarjanju vsakega od glasov smo sodelovali s profesionalnimi glasovnimi igralci. Uporabljamo tudi Whisper, naš odprtokodni sistem za prepoznavanje govora, za prepis vaših izgovorjenih besed v besedilo.«

Z novimi funkcijami se lahko uporabniki pogovarjajo naprej in nazaj z ChatGPT z uporabo svojih glasov. S chatbotom se lahko tudi pogovarjajo o slikah. Funkcije bodo v naslednjih dveh tednih uvedene uporabnikom Plus in Enterprise.

Glasovna zmožnost bo prišla v iOS in Android kot opt-in, medtem ko bo slikovna funkcija na voljo na vseh platformah.

Če želite začeti uporabljati glasovno funkcijo, lahko uporabniki odprejo Nastavitve → Nove funkcije v mobilni aplikaciji in izberejo »glasovne pogovore«. Nato se mora uporabnik dotakniti gumba za slušalke v zgornjem desnem kotu začetnega zaslona in izbrati želeni glas med izborom petih različnih glasov.

Za pogovor z ChatGPT prek slik lahko uporabnik tapne gumb za fotografijo, da zajame sliko ali jo izbere. Če uporabljate iOS ali Android, tapnite gumb plus, preden nadaljujete. Poleg tega se lahko vključijo v razprave z več slikami ali jih uporabijo za vodenje chatbota.

OpenAI pravi, da razumevanje slike poganja multimodalnost GPT-3.5 In GPT-4. Ti modeli izkoriščajo zmožnosti jezikovnega sklepanja za analizo raznolike palete vizualnih vsebin, ki zajemajo fotografije, posnetke zaslona in dokumente, ki vsebujejo kombinacijo besedila in slik.

OpenAIpartnerstvo s Spotify

Spotify tudi danes napovedal njegovo funkcijo glasovnega prevajanja, ki ga poganja AI. Nova funkcija lahko prevede podcaste v različne jezike z uporabo izvirnega glasu podcasterja.

Glede na Preobrat, na katerega temelji ta prevodna funkcija OpenAIOrodje za prepis glasu, Whisper, ki lahko prepisuje angleški govor in prevaja različne jezike v angleščino.

Kot del pilotnega projekta se je podjetje povezalo s podcasterji Daxom Shepardom, Monico Padman, Lexom Fridmanom, Billom Simmonsom in Stevenom Bartlettom, da bi ustvarili glasovne prevode, ki jih poganja umetna inteligenca, v jezikih, kot so španščina, francoščina in nemščina, za določene epizode kataloga in prihajajoče izdaje.

"Verjamemo, da lahko premišljen pristop k umetni inteligenci pomaga zgraditi globlje povezave med poslušalci in ustvarjalci, kar je ključna sestavina Spotifyjeve misije za sprostitev potenciala človeške ustvarjalnosti," je v izjavi dejal Ziad Sultan, podpredsednik personalizacije pri Spotifyju.

Glasovno prevedene epizode pilotnih ustvarjalcev bodo po vsem svetu na voljo Premium in Free uporabnikom.

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Cindy je novinarka pri Metaverse Post, ki pokriva teme, povezane z web3, NFT, metaverse in AI, s poudarkom na intervjujih z Web3 akterji v industriji. Pogovarjala se je z več kot 30 vodstvenimi delavci na ravni C in jih je še vedno več, pri čemer je bralcem posredovala njihove dragocene vpoglede. Cindy, ki izvira iz Singapurja, je zdaj v Tbilisiju v Gruziji. Ima diplomo iz komunikacijskih in medijskih študij na Univerzi v Južni Avstraliji in ima desetletje izkušenj z novinarstvom in pisanjem. Stopite v stik z njo prek [e-pošta zaščitena] z novinarskimi predstavitvami, napovedmi in priložnostmi za intervjuje.

več člankov
Cindy Tan
Cindy Tan

Cindy je novinarka pri Metaverse Post, ki pokriva teme, povezane z web3, NFT, metaverse in AI, s poudarkom na intervjujih z Web3 akterji v industriji. Pogovarjala se je z več kot 30 vodstvenimi delavci na ravni C in jih je še vedno več, pri čemer je bralcem posredovala njihove dragocene vpoglede. Cindy, ki izvira iz Singapurja, je zdaj v Tbilisiju v Gruziji. Ima diplomo iz komunikacijskih in medijskih študij na Univerzi v Južni Avstraliji in ima desetletje izkušenj z novinarstvom in pisanjem. Stopite v stik z njo prek [e-pošta zaščitena] z novinarskimi predstavitvami, napovedmi in priložnostmi za intervjuje.

Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti

Raziščimo pobude, ki izkoriščajo potencial digitalnih valut za dobrodelne namene.

Več o tem

AlphaFold 3, Med-Gemini in drugi: način, kako umetna inteligenca spremeni zdravstveno varstvo leta 2024

Umetna inteligenca se v zdravstvu kaže na različne načine, od odkrivanja novih genetskih povezav do opolnomočenja robotskih kirurških sistemov ...

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti
Analiza Crypto Wiki ŽELITE POSTATI PARTNER Izobraževanje Življenjski slog Prisotnost Software Tehnologija
Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti
Maj 13, 2024
AlphaFold 3, Med-Gemini in drugi: način, kako umetna inteligenca spremeni zdravstveno varstvo leta 2024
AI Wiki Analiza prebaviti Mnenje ŽELITE POSTATI PARTNER Prisotnost Novice Software Zgodbe in ocene Tehnologija
AlphaFold 3, Med-Gemini in drugi: način, kako umetna inteligenca spremeni zdravstveno varstvo leta 2024
Maj 13, 2024
Omrežje Nim bo uvedlo okvir za tokenizacijo lastništva AI in izvedlo prodajo donosa z datumom posnetka, načrtovanim za maj
Prisotnost Novice Tehnologija
Omrežje Nim bo uvedlo okvir za tokenizacijo lastništva AI in izvedlo prodajo donosa z datumom posnetka, načrtovanim za maj
Maj 13, 2024
Binance sodeluje z Argentino za boj proti kibernetskemu kriminalu
Mnenje ŽELITE POSTATI PARTNER Prisotnost Novice Software Tehnologija
Binance sodeluje z Argentino za boj proti kibernetskemu kriminalu
Maj 13, 2024
CRYPTOMERIA LABS PTE. LTD.