Raport aktualności Technologia
25 września 2023 r.

OpenAI'S ChatGPT Przedstawia dużą aktualizację, dodaje konwersacje głosowe i czat obrazowy

W skrócie

OpenAI wprowadzi nowe możliwości w zakresie głosu i obrazu ChatGPT w ciągu najbliższych dwóch tygodni.

Funkcje te będą dostępne tylko dla użytkowników Plus i Enterprise.

OpenAI'S ChatGPT Przedstawia dużą aktualizację, dodaje konwersacje głosowe i czat obrazowy

OpenAI ogłosiła dzisiaj, że wdroży w firmie nowe funkcje związane z głosem i obrazem ChatGPT. Nowe funkcje umożliwią użytkownikom prowadzenie rozmowy głosowej ChatGPT lub rozmawiaj z chatbotem za pomocą obrazów.

Ogłoszenie jest następstwem roszczeń użytkowników Reddita, którzy twierdzili, że uzyskali dostęp do OpenAImodelek, a następnie udostępnił te informacje na platformie. Redditor FeltSteam opisał model sztucznej inteligencji o roboczej nazwie Arrakis, który podobno umożliwia użytkownikom „wprowadzanie dowolnej kombinacji tekstu, dźwięku i wideo”.

„Nowe możliwości głosowe są obsługiwane przez nowy model zamiany tekstu na mowę, który jest w stanie wygenerować dźwięk przypominający ludzki na podstawie samego tekstu i kilku sekund próbki mowy” – napisała Open AI w oświadczeniu. blogu. „Przy tworzeniu każdego z głosów współpracowaliśmy z profesjonalnymi aktorami głosowymi. Używamy również Whisper, naszego systemu rozpoznawania mowy o otwartym kodzie źródłowym, do transkrypcji wypowiadanych słów na tekst”.

Dzięki nowym funkcjom użytkownicy mogą prowadzić konwersację z innymi osobami ChatGPT używając swoich głosów. Mogą także rozmawiać o obrazach z chatbotem. Funkcje zostaną udostępnione użytkownikom Plus i Enterprise w ciągu najbliższych dwóch tygodni.

Funkcja głosowa będzie dostępna na iOS i Androidzie w ramach opcji opcjonalnej, a funkcja obrazu będzie dostępna na wszystkich platformach.

Aby rozpocząć korzystanie z funkcji głosowej, użytkownicy mogą przejść do Ustawień → Nowe funkcje w aplikacji mobilnej i wybrać „rozmowy głosowe”. Następnie użytkownik powinien dotknąć przycisku słuchawek znajdującego się w prawym górnym rogu ekranu głównego i wybrać preferowany głos spośród pięciu różnych głosów.

Aby porozmawiać ChatGPT przeglądając obrazy, użytkownik może dotknąć przycisku zdjęcia, aby zrobić zdjęcie lub wybrać jedno. Jeśli używasz systemu iOS lub Android, przed kontynuowaniem dotknij przycisku plus. Dodatkowo mogą prowadzić dyskusje z wieloma obrazami lub wykorzystywać je do kierowania chatbotem.

OpenAI twierdzi, że rozumienie obrazu opiera się na multimodalności GPT-3.5 i GPT-4. Modele te wykorzystują zdolności rozumowania językowego do analizowania różnorodnych treści wizualnych, obejmujących zdjęcia, zrzuty ekranu i dokumenty zawierające kombinację tekstu i obrazów.

OpenAIwspółpracy ze Spotify

Spotify też poinformowała papierów wartościowych funkcję tłumaczenia głosu opartą na sztucznej inteligencji. Nowa funkcja umożliwia tłumaczenie podcastów na różne języki, wykorzystując oryginalny głos nadawcy.

Zgodnie z Poboczy, na których opiera się ta funkcja tłumaczenia OpenAInarzędzie do transkrypcji głosu, Whisper, które umożliwia transkrypcję mowy angielskiej i tłumaczenie różnych języków na angielski.

W ramach pilotażu firma nawiązała współpracę z twórcami podcastów Daxem Shepardem, Moniką Padman, Lexem Fridmanem, Billem Simmonsem i Stevenem Bartlettem, aby stworzyć tłumaczenia głosowe oparte na sztucznej inteligencji na języki takie jak hiszpański, francuski i niemiecki dla określonych odcinków katalogu i nadchodzących wydania.

„Wierzymy, że przemyślane podejście do sztucznej inteligencji może pomóc w budowaniu głębszych więzi między słuchaczami a twórcami, co jest kluczowym elementem misji Spotify polegającej na uwalnianiu potencjału ludzkiej kreatywności” – powiedział w oświadczeniu Ziad Sultan, wiceprezes ds. personalizacji w Spotify.

Przetłumaczone głosowo odcinki twórców pilotażowych będą dostępne na całym świecie dla użytkowników Premium i Free.

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.

Więcej artykułów
CindyTan
CindyTan

Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wiadomości

Od Ripple do Big Green DAO: jak projekty kryptowalutowe przyczyniają się do działalności charytatywnej

Przyjrzyjmy się inicjatywom wykorzystującym potencjał walut cyfrowych na cele charytatywne.

Dowiedz się więcej

AlphaFold 3, Med-Gemini i inne: sposób, w jaki sztuczna inteligencja zmieni opiekę zdrowotną w 2024 r.

Sztuczna inteligencja objawia się na różne sposoby w opiece zdrowotnej, od odkrywania nowych korelacji genetycznych po wzmacnianie zrobotyzowanych systemów chirurgicznych…

Dowiedz się więcej
Czytaj więcej
Czytaj więcej
zkPass i MYX Finance uruchamiają kampanię „Devotion Era” z nagrodami MYX, ZKP, USDC i iPhone 16 Pro Max
Raport aktualności Technologia
zkPass i MYX Finance uruchamiają kampanię „Devotion Era” z nagrodami MYX, ZKP, USDC i iPhone 16 Pro Max
2 grudnia 2024 r.
Dlaczego sztuczna inteligencja w opiece zdrowotnej potrzebuje spójnego podejścia regulacyjnego, aby pokonać przeszkody prawne i etyczne w USA
Opinia Styl życia rynki Tworzenie Technologia
Dlaczego sztuczna inteligencja w opiece zdrowotnej potrzebuje spójnego podejścia regulacyjnego, aby pokonać przeszkody prawne i etyczne w USA
2 grudnia 2024 r.
Podziały w dostępie do Internetu na obszarach wiejskich i miejskich uwypuklają globalną lukę cyfrową
Opinia Styl życia rynki Tworzenie Technologia
Podziały w dostępie do Internetu na obszarach wiejskich i miejskich uwypuklają globalną lukę cyfrową
2 grudnia 2024 r.
Polkadot Blockchain Academy otwiera zapisy na kurs dla zaawansowanych programistów w kampusie w Szwajcarii
Edukacja Raport aktualności Technologia
Polkadot Blockchain Academy otwiera zapisy na kurs dla zaawansowanych programistów w kampusie w Szwajcarii
2 grudnia 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.