OpenAI'S ChatGPT Przedstawia dużą aktualizację, dodaje konwersacje głosowe i czat obrazowy
W skrócie
OpenAI wprowadzi nowe możliwości w zakresie głosu i obrazu ChatGPT w ciągu najbliższych dwóch tygodni.
Funkcje te będą dostępne tylko dla użytkowników Plus i Enterprise.
OpenAI ogłosiła dzisiaj, że wdroży w firmie nowe funkcje związane z głosem i obrazem ChatGPT. Nowe funkcje umożliwią użytkownikom prowadzenie rozmowy głosowej ChatGPT lub rozmawiaj z chatbotem za pomocą obrazów.
Ogłoszenie jest następstwem roszczeń użytkowników Reddita, którzy twierdzili, że uzyskali dostęp do OpenAImodelek, a następnie udostępnił te informacje na platformie. Redditor FeltSteam opisał model sztucznej inteligencji o roboczej nazwie Arrakis, który podobno umożliwia użytkownikom „wprowadzanie dowolnej kombinacji tekstu, dźwięku i wideo”.
„Nowe możliwości głosowe są obsługiwane przez nowy model zamiany tekstu na mowę, który jest w stanie wygenerować dźwięk przypominający ludzki na podstawie samego tekstu i kilku sekund próbki mowy” – napisała Open AI w oświadczeniu. blogu. „Przy tworzeniu każdego z głosów współpracowaliśmy z profesjonalnymi aktorami głosowymi. Używamy również Whisper, naszego systemu rozpoznawania mowy o otwartym kodzie źródłowym, do transkrypcji wypowiadanych słów na tekst”.
Na Reddicie znalazłem kilka dziwnych, niepotwierdzonych spekulacji na temat potężnych modeli wewnętrznych.
— Yam Peleg (@Yampeleg) 25 września 2023 r.
– Proszę wszystko traktować z przymrużeniem oka. –
Najwyraźniej,
Dwóch różnych użytkowników twierdzi, że uzyskało do nich dostęp OpenAImodele wewnętrzne firmy i udostępniają informacje na Reddicie.
FeltSteam… pic.twitter.com/JRJH4xADZX
Dzięki nowym funkcjom użytkownicy mogą prowadzić konwersację z innymi osobami ChatGPT używając swoich głosów. Mogą także rozmawiać o obrazach z chatbotem. Funkcje zostaną udostępnione użytkownikom Plus i Enterprise w ciągu najbliższych dwóch tygodni.
Funkcja głosowa będzie dostępna na iOS i Androidzie w ramach opcji opcjonalnej, a funkcja obrazu będzie dostępna na wszystkich platformach.
Aby rozpocząć korzystanie z funkcji głosowej, użytkownicy mogą przejść do Ustawień → Nowe funkcje w aplikacji mobilnej i wybrać „rozmowy głosowe”. Następnie użytkownik powinien dotknąć przycisku słuchawek znajdującego się w prawym górnym rogu ekranu głównego i wybrać preferowany głos spośród pięciu różnych głosów.
Aby porozmawiać ChatGPT przeglądając obrazy, użytkownik może dotknąć przycisku zdjęcia, aby zrobić zdjęcie lub wybrać jedno. Jeśli używasz systemu iOS lub Android, przed kontynuowaniem dotknij przycisku plus. Dodatkowo mogą prowadzić dyskusje z wieloma obrazami lub wykorzystywać je do kierowania chatbotem.
OpenAI twierdzi, że rozumienie obrazu opiera się na multimodalności GPT-3.5 i GPT-4. Modele te wykorzystują zdolności rozumowania językowego do analizowania różnorodnych treści wizualnych, obejmujących zdjęcia, zrzuty ekranu i dokumenty zawierające kombinację tekstu i obrazów.
OpenAIwspółpracy ze Spotify
Spotify też poinformowała papierów wartościowych funkcję tłumaczenia głosu opartą na sztucznej inteligencji. Nowa funkcja umożliwia tłumaczenie podcastów na różne języki, wykorzystując oryginalny głos nadawcy.
Zgodnie z Poboczy, na których opiera się ta funkcja tłumaczenia OpenAInarzędzie do transkrypcji głosu, Whisper, które umożliwia transkrypcję mowy angielskiej i tłumaczenie różnych języków na angielski.
W ramach pilotażu firma nawiązała współpracę z twórcami podcastów Daxem Shepardem, Moniką Padman, Lexem Fridmanem, Billem Simmonsem i Stevenem Bartlettem, aby stworzyć tłumaczenia głosowe oparte na sztucznej inteligencji na języki takie jak hiszpański, francuski i niemiecki dla określonych odcinków katalogu i nadchodzących wydania.
„Wierzymy, że przemyślane podejście do sztucznej inteligencji może pomóc w budowaniu głębszych więzi między słuchaczami a twórcami, co jest kluczowym elementem misji Spotify polegającej na uwalnianiu potencjału ludzkiej kreatywności” – powiedział w oświadczeniu Ziad Sultan, wiceprezes ds. personalizacji w Spotify.
Przetłumaczone głosowo odcinki twórców pilotażowych będą dostępne na całym świecie dla użytkowników Premium i Free.
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.
Więcej artykułówCindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.