Raport aktualności Technologia
22 marca 2023 r.

Model Text-to-Video Gen-2 może generować krótkie filmy za pomocą monitów tekstowych

W skrócie

Nowy model Text2Video Gen-2 firmy RunWayML umożliwia nie tylko edycję istniejących filmy ale także generuj nowe od zera, używając jedynie podpowiedzi tekstowej.

Oczekuje się, że ta funkcja usprawni sposób, w jaki ludzie tworzą i udostępniają treści na platformach mediów społecznościowych, umożliwiając użytkownikom transformację obrazy statyczne w dynamiczne i wciągające klipy wideo bez wcześniejszej wiedzy na temat edycji wideo.

Nowy model zamiany tekstu na wideo Gen-2 firmy Runway może nie tylko edytować istniejące filmy, ale także generować nowe od podstaw, używając tylko monitu tekstowego. Jest to znacząca poprawa w stosunku do poprzedniej wersji Gen, która mogła edytować tylko istniejące filmy. Model zamiany tekstu na wideo Gen-2 wykorzystuje najnowocześniejszą technologię sztucznej inteligencji firmy Runway do tworzenia filmów, które są nie do odróżnienia od tych tworzonych przez ludzi. Dzięki tej nowej funkcji użytkownicy mogą zaoszczędzić czas i wysiłek, automatycznie generując filmy bez potrzeby posiadania rozległych umiejętności w zakresie edycji wideo.

Model Text-to-Video Gen-2 może generować krótkie filmy za pomocą monitów tekstowych

Nowy model Gen-2 może również zamienić przesłany obraz w plik krótki film spinacz. Odbywa się to poprzez podanie podpowiedzi tekstowej opisującej, jakie wideo ma być dla użytkownika. Jak dotąd czas trwania filmów nie przekracza kilku sekund, ale jakość jest już znacznie wyższa niż u konkurencji (zwłaszcza, że ​​konkurenci sieci neuronowe nie są publicznie dostępne). Oczekuje się, że ta funkcja poprawi sposób, w jaki ludzie tworzą i udostępniają treści na platformach społecznościowych. Dzięki modelowi Gen-2 użytkownicy mogą łatwo przekształcać swoje statyczne obrazy w dynamiczne klipy wideo. Jest duża szansa, że ​​Facebook czy Tiktok wykorzystają tę technologię do poszerzenia zestawu narzędzi AI dostępnych dla twórców treści.

wyścig wideo AI jest dziki. Od premiery Gen-1 minął zaledwie tydzień, a Gen-2 jest już na rynku. Konkurencja między firmami technologicznymi w rozwijaniu najbardziej zaawansowanej technologii wideo AI szybko rośnie, a każda firma stara się prześcignąć drugą.

Aby wypróbować nową wersję Gen, będziesz musiał zarejestrować się w kolejce na stronie Witryna pasa startowego.

  • Runway, startup zajmujący się sztuczną inteligencją, ogłoszono Gen-1, sieć neuronowa, która może zamieniać stare filmy w nowe, łącząc podpowiedzi i obrazy. Gen-1 umożliwia filmowcom szybkie tworzenie treści w opłacalny sposób, stosując kompozycję i styl filmu monit obrazkowy lub tekstowy do struktury źródłowego wideo. Runway Research zajmuje się budowaniem multimodalnych systemów sztucznej inteligencji, które umożliwiają nowe formy kreatywności, a Gen-1 może służyć do eksperymentowania z przyszłością opowiadania historii.
  • W zeszłym miesiącu Sam Altman, współzałożyciel i dyrektor generalny firmy OpenAI, niedawno rozmawiał z TechCrunch i powiedział to OpenAI rozwija się i Model AI dla filmów i GPT-4, który zostanie udostępniony publicznie po potwierdzeniu przez firmę swojej wiarygodności i bezpieczeństwa.
  • W październiku firma Google opracowała Imagen Video, metodę tworzenia filmów warunkowych tekstowych na podstawie serii filmów modele dyfuzyjne. System akceptuje opis tekstowy i generuje 16-klatkowy film z szybkością trzech klatek na sekundę w rozdzielczości 24 na 48 pikseli. System skaluje i „przewiduje” dodatkowe klatki, tworząc ostateczny film zawierający 128 klatek przy 24 klatkach na sekundę i rozdzielczości 720p (1280×768). Do szkolenia Imagen Video wykorzystano 14 milionów par obraz-tekst i XNUMX milionów par wideo-tekst.

Przeczytaj więcej powiązanych artykułów:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Od Ripple do Big Green DAO: jak projekty kryptowalutowe przyczyniają się do działalności charytatywnej

Przyjrzyjmy się inicjatywom wykorzystującym potencjał walut cyfrowych na cele charytatywne.

Dowiedz się więcej

AlphaFold 3, Med-Gemini i inne: sposób, w jaki sztuczna inteligencja zmieni opiekę zdrowotną w 2024 r.

Sztuczna inteligencja objawia się na różne sposoby w opiece zdrowotnej, od odkrywania nowych korelacji genetycznych po wzmacnianie zrobotyzowanych systemów chirurgicznych…

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Od Ripple do Big Green DAO: jak projekty kryptowalutowe przyczyniają się do działalności charytatywnej
Analiza krypto Wiki Biznes Edukacja Styl życia rynki Tworzenie Technologia
Od Ripple do Big Green DAO: jak projekty kryptowalutowe przyczyniają się do działalności charytatywnej
13 maja 2024 r.
AlphaFold 3, Med-Gemini i inne: sposób, w jaki sztuczna inteligencja zmieni opiekę zdrowotną w 2024 r.
AI Wiki Analiza Digest Opinia Biznes rynki Raport aktualności Tworzenie Historie i recenzje Technologia
AlphaFold 3, Med-Gemini i inne: sposób, w jaki sztuczna inteligencja zmieni opiekę zdrowotną w 2024 r.
13 maja 2024 r.
Sieć Nim wdroży ramy tokenizacji własności AI i przeprowadzi sprzedaż zysków z datą migawki zaplanowaną na maj
rynki Raport aktualności Technologia
Sieć Nim wdroży ramy tokenizacji własności AI i przeprowadzi sprzedaż zysków z datą migawki zaplanowaną na maj
13 maja 2024 r.
Binance współpracuje z Argentyną w walce z cyberprzestępczością
Opinia Biznes rynki Raport aktualności Tworzenie Technologia
Binance współpracuje z Argentyną w walce z cyberprzestępczością
13 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.