Model Text-to-Video Gen-2 może generować krótkie filmy za pomocą monitów tekstowych
W skrócie
Nowy model Text2Video Gen-2 firmy RunWayML umożliwia nie tylko edycję istniejących filmy ale także generuj nowe od zera, używając jedynie podpowiedzi tekstowej.
Oczekuje się, że ta funkcja usprawni sposób, w jaki ludzie tworzą i udostępniają treści na platformach mediów społecznościowych, umożliwiając użytkownikom transformację obrazy statyczne w dynamiczne i wciągające klipy wideo bez wcześniejszej wiedzy na temat edycji wideo.
Nowy model zamiany tekstu na wideo Gen-2 firmy Runway może nie tylko edytować istniejące filmy, ale także generować nowe od podstaw, używając tylko monitu tekstowego. Jest to znacząca poprawa w stosunku do poprzedniej wersji Gen, która mogła edytować tylko istniejące filmy. Model zamiany tekstu na wideo Gen-2 wykorzystuje najnowocześniejszą technologię sztucznej inteligencji firmy Runway do tworzenia filmów, które są nie do odróżnienia od tych tworzonych przez ludzi. Dzięki tej nowej funkcji użytkownicy mogą zaoszczędzić czas i wysiłek, automatycznie generując filmy bez potrzeby posiadania rozległych umiejętności w zakresie edycji wideo.
Nowy model Gen-2 może również zamienić przesłany obraz w plik krótki film spinacz. Odbywa się to poprzez podanie podpowiedzi tekstowej opisującej, jakie wideo ma być dla użytkownika. Jak dotąd czas trwania filmów nie przekracza kilku sekund, ale jakość jest już znacznie wyższa niż u konkurencji (zwłaszcza, że konkurenci sieci neuronowe nie są publicznie dostępne). Oczekuje się, że ta funkcja poprawi sposób, w jaki ludzie tworzą i udostępniają treści na platformach społecznościowych. Dzięki modelowi Gen-2 użytkownicy mogą łatwo przekształcać swoje statyczne obrazy w dynamiczne klipy wideo. Jest duża szansa, że Facebook czy Tiktok wykorzystają tę technologię do poszerzenia zestawu narzędzi AI dostępnych dla twórców treści.
wyścig wideo AI jest dziki. Od premiery Gen-1 minął zaledwie tydzień, a Gen-2 jest już na rynku. Konkurencja między firmami technologicznymi w rozwijaniu najbardziej zaawansowanej technologii wideo AI szybko rośnie, a każda firma stara się prześcignąć drugą.
Aby wypróbować nową wersję Gen, będziesz musiał zarejestrować się w kolejce na stronie Witryna pasa startowego.
- Runway, startup zajmujący się sztuczną inteligencją, ogłoszono Gen-1, sieć neuronowa, która może zamieniać stare filmy w nowe, łącząc podpowiedzi i obrazy. Gen-1 umożliwia filmowcom szybkie tworzenie treści w opłacalny sposób, stosując kompozycję i styl filmu monit obrazkowy lub tekstowy do struktury źródłowego wideo. Runway Research zajmuje się budowaniem multimodalnych systemów sztucznej inteligencji, które umożliwiają nowe formy kreatywności, a Gen-1 może służyć do eksperymentowania z przyszłością opowiadania historii.
- W zeszłym miesiącu Sam Altman, współzałożyciel i dyrektor generalny firmy OpenAI, niedawno rozmawiał z TechCrunch i powiedział to OpenAI rozwija się i Model AI dla filmów i GPT-4, który zostanie udostępniony publicznie po potwierdzeniu przez firmę swojej wiarygodności i bezpieczeństwa.
- W październiku firma Google opracowała Imagen Video, metodę tworzenia filmów warunkowych tekstowych na podstawie serii filmów modele dyfuzyjne. System akceptuje opis tekstowy i generuje 16-klatkowy film z szybkością trzech klatek na sekundę w rozdzielczości 24 na 48 pikseli. System skaluje i „przewiduje” dodatkowe klatki, tworząc ostateczny film zawierający 128 klatek przy 24 klatkach na sekundę i rozdzielczości 720p (1280×768). Do szkolenia Imagen Video wykorzystano 14 milionów par obraz-tekst i XNUMX milionów par wideo-tekst.
Przeczytaj więcej powiązanych artykułów:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.