Mô hình chuyển văn bản thành video Gen-2 có thể tạo các video ngắn bằng cách sử dụng lời nhắc văn bản
Tóm lại
Mô hình Text2Video Gen-2 mới từ RunWayML không chỉ có thể chỉnh sửa hiện có video mà còn tạo những cái mới từ đầu, chỉ bằng lời nhắc văn bản.
Tính năng này được kỳ vọng sẽ cải thiện cách mọi người tạo và chia sẻ nội dung trên nền tảng truyền thông xã hội, cho phép người dùng chuyển đổi ảnh tĩnh thành ảnh động và các video clip hấp dẫn mà không cần có kiến thức trước về chỉnh sửa video.
Mô hình chuyển văn bản thành video Gen-2 mới từ Runway không chỉ có thể chỉnh sửa các video hiện có mà còn có thể tạo các video mới từ đầu, chỉ sử dụng một dấu nhắc văn bản. Đây là một cải tiến đáng kể so với phiên bản Gen trước đó, vốn chỉ có thể chỉnh sửa các video hiện có. Mô hình chuyển văn bản thành video Gen-2 sử dụng công nghệ AI tiên tiến của Runway để tạo ra những video không thể phân biệt được với những video do con người tạo ra. Với tính năng mới này, người dùng có thể tiết kiệm thời gian và công sức bằng cách tạo video tự động mà không cần kỹ năng chỉnh sửa video chuyên sâu.
Mẫu Gen-2 mới cũng có thể biến một hình ảnh đã tải lên thành một đoạn phim ngắn này kẹp. Điều này được thực hiện bằng cách cung cấp một gợi ý văn bản mô tả người dùng muốn video như thế nào. Cho đến nay, thời lượng của các video không quá vài giây nhưng chất lượng đã cao hơn nhiều so với các đối thủ cạnh tranh (đặc biệt là khi các đối thủ cạnh tranh mạng thần kinh không có sẵn công khai). Tính năng này dự kiến sẽ cải thiện cách mọi người tạo và chia sẻ nội dung trên các nền tảng truyền thông xã hội. Với mẫu Gen-2, người dùng có thể dễ dàng chuyển đổi hình ảnh tĩnh của họ thành các video clip động. Rất có thể Facebook hoặc Tiktok sẽ sử dụng công nghệ này để mở rộng bộ công cụ AI có sẵn cho người tạo nội dung.
cuộc đua video AI diễn ra sôi nổi. Chỉ một tuần trôi qua kể từ khi ra mắt Gen-1 và Gen-2 đã ra mắt. Sự cạnh tranh giữa các công ty công nghệ để phát triển công nghệ video AI tiên tiến nhất đang gia tăng nhanh chóng, với mỗi công ty đều cố gắng vượt qua công ty kia.
Để dùng thử phiên bản mới của Gen, bạn sẽ phải đăng ký trong hàng đợi trên trang web đường băng.
- Runway, một công ty khởi nghiệp trí tuệ nhân tạo, công bố Gen-1, một mạng thần kinh có thể biến video cũ thành video mới bằng cách kết hợp lời nhắc và hình ảnh. Gen-1 cho phép các nhà làm phim nhanh chóng sản xuất nội dung theo cách tiết kiệm chi phí bằng cách áp dụng bố cục và phong cách của một lời nhắc hình ảnh hoặc văn bản đến cấu trúc của video nguồn. Runway Research chuyên xây dựng các hệ thống AI đa phương thức cho phép các hình thức sáng tạo mới và Gen-1 có thể được sử dụng để thử nghiệm tương lai của nghệ thuật kể chuyện.
- Tháng trước, Sam Altman, đồng sáng lập và CEO của OpenAI, gần đây đã nói chuyện với TechCrunch và nói rằng OpenAI đang phát triển một Mô hình AI cho video và GPT-4, sẽ được cung cấp cho công chúng sau khi công ty xác nhận độ tin cậy và bảo mật của nó.
- Vào tháng XNUMX, Google đã phát triển Imagen Video, một phương pháp tạo video có điều kiện bằng văn bản dựa trên một loạt video mô hình khuếch tán. Hệ thống chấp nhận mô tả bằng văn bản và tạo phim 16 khung hình ở tốc độ ba khung hình mỗi giây với độ phân giải 24 x 48 pixel. Hệ thống chia tỷ lệ và “dự đoán” các khung hình bổ sung, tạo ra video cuối cùng có 128 khung hình ở 24 khung hình mỗi giây và độ phân giải 720p (1280×768). Sáu mươi triệu cặp văn bản hình ảnh và 14 triệu cặp văn bản video đã được sử dụng để huấn luyện Imagen Video.
Đọc thêm bài viết liên quan:
Từ chối trách nhiệm
Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.
Giới thiệu về Tác giả
Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.
Xem thêm bài viếtDamir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.