Báo cáo tin tức Công nghệ
22 Tháng ba, 2023

Mô hình chuyển văn bản thành video Gen-2 có thể tạo các video ngắn bằng cách sử dụng lời nhắc văn bản

Tóm lại

Mô hình Text2Video Gen-2 mới từ RunWayML không chỉ có thể chỉnh sửa hiện có video mà còn tạo những cái mới từ đầu, chỉ bằng lời nhắc văn bản.

Tính năng này được kỳ vọng sẽ cải thiện cách mọi người tạo và chia sẻ nội dung trên nền tảng truyền thông xã hội, cho phép người dùng chuyển đổi ảnh tĩnh thành ảnh động và các video clip hấp dẫn mà không cần có kiến ​​thức trước về chỉnh sửa video.

Mô hình chuyển văn bản thành video Gen-2 mới từ Runway không chỉ có thể chỉnh sửa các video hiện có mà còn có thể tạo các video mới từ đầu, chỉ sử dụng một dấu nhắc văn bản. Đây là một cải tiến đáng kể so với phiên bản Gen trước đó, vốn chỉ có thể chỉnh sửa các video hiện có. Mô hình chuyển văn bản thành video Gen-2 sử dụng công nghệ AI tiên tiến của Runway để tạo ra những video không thể phân biệt được với những video do con người tạo ra. Với tính năng mới này, người dùng có thể tiết kiệm thời gian và công sức bằng cách tạo video tự động mà không cần kỹ năng chỉnh sửa video chuyên sâu.

Mô hình chuyển văn bản thành video Gen-2 có thể tạo các video ngắn bằng cách sử dụng lời nhắc văn bản

Mẫu Gen-2 mới cũng có thể biến một hình ảnh đã tải lên thành một đoạn phim ngắn này kẹp. Điều này được thực hiện bằng cách cung cấp một gợi ý văn bản mô tả người dùng muốn video như thế nào. Cho đến nay, thời lượng của các video không quá vài giây nhưng chất lượng đã cao hơn nhiều so với các đối thủ cạnh tranh (đặc biệt là khi các đối thủ cạnh tranh mạng thần kinh không có sẵn công khai). Tính năng này dự kiến ​​sẽ cải thiện cách mọi người tạo và chia sẻ nội dung trên các nền tảng truyền thông xã hội. Với mẫu Gen-2, người dùng có thể dễ dàng chuyển đổi hình ảnh tĩnh của họ thành các video clip động. Rất có thể Facebook hoặc Tiktok sẽ sử dụng công nghệ này để mở rộng bộ công cụ AI có sẵn cho người tạo nội dung.

cuộc đua video AI diễn ra sôi nổi. Chỉ một tuần trôi qua kể từ khi ra mắt Gen-1 và Gen-2 đã ra mắt. Sự cạnh tranh giữa các công ty công nghệ để phát triển công nghệ video AI tiên tiến nhất đang gia tăng nhanh chóng, với mỗi công ty đều cố gắng vượt qua công ty kia.

Để dùng thử phiên bản mới của Gen, bạn sẽ phải đăng ký trong hàng đợi trên trang web đường băng.

  • Runway, một công ty khởi nghiệp trí tuệ nhân tạo, công bố Gen-1, một mạng thần kinh có thể biến video cũ thành video mới bằng cách kết hợp lời nhắc và hình ảnh. Gen-1 cho phép các nhà làm phim nhanh chóng sản xuất nội dung theo cách tiết kiệm chi phí bằng cách áp dụng bố cục và phong cách của một lời nhắc hình ảnh hoặc văn bản đến cấu trúc của video nguồn. Runway Research chuyên xây dựng các hệ thống AI đa phương thức cho phép các hình thức sáng tạo mới và Gen-1 có thể được sử dụng để thử nghiệm tương lai của nghệ thuật kể chuyện.
  • Tháng trước, Sam Altman, đồng sáng lập và CEO của OpenAI, gần đây đã nói chuyện với TechCrunch và nói rằng OpenAI đang phát triển một Mô hình AI cho videoGPT-4, sẽ được cung cấp cho công chúng sau khi công ty xác nhận độ tin cậy và bảo mật của nó.
  • Vào tháng XNUMX, Google đã phát triển Imagen Video, một phương pháp tạo video có điều kiện bằng văn bản dựa trên một loạt video mô hình khuếch tán. Hệ thống chấp nhận mô tả bằng văn bản và tạo phim 16 khung hình ở tốc độ ba khung hình mỗi giây với độ phân giải 24 x 48 pixel. Hệ thống chia tỷ lệ và “dự đoán” các khung hình bổ sung, tạo ra video cuối cùng có 128 khung hình ở 24 khung hình mỗi giây và độ phân giải 720p (1280×768). Sáu mươi triệu cặp văn bản hình ảnh và 14 triệu cặp văn bản video đã được sử dụng để huấn luyện Imagen Video.

Đọc thêm bài viết liên quan:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Từ Ripple đến DAO xanh lớn: Các dự án tiền điện tử đóng góp cho hoạt động từ thiện như thế nào

Hãy cùng khám phá các sáng kiến ​​khai thác tiềm năng của tiền tệ kỹ thuật số cho mục đích từ thiện.

Biết thêm

AlphaFold 3, Med-Gemini và những người khác: Cách AI biến đổi hoạt động chăm sóc sức khỏe vào năm 2024

AI biểu hiện theo nhiều cách khác nhau trong chăm sóc sức khỏe, từ việc khám phá các mối tương quan di truyền mới đến hỗ trợ các hệ thống phẫu thuật bằng robot...

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Từ Ripple đến DAO xanh lớn: Các dự án tiền điện tử đóng góp cho hoạt động từ thiện như thế nào
nghiên cứu Tiền điện tử Wiki Kinh doanh Đào tạo Phong cách sống thị trường Phần mềm Công nghệ
Từ Ripple đến DAO xanh lớn: Các dự án tiền điện tử đóng góp cho hoạt động từ thiện như thế nào
13 Tháng Năm, 2024
AlphaFold 3, Med-Gemini và những người khác: Cách AI biến đổi hoạt động chăm sóc sức khỏe vào năm 2024
AI Wiki nghiên cứu Tiêu Ý kiến Kinh doanh thị trường Báo cáo tin tức Phần mềm Câu chuyện và đánh giá Công nghệ
AlphaFold 3, Med-Gemini và những người khác: Cách AI biến đổi hoạt động chăm sóc sức khỏe vào năm 2024
13 Tháng Năm, 2024
Mạng Nim sẽ triển khai Khung mã hóa quyền sở hữu AI và tiến hành bán lợi nhuận với ngày chụp nhanh được lên lịch vào tháng 5
thị trường Báo cáo tin tức Công nghệ
Mạng Nim sẽ triển khai Khung mã hóa quyền sở hữu AI và tiến hành bán lợi nhuận với ngày chụp nhanh được lên lịch vào tháng 5
13 Tháng Năm, 2024
Binance hợp tác với Argentina để chống tội phạm mạng
Ý kiến Kinh doanh thị trường Báo cáo tin tức Phần mềm Công nghệ
Binance hợp tác với Argentina để chống tội phạm mạng
13 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH