Báo cáo tin tức Công nghệ
08 Tháng hai, 2023

Gen-1: AI tạo video mới từ những video hiện có bằng cách kết hợp lời nhắc và hình ảnh

Tóm lại

Gen-1 là một mạng thần kinh có thể tạo video mới từ những video hiện có bằng cách kết hợp gợi ý và hình ảnh.

Nó cũng có thể được sử dụng để tạo các video hoàn toàn mới từ đầu.

Khả năng tạo video mới từ những video hiện có có một số ứng dụng tiềm năng.

RunWayML, một công ty khởi nghiệp trí tuệ nhân tạo, đã công bố một sản phẩm mới có tên Gen-1, một mạng thần kinh có thể tạo video mới từ những video hiện có bằng cách kết hợp lời nhắc và hình ảnh. Trong nhiều năm, các mạng nơ-ron đã bị giới hạn trong nhiệm vụ chuyển đổi phong cách, đó là quá trình chụp ảnh và áp dụng phong cách của một hình ảnh khác cho nó. Đây là cách chúng tôi có được những video chuyển giao theo phong cách học sâu nhanh chóng, chẳng hạn như một phong cảnh được hiển thị theo phong cách Đêm đầy sao của Van Gogh.

Gen-1: AI tạo video mới từ những video hiện có bằng cách kết hợp lời nhắc và hình ảnh
@Midjourney / Con ma kỳ lạ đó

Giờ đây, với Gen-1, mạng nơ-ron có thể làm được nhiều việc hơn là chỉ chuyển kiểu. Nó có thể tạo video mới từ đầu, sử dụng lời nhắc và hình ảnh làm đầu vào. Điều này mở ra một loạt các khả năng mới cho Video do AI tạo. Hiện tại, các video do Gen-1 tạo ra rất ngắn và đơn giản. Nhưng khi công nghệ phát triển, chúng ta có thể mong đợi thấy những điều phức tạp hơn và video thực tế được tạo bởi AI.

Bài viết được đề xuất: Sức khỏe sinh sản của nam giới được cải thiện nhờ xem video người lớn trong thực tế ảo

Gen-1 là gì?

Các công cụ chỉnh sửa và tạo ảnh mạnh mẽ được mở khóa bằng hướng dẫn bằng văn bản mô hình khuếch tán thế hệ. Mặc dù những điều này đã được áp dụng để tạo video, nhưng các phương pháp hiện tại để chỉnh sửa nội dung của tài liệu đã có sẵn trong khi vẫn duy trì cấu trúc của nó đòi hỏi phải đào tạo lại tốn kém cho mỗi đầu vào hoặc phụ thuộc vào sự lan truyền rủi ro của các thay đổi hình ảnh giữa các khung hình.

Các nhà phát triển mô tả một mô hình phổ biến video có hướng dẫn về cấu trúc và nội dung, giúp thay đổi phim dựa trên các mô tả bằng văn bản hoặc bằng hình ảnh về kết quả mong muốn. Do tách rời không đủ, xung đột giữa sửa đổi nội dung do người dùng cung cấp và biểu diễn cấu trúc phát sinh. Họ chứng minh rằng tính toàn vẹn của cấu trúc và nội dung có thể được kiểm soát bằng cách đào tạo về ước tính độ sâu bằng một mắt với các mức độ chi tiết khác nhau.

Tổng hợp các video mới theo cách thực tế và nhất quán bằng cách áp dụng bố cục và kiểu của một hình ảnh hoặc lời nhắc văn bản cho cấu trúc của video nguồn của bạn. Nó giống như quay một cái gì đó mới mà không thực sự quay bất cứ thứ gì.

Tổng hợp một video mới bằng phương pháp này cho phép các nhà làm phim nhanh chóng sản xuất nội dung theo cách tiết kiệm chi phí
Tổng hợp một video mới bằng phương pháp này cho phép các nhà làm phim nhanh chóng sản xuất nội dung theo cách tiết kiệm chi phí

Chuyển kiểu của hình ảnh hoặc lời nhắc sang mọi khung hình của video có thể là một cách tuyệt vời để thống nhất dự án của bạn, tạo cho dự án một chủ đề trực quan bao quát và tạo sự nhất quán.

Thông qua việc sử dụng phần mềm và thiết kế sáng tạo, các mô hình mô phỏng có thể được chuyển đổi thành các kết xuất tương tác và đẹp mắt về mặt thẩm mỹ, mang lại tầm nhìn của người dùng vào cuộc sống.

Mockup cho phép các nhà thiết kế trực quan hóa ý tưởng của họ và tạo ra các kết quả hữu hình có thể được trình bày để xem xét
Mockup cho phép các nhà thiết kế trực quan hóa ý tưởng của họ và tạo ra các kết quả hữu hình có thể được trình bày để xem xét

Với các tính năng chỉnh sửa video, thật dễ dàng để tách các phần của video và nâng cao chúng bằng lời nhắc văn bản.

Áp dụng một hình ảnh đầu vào hoặc nhanh chóng đối với các kết xuất không có kết cấu có thể cải thiện đáng kể tính chân thực của chúng, làm cho các mô hình 3D trở nên sống động.

Runway Research chuyên xây dựng các hệ thống AI đa phương thức cho phép các hình thức sáng tạo mới. Gen-1 đại diện cho một bước quan trọng khác của chúng tôi trong sứ mệnh này. Nếu bạn là người sáng tạo muốn thử nghiệm tương lai của nghệ thuật kể chuyện, hãy yêu cầu quyền truy cập bên dưới.

Gen-1 cũng có thể được sử dụng để tạo các video hoàn toàn mới từ đầu. Nó có thể được sử dụng cho một số mục đích, bao gồm tạo phiên bản mới của phim hiện có hoặc tạo phim mới hoàn toàn. Tin tức này chắc chắn sẽ kích thích các nhà làm phim và các nhà sáng tạo khác, những người luôn tìm kiếm những cách mới để vượt qua ranh giới nghệ thuật của họ. Với Gen-1, giờ đây họ có một công cụ mạnh mẽ mới để tùy ý sử dụng.

Khả năng tạo video mới từ những cái hiện có có một số ứng dụng tiềm năng. Ví dụ: nó có thể được sử dụng để tạo các phiên bản mới của nội dung video hiện có, do đó, nó có thể được sử dụng để tạo các phiên bản thay thế của cảnh hoặc cảnh quay có thể quá tốn kém hoặc khó quay phim về mặt hậu cần.

Bạn có thể đăng ký sử dụng mô hình khi nó đang ở giai đoạn thử nghiệm beta tại đây.

Đọc thêm về AI:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Cơn sốt DOGE: Phân tích sự gia tăng giá trị gần đây của Dogecoin (DOGE)

Ngành công nghiệp tiền điện tử đang mở rộng nhanh chóng và các đồng tiền meme đang chuẩn bị cho một bước phát triển đáng kể. Dogecoin (DOGE), ...

Biết thêm

Sự phát triển của nội dung do AI tạo ra trong Metaverse

Sự xuất hiện của nội dung AI tổng quát là một trong những sự phát triển hấp dẫn nhất trong môi trường ảo ...

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Ưu đãi hàng đầu trong tuần này, Các khoản đầu tư lớn vào AI, CNTT, Web3và Tiền điện tử (22-26.04)
Tiêu Kinh doanh thị trường Công nghệ
Ưu đãi hàng đầu trong tuần này, Các khoản đầu tư lớn vào AI, CNTT, Web3và Tiền điện tử (22-26.04)
26 Tháng Tư, 2024
Vitalik Buterin nhận xét về việc tập trung hóa PoW, lưu ý rằng đây chỉ là giai đoạn tạm thời cho đến khi PoS
Báo cáo tin tức Công nghệ
Vitalik Buterin nhận xét về việc tập trung hóa PoW, lưu ý rằng đây chỉ là giai đoạn tạm thời cho đến khi PoS
26 Tháng Tư, 2024
Phòng thí nghiệm Offchain tiết lộ phát hiện về hai lỗ hổng nghiêm trọng trong bằng chứng gian lận của OP Stack của Optimism
Báo cáo tin tức Phần mềm Công nghệ
Phòng thí nghiệm Offchain tiết lộ phát hiện về hai lỗ hổng nghiêm trọng trong bằng chứng gian lận của OP Stack của Optimism
26 Tháng Tư, 2024
Thị trường mở của Dymension để kết nối thanh khoản từ RollApps eIBC ra mắt trên Mainnet
Báo cáo tin tức Công nghệ
Thị trường mở của Dymension để kết nối thanh khoản từ RollApps eIBC ra mắt trên Mainnet 
26 Tháng Tư, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH