Báo cáo tin tức Công nghệ
08 Tháng hai, 2023

Gen-1: AI tạo video mới từ những video hiện có bằng cách kết hợp lời nhắc và hình ảnh

Tóm lại

Gen-1 là một mạng thần kinh có thể tạo video mới từ những video hiện có bằng cách kết hợp gợi ý và hình ảnh.

Nó cũng có thể được sử dụng để tạo các video hoàn toàn mới từ đầu.

Khả năng tạo video mới từ những video hiện có có một số ứng dụng tiềm năng.

RunWayML, một công ty khởi nghiệp trí tuệ nhân tạo, đã công bố một sản phẩm mới có tên Gen-1, một mạng thần kinh có thể tạo video mới từ những video hiện có bằng cách kết hợp lời nhắc và hình ảnh. Trong nhiều năm, các mạng nơ-ron đã bị giới hạn trong nhiệm vụ chuyển đổi phong cách, đó là quá trình chụp ảnh và áp dụng phong cách của một hình ảnh khác cho nó. Đây là cách chúng tôi có được những video chuyển giao theo phong cách học sâu nhanh chóng, chẳng hạn như một phong cảnh được hiển thị theo phong cách Đêm đầy sao của Van Gogh.

Gen-1: AI tạo video mới từ những video hiện có bằng cách kết hợp lời nhắc và hình ảnh
@Midjourney / Con ma kỳ lạ đó

Giờ đây, với Gen-1, mạng nơ-ron có thể làm được nhiều việc hơn là chỉ chuyển kiểu. Nó có thể tạo video mới từ đầu, sử dụng lời nhắc và hình ảnh làm đầu vào. Điều này mở ra một loạt các khả năng mới cho Video do AI tạo. Hiện tại, các video do Gen-1 tạo ra rất ngắn và đơn giản. Nhưng khi công nghệ phát triển, chúng ta có thể mong đợi thấy những điều phức tạp hơn và video thực tế được tạo bởi AI.

Bài viết được đề xuất: Sức khỏe sinh sản của nam giới được cải thiện nhờ xem video người lớn trong thực tế ảo

Gen-1 là gì?

Các công cụ chỉnh sửa và tạo ảnh mạnh mẽ được mở khóa bằng hướng dẫn bằng văn bản mô hình khuếch tán thế hệ. Mặc dù những điều này đã được áp dụng để tạo video, nhưng các phương pháp hiện tại để chỉnh sửa nội dung của tài liệu đã có sẵn trong khi vẫn duy trì cấu trúc của nó đòi hỏi phải đào tạo lại tốn kém cho mỗi đầu vào hoặc phụ thuộc vào sự lan truyền rủi ro của các thay đổi hình ảnh giữa các khung hình.

Các nhà phát triển mô tả một mô hình phổ biến video có hướng dẫn về cấu trúc và nội dung, giúp thay đổi phim dựa trên các mô tả bằng văn bản hoặc bằng hình ảnh về kết quả mong muốn. Do tách rời không đủ, xung đột giữa sửa đổi nội dung do người dùng cung cấp và biểu diễn cấu trúc phát sinh. Họ chứng minh rằng tính toàn vẹn của cấu trúc và nội dung có thể được kiểm soát bằng cách đào tạo về ước tính độ sâu bằng một mắt với các mức độ chi tiết khác nhau.

Tổng hợp các video mới theo cách thực tế và nhất quán bằng cách áp dụng bố cục và kiểu của một hình ảnh hoặc lời nhắc văn bản cho cấu trúc của video nguồn của bạn. Nó giống như quay một cái gì đó mới mà không thực sự quay bất cứ thứ gì.

Tổng hợp một video mới bằng phương pháp này cho phép các nhà làm phim nhanh chóng sản xuất nội dung theo cách tiết kiệm chi phí
Tổng hợp một video mới bằng phương pháp này cho phép các nhà làm phim nhanh chóng sản xuất nội dung theo cách tiết kiệm chi phí

Chuyển kiểu của hình ảnh hoặc lời nhắc sang mọi khung hình của video có thể là một cách tuyệt vời để thống nhất dự án của bạn, tạo cho dự án một chủ đề trực quan bao quát và tạo sự nhất quán.

Thông qua việc sử dụng phần mềm và thiết kế sáng tạo, các mô hình mô phỏng có thể được chuyển đổi thành các kết xuất tương tác và đẹp mắt về mặt thẩm mỹ, mang lại tầm nhìn của người dùng vào cuộc sống.

Mockup cho phép các nhà thiết kế trực quan hóa ý tưởng của họ và tạo ra các kết quả hữu hình có thể được trình bày để xem xét
Mockup cho phép các nhà thiết kế trực quan hóa ý tưởng của họ và tạo ra các kết quả hữu hình có thể được trình bày để xem xét

Với các tính năng chỉnh sửa video, thật dễ dàng để tách các phần của video và nâng cao chúng bằng lời nhắc văn bản.

Áp dụng một hình ảnh đầu vào hoặc nhanh chóng đối với các kết xuất không có kết cấu có thể cải thiện đáng kể tính chân thực của chúng, làm cho các mô hình 3D trở nên sống động.

Runway Research chuyên xây dựng các hệ thống AI đa phương thức cho phép các hình thức sáng tạo mới. Gen-1 đại diện cho một bước quan trọng khác của chúng tôi trong sứ mệnh này. Nếu bạn là người sáng tạo muốn thử nghiệm tương lai của nghệ thuật kể chuyện, hãy yêu cầu quyền truy cập bên dưới.

Gen-1 cũng có thể được sử dụng để tạo các video hoàn toàn mới từ đầu. Nó có thể được sử dụng cho một số mục đích, bao gồm tạo phiên bản mới của phim hiện có hoặc tạo phim mới hoàn toàn. Tin tức này chắc chắn sẽ kích thích các nhà làm phim và các nhà sáng tạo khác, những người luôn tìm kiếm những cách mới để vượt qua ranh giới nghệ thuật của họ. Với Gen-1, giờ đây họ có một công cụ mạnh mẽ mới để tùy ý sử dụng.

Khả năng tạo video mới từ những cái hiện có có một số ứng dụng tiềm năng. Ví dụ: nó có thể được sử dụng để tạo các phiên bản mới của nội dung video hiện có, do đó, nó có thể được sử dụng để tạo các phiên bản thay thế của cảnh hoặc cảnh quay có thể quá tốn kém hoặc khó quay phim về mặt hậu cần.

Bạn có thể đăng ký sử dụng mô hình khi nó đang ở giai đoạn thử nghiệm beta tại đây.

Đọc thêm về AI:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Từ Ripple đến DAO xanh lớn: Các dự án tiền điện tử đóng góp cho hoạt động từ thiện như thế nào

Hãy cùng khám phá các sáng kiến ​​khai thác tiềm năng của tiền tệ kỹ thuật số cho mục đích từ thiện.

Biết thêm

AlphaFold 3, Med-Gemini và những người khác: Cách AI biến đổi hoạt động chăm sóc sức khỏe vào năm 2024

AI biểu hiện theo nhiều cách khác nhau trong chăm sóc sức khỏe, từ việc khám phá các mối tương quan di truyền mới đến hỗ trợ các hệ thống phẫu thuật bằng robot...

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Từ Ripple đến DAO xanh lớn: Các dự án tiền điện tử đóng góp cho hoạt động từ thiện như thế nào
nghiên cứu Tiền điện tử Wiki Kinh doanh Đào tạo Phong cách sống thị trường Phần mềm Công nghệ
Từ Ripple đến DAO xanh lớn: Các dự án tiền điện tử đóng góp cho hoạt động từ thiện như thế nào
13 Tháng Năm, 2024
AlphaFold 3, Med-Gemini và những người khác: Cách AI biến đổi hoạt động chăm sóc sức khỏe vào năm 2024
AI Wiki nghiên cứu Tiêu Ý kiến Kinh doanh thị trường Báo cáo tin tức Phần mềm Câu chuyện và đánh giá Công nghệ
AlphaFold 3, Med-Gemini và những người khác: Cách AI biến đổi hoạt động chăm sóc sức khỏe vào năm 2024
13 Tháng Năm, 2024
Mạng Nim sẽ triển khai Khung mã hóa quyền sở hữu AI và tiến hành bán lợi nhuận với ngày chụp nhanh được lên lịch vào tháng 5
thị trường Báo cáo tin tức Công nghệ
Mạng Nim sẽ triển khai Khung mã hóa quyền sở hữu AI và tiến hành bán lợi nhuận với ngày chụp nhanh được lên lịch vào tháng 5
13 Tháng Năm, 2024
Binance hợp tác với Argentina để chống tội phạm mạng
Ý kiến Kinh doanh thị trường Báo cáo tin tức Phần mềm Công nghệ
Binance hợp tác với Argentina để chống tội phạm mạng
13 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH