Báo cáo tin tức Công nghệ
Tháng Mười Một 15, 2022

AI của Google cho phép di chuyển không giới hạn trên các phong cảnh chỉ bằng một hình ảnh

Tóm lại

Nghiên cứu của Google cho thấy cách tạo video 3D bằng một hình ảnh duy nhất – video

AI có thể xây dựng môi trường 3D toàn diện, sống động như thật và nhất quán

Một dự án mới của Google đã chứng minh rằng một hình ảnh duy nhất có thể được sử dụng để tạo video do AI tạo di chuyển qua phong cảnh theo kiểu chân thực. Nghiên cứu này dựa trên một phương pháp gọi là “tổng hợp chế độ xem”, lấy cảm hứng từ hiệu ứng hình ảnh của loài chim. Kỹ thuật này sử dụng một mạng thần kinh để phân tích một hình ảnh và trích xuất thông tin độ sâu từ nó.

AI của Google cho phép di chuyển không giới hạn trên các phong cảnh chỉ bằng một hình ảnh
Hình ảnh được tạo bởi Midjourney AI

Điều này cho phép thuật toán tạo ra các chế độ xem mới của cảnh như thể máy ảnh được di chuyển đến các vị trí khác nhau. Kết quả là một video thực tế cho thấy đối tượng hoặc người di chuyển qua phong cảnh.

“Công nghệ này có thể tạo ra quỹ đạo camera dài hơn nhiều so với các hệ thống tổng hợp video trước đó và cho phép người dùng điều khiển camera một cách tương tác. Nghiên cứu của chúng tôi đề xuất các thuật toán tiềm năng để tạo môi trường 3D toàn diện, sống động như thật và nhất quán.”

Công việc này có rất nhiều hướng đi tiềm năng hấp dẫn trong tương lai. Chẳng hạn, hiện tại không có biểu diễn 3D cơ bản liên tục và các phương pháp tiếp cận của chúng tôi chỉ tổng hợp nội dung cảnh tùy thuộc vào khung trước đó và bản đồ độ sâu của khung. Nghiên cứu này gợi ý về sự phát triển của các thuật toán có thể tạo ra môi trường 3D toàn diện, sống động như thật và nhất quán.

Các ứng dụng tiềm năng của công nghệ này là vô hạn. Ví dụ: nó có thể được sử dụng để tạo các video xác định vị trí thực tế cho các bộ phim hoặc chương trình truyền hình. Nó cũng có thể được sử dụng để tạo trải nghiệm VR thực tế. Bằng cách sử dụng tất cả các nhịp và hình ảnh đó làm dữ liệu đào tạo, AI đang xây dựng vũ trụ này.

Đọc thêm các bài viết khác:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Morph giới thiệu mạng thử nghiệm Holesky với tích hợp zkEVM lạc quan, cơ chế cầu nối và các tính năng của mạng tuần tự phi tập trung
Báo cáo tin tức Công nghệ
Morph giới thiệu mạng thử nghiệm Holesky với tích hợp zkEVM lạc quan, cơ chế cầu nối và các tính năng của mạng tuần tự phi tập trung
6 Tháng Năm, 2024
Robinhood Crypto nhận được thông báo của Wells từ Ủy ban Chứng khoán và Giao dịch về các cáo buộc vi phạm chứng khoán
thị trường Báo cáo tin tức Công nghệ
Robinhood Crypto nhận được thông báo của Wells từ Ủy ban Chứng khoán và Giao dịch về các cáo buộc vi phạm chứng khoán
6 Tháng Năm, 2024
QuickSwap triển khai trên Mainnet lớp X và mở rộng mạng CDK đa giác khi ra mắt Citadel
Báo cáo tin tức Công nghệ
QuickSwap triển khai trên Mainnet lớp X và mở rộng mạng CDK đa giác khi ra mắt Citadel 
6 Tháng Năm, 2024
Mạng lớp 2 Linea bắt đầu yêu cầu mã thông báo ZERO của ZeroLend cho Airdrop Người dùng và Nhà đầu tư
thị trường Báo cáo tin tức Công nghệ
Mạng lớp 2 Linea bắt đầu yêu cầu mã thông báo ZERO của ZeroLend cho Airdrop Người dùng và Nhà đầu tư
6 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH