Báo cáo tin tức Công nghệ
18 Tháng một, 2023

Microsoft đã phát hành một mô hình khuếch tán có thể tạo hình đại diện 3D từ một bức ảnh duy nhất của một người

Tóm lại

Một hình ảnh 2D duy nhất về khuôn mặt của một người có thể được sử dụng để tạo hình đại diện 3D bằng kỹ thuật máy học Khuếch tán hình đại diện 3D.

Nó có thể được sử dụng để cung cấp chế độ xem 3D thực tế của một người để chơi trò chơi hoặc các mục đích sử dụng khác hoặc để cung cấp trải nghiệm thực tế ảo (VR) hoặc thực tế tăng cường (AR).

Khuếch tán hình đại diện 3D là một thuật toán máy học có thể lấy một hình ảnh 2D duy nhất của khuôn mặt người và tạo hình đại diện ba chiều (3D). Sau đó, hình đại diện có thể được sử dụng để tạo trải nghiệm thực tế ảo (VR) hoặc thực tế tăng cường (AR) hoặc chỉ đơn giản là cung cấp chế độ xem 3D thực tế của người đó để chơi trò chơi hoặc các mục đích khác.

Mô hình khuếch tán là phát triển bởi một nhóm các nhà nghiên cứu tại Microsoft Research và được mô tả trong một bài báo đăng trên tạp chí arXiv.

Microsoft đã phát hành một mô hình khuếch tán có thể tạo hình đại diện 3D từ một bức ảnh duy nhất của một người

Khuếch tán Hình đại diện 3D dựa trên một loại thuật toán máy học được gọi là mô hình khuếch tán. Các mô hình khuếch tán là các mô hình tổng quát, có nghĩa là chúng có thể tạo dữ liệu mới tương tự như dữ liệu huấn luyện. mô hình khuếch tán đã được sử dụng trước đây để tạo hình ảnh 3D từ hình ảnh 2D, nhưng ADM là mô hình khuếch tán đầu tiên có thể tạo hình đại diện 3D thực tế từ một hình ảnh 2D duy nhất.

Để đào tạo mô hình, các nhà nghiên cứu đã sử dụng bộ dữ liệu gồm hơn 200,000 mô hình khuôn mặt 3D. Bộ dữ liệu bao gồm nhiều khuôn mặt với các tông màu da, kiểu tóc và đặc điểm khuôn mặt khác nhau. Sau đó, ADM có thể tìm hiểu mối quan hệ giữa hình ảnh 2D và mô hình khuôn mặt 3D và tạo hình đại diện 3D thực tế từ một hình ảnh 2D duy nhất.

Mô hình cũng có thể được sử dụng để tạo hình đại diện từ ảnh được chụp từ một góc độ khác

Đối với hình đại diện 3D được cá nhân hóa, mô hình Rodin cung cấp thao tác hướng dẫn bằng văn bản. Chỉnh sửa ngôn ngữ tự nhiên là một cách trực quan để thay đổi nhiều tính năng hình đại diện 3D khác nhau.

Nghiên cứu này đề xuất một mô hình tổng quát 3D tự động tạo các hình đại diện kỹ thuật số 3D được biểu diễn dưới dạng các trường bức xạ thần kinh sử dụng các mô hình khuếch tán. Do các yêu cầu xử lý và bộ nhớ hạn chế liên quan đến 3D, việc tạo ra các tính năng phong phú cần thiết cho hình đại diện chất lượng cao là một vấn đề lớn. Các nhà phát triển đề xuất mạng khuếch tán triển khai (Rodin) giải quyết vấn đề này.

Xét về giới tính, tuổi tác, chủng tộc, biểu cảm, phụ kiện trên khuôn mặt, v.v., người mẫu thể hiện sự đa dạng thế hệ nổi bật.​

Mạng này đưa ra nhiều bản đồ tính năng 2D của trường bức xạ thần kinh vào một mặt phẳng tính năng 2D duy nhất, sau đó mô hình sẽ thực hiện khuếch tán nhận biết 3D. Mô hình Rodin sử dụng tích chập nhận biết 3D, tham gia vào các tính năng được chiếu trong mặt phẳng tính năng 2D theo mối quan hệ ban đầu của chúng trong 3D, để mang lại hiệu quả tính toán rất cần thiết trong khi vẫn duy trì tính toàn vẹn của khuếch tán trong 3D.

Đọc thêm về AI:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Zeta Markets khởi xướng cộng đồng Airdrop, Phân bổ 1% nguồn cung cấp mã thông báo Z cho cộng đồng Solana
thị trường Báo cáo tin tức Công nghệ
Zeta Markets khởi xướng cộng đồng Airdrop, Phân bổ 1% nguồn cung cấp mã thông báo Z cho cộng đồng Solana
8 Tháng Năm, 2024
Trái phiếu kỹ thuật số dựa trên Blockchain của KfW: Bước nhảy vọt hướng tới một hệ sinh thái tài chính minh bạch và hiệu quả hơn
Kinh doanh Phần mềm Câu chuyện và đánh giá Công nghệ
Trái phiếu kỹ thuật số dựa trên Blockchain của KfW: Bước nhảy vọt hướng tới một hệ sinh thái tài chính minh bạch và hiệu quả hơn
8 Tháng Năm, 2024
Đạo luật quyên góp sửa đổi của Hàn Quốc: Đây là một bước tiến hay lùi cho hoạt động từ thiện tiền điện tử?
Tiền điện tử Wiki Tiêu Kinh doanh thị trường Công nghệ
Đạo luật quyên góp sửa đổi của Hàn Quốc: Đây là một bước tiến hay lùi cho hoạt động từ thiện tiền điện tử?
8 Tháng Năm, 2024
AI sáng tạo vào năm 2024: Xu hướng mới nổi, đột phá và triển vọng tương lai
AI Wiki Phần mềm Câu chuyện và đánh giá Công nghệ
AI sáng tạo vào năm 2024: Xu hướng mới nổi, đột phá và triển vọng tương lai
8 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH