AI Wiki Nghệ thuật Đào tạo Phần mềm Công nghệ
24 Tháng Tư, 2024

Sự trỗi dậy của Sora: AI được tái tạo như thế nàodefiTìm hiểu bối cảnh sáng tạo nội dung video

Tóm lại

Sora là mô hình AI chuyển văn bản thành video tiến bộ hứa hẹn sẽ thay đổi hoàn toàn trò chơi tạo video.

Adobe gần đây đã tiết lộ kế hoạch tích hợp các công cụ AI tổng quát vào Premiere Pro phần mềm. Động thái này bao gồm việc cấp cho người dùng quyền truy cập vào các công cụ như OpenAI's Sora trực tiếp trong Premiere Pro, nhằm mục đích làm phong phú thêm phần mềm với các khả năng được hỗ trợ bởi AI như thao tác cảnh và loại bỏ sự phân tâm.

Mặc dù OpenAISora của Sora hiện không được công chúng truy cập, Adobe đã chứng minh sự tích hợp của nó vào Premiere Pro như một tính năng thử nghiệm mà không cung cấp mốc thời gian cụ thể cho việc phát hành.

Sora là một mô hình AI chuyển văn bản thành video tiến bộ đã gây được sự chú ý nhờ lời hứa sẽ thay đổi hoàn toàn trò chơi tạo video. Là một công cụ đầy hứa hẹn mang lại hiệu quả cực cao cho tất cả những ai liên quan đến sản xuất video, thiết kế chuyển động và hoạt hình, công nghệ này cũng mang đến những thách thức quan trọng.

Hãy cùng khám phá mọi khía cạnh của Sora đáng kinh ngạc và được nhiều người mong đợi.

Chuyển văn bản thành video?

Về cơ bản, Sora được thiết kế để tạo ra các video sống động như thật và hấp dẫn về mặt hình ảnh được tạo từ lời nhắc bằng văn bản. Là một ứng dụng sáng tạo của AI, Sora hướng đến việc hợp lý hóa quy trình sản xuất video và mang đến những khả năng mới cho quy trình kể chuyện và giao tiếp bằng hình ảnh.

Chức năng của Sora bắt nguồn từ khả năng diễn giải và thực thi các lệnh văn bản để tạo nội dung video hấp dẫn. Tận dụng các kỹ thuật học sâu nâng cao và khả năng hiểu ngôn ngữ, Sora xử lý văn bản đầu vào và xây dựng các cảnh trực quan tương ứng với các ký tự, cài đặt và chuyển động. Quá trình này bao gồm sự tương tác phức tạp giữa xử lý ngôn ngữ tự nhiên và tổng hợp video, tạo ra kết quả gần giống với lời nhắc bằng văn bản được cung cấp.

Trong việc phát triển Sora, OpenAInhóm của ông nhấn mạnh tầm quan trọng của việc tạo ra một mô hình AI chứa đựng sự hiểu biết sâu sắc về ngôn ngữ và nắm bắt vững chắc các nguyên tắc kể chuyện bằng hình ảnh. Bằng cách tích hợp những tiến bộ tiên tiến về hiểu ngôn ngữ tự nhiên và tổng hợp video, thiết kế của Sora ưu tiên sự kết hợp gắn kết giữa biểu đạt ngôn ngữ và thể hiện hình ảnh.

Làm thế nào nó thậm chí có thể?

Vì vậy, Sora hoạt động như một mô hình phổ biến tương tự như các AI tổng hợp khác hoạt động với tính năng chuyển văn bản thành hình ảnh. Điều đó có nghĩa là Sora bắt đầu mỗi khung hình bằng nhiễu tĩnh, sau đó chuyển đổi hình ảnh thành mô tả giống với lời nhắc và mô tả đã cho về những gì được mong đợi. Điều này có thể thực hiện được nhờ học máy. Video Sora có thể kéo dài tới 60 giây.

Để giải quyết tính nhất quán về thời gian, Sora đổi mới bằng cách xem xét đồng thời nhiều khung hình video, đảm bảo tính mạch lạc khi các đối tượng di chuyển trong khung cảnh.

Kết hợp cả mô hình khuếch tán và biến áp, Sora đi theo cách tiếp cận kết hợp giống như GPTcấu trúc máy biến áp Jack Qiao nêu bật những điểm mạnh bổ sung của các mô hình này, với khả năng khuếch tán vượt trội trong việc tạo kết cấu nhưng thiếu thành phần tổng thể, trong khi máy biến áp vượt trội trong việc xác định bố cục ở cấp độ cao. Sự kết hợp này thúc đẩy khả năng tổ chức các bản vá của máy biến áp trong khi mô hình khuếch tán lấp đầy các chi tiết.

Trong quá trình triển khai của Sora, hình ảnh được chia thành các mảng ba chiều để phù hợp với sự tồn tại theo thời gian. Điều này phản ánh quá trình mã hóa trong các mô hình ngôn ngữ, trong đó các bản vá đại diện cho các phần tử của một tập hợp hình ảnh. Ngoài ra, bước giảm kích thước được áp dụng để hợp lý hóa hiệu quả tính toán.

Để nâng cao độ trung thực của video, Sora sử dụng kỹ thuật ghi lại phụ đề tương tự như DALL · E 3, Trong đó GPT viết lại lời nhắc của người dùng với chi tiết bổ sung trước khi tạo video. Điều này đóng vai trò như một hình thức sàng lọc nhanh chóng tự động, đảm bảo tuân thủ trung thực thông tin đầu vào của người dùng.

Sora bây giờ tốt đến mức nào?

OpenAI thừa nhận một số hạn chế trong phiên bản hiện tại của Sora. Đáng chú ý, Sora thiếu khả năng nắm bắt vật lý vốn có, có nghĩa là nó có thể không tuân thủ nhất quán các nguyên tắc vật lý trong thế giới thực.

Ví dụ, mô hình không nắm bắt được mối quan hệ nguyên nhân và kết quả, dẫn đến sự mâu thuẫn tiềm ẩn. Tương tự như vậy, việc định vị không gian của các vật thể có thể thể hiện sự dịch chuyển không tự nhiên.

Khi nói đến độ tin cậy, tình trạng của Sora vẫn chưa chắc chắn. Mặc dù OpenAI đã trình bày các ví dụ chứng minh chất lượng cao, vẫn chưa rõ việc trưng bày có chọn lọc đã diễn ra ở mức độ nào. Trong các ứng dụng chuyển văn bản thành hình ảnh, việc tạo nhiều hình ảnh và chọn hình ảnh đẹp nhất là cách làm phổ biến. Số lượng hình ảnh chính xác được tạo ra bởi OpenAI nhóm giới thiệu các video trong bài viết thông báo của họ vẫn chưa được tiết lộ. Sự thiếu minh bạch này có thể cản trở việc áp dụng, đặc biệt nếu cần tạo hàng trăm hoặc hàng nghìn video để chỉ thu được một kết quả có thể sử dụng được. Để giảm bớt sự không chắc chắn này, chúng ta phải chờ khả năng tiếp cận rộng rãi hơn của công cụ.

Sora sẽ được sử dụng ở đâu?

Khả năng của Sora mở rộng sang việc tạo video từ đầu, kéo dài cảnh quay hiện có và lấp đầy liền mạch các khung hình bị thiếu trong video.

Tương tự như cách các công cụ AI tạo văn bản thành hình ảnh đã cách mạng hóa việc tạo hình ảnh mà không cần kỹ năng chỉnh sửa kỹ thuật, Sora hướng đến việc đơn giản hóa việc sản xuất video mà không cần chuyên môn về chỉnh sửa hình ảnh. Dưới đây là một số kịch bản ứng dụng chính:

  • Sora cho phép tạo các video dạng ngắn phù hợp với các nền tảng truyền thông xã hội như TikTok, Instagram Reels và YouTube Shorts. Nó đặc biệt vượt trội trong việc tạo nội dung có thể khó hoặc không thực tế khi quay phim bằng các phương pháp truyền thống.
  • Theo truyền thống, những nỗ lực tốn kém như sản xuất quảng cáo, video quảng cáo và trình diễn sản phẩm có thể được đơn giản hóa đáng kể nhờ các công cụ AI chuyển văn bản thành video như Sora, cung cấp các giải pháp tiết kiệm chi phí.
  • Ngay cả khi các video do AI tạo ra không được tích hợp vào sản phẩm cuối cùng, chúng vẫn đóng vai trò là công cụ có giá trị để minh họa nhanh chóng các khái niệm. Các nhà làm phim có thể sử dụng AI để mô phỏng cảnh trước khi quay, trong khi các nhà thiết kế có thể hình dung sản phẩm trước khi sản xuất. Ví dụ: một công ty đồ chơi có thể thuê Sora để tạo ra một mô hình AI của đồ chơi tàu cướp biển mới để đánh giá tính khả thi của nó trước khi sản xuất hàng loạt.
  • Dữ liệu tổng hợp tỏ ra vô giá trong các tình huống mà các mối lo ngại về quyền riêng tư hoặc tính khả thi ngăn cản việc sử dụng dữ liệu thực. Mặc dù thường được áp dụng cho dữ liệu số như hồ sơ tài chính và thông tin nhận dạng cá nhân, dữ liệu tổng hợp có thuộc tính tương tự có thể được tạo để có khả năng truy cập rộng hơn. Trong lĩnh vực video, dữ liệu tổng hợp rất hữu ích cho việc đào tạo hệ thống thị giác máy tính.

Những thách thức liên quan đến Sora

  • Là sản phẩm mới được giới thiệu nên những rủi ro của Sora vẫn chưa được làm rõ hoàn toàn; tuy nhiên, chúng được dự đoán là tương tự như những gì gặp phải với mô hình chuyển văn bản thành hình ảnh.
  • Nếu không có các biện pháp bảo vệ đầy đủ, Sora có khả năng tạo ra nội dung phản cảm hoặc không phù hợp, chẳng hạn như video chứa bạo lực, hình ảnh phản cảm, tài liệu khiêu dâm, thể hiện xúc phạm các nhóm cụ thể và quảng bá hoặc tôn vinh các hoạt động bất hợp pháp. Những yếu tố cấu thành nội dung không phù hợp có thể khác nhau rất nhiều tùy thuộc vào người dùng (như trẻ em so với người lớn) và hoàn cảnh tạo ra video (chẳng hạn như video giáo dục về mối nguy hiểm từ pháo hoa vô tình hiển thị cảnh phản cảm).
  • Các video mẫu được chia sẻ bởi OpenAI chứng minh rằng một trong những khả năng đáng chú ý của Sora là kỹ năng tạo ra các kịch bản giàu trí tưởng tượng vượt xa thực tế. Tuy nhiên, khả năng này cũng khiến nó dễ bị tạo ra “sâu giả” video, trong đó các cá nhân hoặc tình huống chân thật bị thay đổi để truyền tải thông tin sai sự thật, cho dù là vô ý (thông tin sai lệch) hay cố ý (thông tin sai lệch). Nội dung như vậy có thể dẫn đến hậu quả đáng kể.
  • Kết quả do các mô hình AI tạo ra vốn có liên quan đến dữ liệu mà chúng được đào tạo. Do đó, những thành kiến ​​hoặc khuôn mẫu về văn hóa được nhúng trong dữ liệu đào tạo có thể xuất hiện trong các video được tạo và có thể gây ra các vấn đề tương tự.

Cái gì OpenAI Team Làm gì để ngăn chặn những rủi ro nêu trên?

Hiện tại, Sora chỉ có thể truy cập được vào “đội đỏ” nhà nghiên cứu—chuyên gia được giao nhiệm vụ xác định và giảm thiểu các vấn đề tiềm ẩn với mô hình. Những nhà nghiên cứu này nỗ lực tạo ra nội dung có thể bộc lộ những rủi ro đã nêu, cho phép OpenAI để giải quyết và khắc phục mọi lo ngại trước khi Sora được phát hành ra công chúng.

Sora có thể để tôi mất việc không?

Khả năng của Sora trong việc sản xuất nội dung video hàng đầu dựa trên tín hiệu văn bản có khả năng tạo ra những chuyển đổi đáng chú ý trong bối cảnh việc làm sáng tạo. Các quan điểm thông thường trong lĩnh vực quay phim, hiệu ứng đặc biệt và hoạt hình có nguy cơ lỗi thời trước những tiến bộ như vậy. Mặc dù một số nhà sáng tạo có thể xoay vòng bằng cách trau dồi kiến ​​thức chuyên môn trong việc giám sát các chức năng AI, sử dụng AI có đạo đức và hướng dẫn định hướng sáng tạo để khai thác các khả năng của AI, nhưng tính khả thi của quá trình chuyển đổi này đối với tất cả mọi người vẫn chưa chắc chắn.

Mặt khác, bằng cách giảm bớt những trở ngại về kỹ thuật và tài chính liên quan đến việc sản xuất video, Sora có khả năng trao quyền cho nhiều cá nhân hơn để tạo ra nội dung chất lượng cao. Quá trình dân chủ hóa này có thể thúc đẩy sự bùng nổ trong việc phân phối nội dung đa dạng và sáng tạo. Mặc dù có thể yêu cầu các tổ chức truyền thông và người tạo nội dung lâu đời phải điều chỉnh và giới thiệu các phương pháp tiếp cận đổi mới, nhưng sự phát triển này có thể báo trước những kết quả tích cực.

Dù thế nào đi nữa, sau khi phát hành hàng loạt, Sora chắc chắn sẽ gây ra những thay đổi trong video và các ngành liên quan, cũng như trong việc tạo nội dung cá nhân.

Ý nghĩa lâu dài của OpenAI Sora

Khi Sora trở nên cố thủ trong quy trình làm việc chuyên nghiệp, tác động lâu dài của nó sẽ bộc lộ:

Mở khóa các trường hợp sử dụng có giá trị cao: Sự tích hợp của Sora giữa các ngành hứa hẹn mang lại những ứng dụng mang tính biến đổi, bao gồm:

  • Tăng tốc sản xuất nội dung: Sora hợp lý hóa việc tạo phương tiện trên các lĩnh vực VR, AR, trò chơi và giải trí truyền thống, đẩy nhanh chu kỳ sản xuất và tạo điều kiện thuận lợi cho việc lên ý tưởng.
  • Trải nghiệm được cá nhân hóa: Nội dung được Sora quản lý phù hợp để phù hợp với sở thích cá nhân xuất hiện, định hình lại các mô hình giải trí và giáo dục để phù hợp với phong cách và thị hiếu học tập đa dạng.
  • Thích ứng theo thời gian thực: Tính năng chỉnh sửa video động được Sora hỗ trợ cho phép sửa đổi nội dung nhanh chóng, đáp ứng sở thích và phản hồi của khán giả trong thời gian thực.
  • Làm mờ ranh giới kỹ thuật số: Sức mạnh tổng hợp của Sora với VR và AR làm mờ ranh giới giữa thế giới vật lý và kỹ thuật số, mang đến những trải nghiệm nhập vai mới lạ và cơ hội kể chuyện tương tác.

Về bản chất, sự ra đời của Sora báo trước một kỷ nguyên biến đổi trong việc tạo nội dung do AI điều khiển, định hình lại các ngành công nghiệp, câu chuyện và trải nghiệm người dùng theo những cách sâu sắc.

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Zhauhazyn là chuyên gia viết quảng cáo và xã hội học. Bị cuốn hút bởi sự năng động phức tạp của Nghiên cứu Khoa học và Công nghệ, cô đi sâu vào lĩnh vực Web3 với niềm đam mê mãnh liệt đối với blockchain.

Xem thêm bài viết
Zhauhazyn Shaden
Zhauhazyn Shaden

Zhauhazyn là chuyên gia viết quảng cáo và xã hội học. Bị cuốn hút bởi sự năng động phức tạp của Nghiên cứu Khoa học và Công nghệ, cô đi sâu vào lĩnh vực Web3 với niềm đam mê mãnh liệt đối với blockchain.

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Nexo bắt đầu 'Cuộc săn lùng' thưởng cho người dùng 12 triệu USD token NEXO khi tương tác với hệ sinh thái của nó
thị trường Báo cáo tin tức Công nghệ
Nexo bắt đầu 'Cuộc săn lùng' thưởng cho người dùng 12 triệu USD token NEXO khi tương tác với hệ sinh thái của nó
8 Tháng Năm, 2024
Sàn giao dịch Revolut X của Revolut thu hút các nhà giao dịch tiền điện tử với mức phí sản xuất bằng 0 và phân tích nâng cao
thị trường Phần mềm Câu chuyện và đánh giá Công nghệ
Sàn giao dịch Revolut X của Revolut thu hút các nhà giao dịch tiền điện tử với mức phí sản xuất bằng 0 và phân tích nâng cao
8 Tháng Năm, 2024
Lisk chính thức chuyển sang Ethereum lớp 2 và ra mắt Core v4.0.6
Báo cáo tin tức Công nghệ
Lisk chính thức chuyển sang Ethereum lớp 2 và ra mắt Core v4.0.6
8 Tháng Năm, 2024
Đồng xu Meme mới của tháng 2024 năm 7: XNUMX lựa chọn dành cho người hâm mộ tiền điện tử
Tiêu thị trường Công nghệ
Đồng xu Meme mới của tháng 2024 năm 7: XNUMX lựa chọn dành cho người hâm mộ tiền điện tử
8 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH