Báo cáo tin tức SMW Công nghệ
31 Tháng Năm, 2023

Chứng mất trí nhớ AI: Những thách thức của nội dung do mô hình tạo và tác động của nó đối với các hệ thống AI

Tóm lại

Các nhà nghiên cứu đã phát hiện ra hiện tượng mất trí nhớ mô hình, đề cập đến những khiếm khuyết không thể đảo ngược xảy ra trong các mô hình khi phần đuôi của phân phối nội dung ban đầu biến mất.

Để duy trì lợi ích của các mô hình đào tạo trên dữ liệu internet, các giải pháp phải được tìm ra để giảm thiểu khả năng mất phân phối nội dung gốc.

Những tiến bộ nhanh chóng trong công nghệ AI đã mang lại những thành tựu đáng kinh ngạc trong xử lý ngôn ngữ tự nhiên và tạo hình ảnh. Các mô hình ngôn ngữ lớn (LLM) như GPT-2, GPT-3 (.5) và GPT-4 đã thể hiện hiệu suất vượt trội qua nhiều tác vụ ngôn ngữ khác nhau, trong khi các mô hình như ChatGPT đã giới thiệu những khả năng ngôn ngữ này cho công chúng. Tuy nhiên, khi LLM trở nên phổ biến hơn và đóng góp đáng kể vào ngôn ngữ được tìm thấy trực tuyến, các nhà nghiên cứu đã phát hiện ra một vấn đề đáng lo ngại được gọi là “mất trí nhớ người mẫu".

Chứng mất trí nhớ AI: Những thách thức của nội dung do mô hình tạo và tác động của nó đối với các hệ thống AI
Metaverse Post (mpost.io)
Đề nghị: OpenAI: AI có khả năng gây ra nhiều tác hại cho con người, nhưng việc cố gắng ngăn chặn tiến độ không phải là một lựa chọn

Trong một bài báo gần đây, các nhà nghiên cứu đã làm sáng tỏ hiện tượng mất trí nhớ mô hình, đề cập đến những khiếm khuyết không thể khắc phục được xảy ra trong các mô hình khi phần đuôi của phân phối nội dung ban đầu biến mất. Nghiên cứu chỉ ra rằng việc sử dụng nội dung do mô hình tạo ra trong quá trình đào tạo có thể dẫn đến điều này sự suy giảm nhận thức trong các mô hình kết quả. Hiệu ứng này đã được quan sát thấy trong các bộ mã hóa tự động biến thiên (VAE), mô hình hỗn hợp Gaussian (GMM) và LLM. Những phát hiện này nhấn mạnh sự cần thiết phải giải quyết vấn đề này để bảo vệ lợi ích của mô hình đào tạo trên dữ liệu quy mô lớn thu được từ internet.

arxiv.org/pdf/2305.17493.pdf

Các nhà nghiên cứu cung cấp một sự hiểu biết lý thuyết về chứng mất trí mô hình và chứng minh sự phổ biến của nó trên nhiều mô hình sinh sản. Họ cho rằng hiện tượng này phải được xem xét nghiêm túc để đảm bảo tính hiệu quả liên tục của các mô hình đào tạo trên diện rộng. dữ liệu web. Khi các LLM ngày càng đóng góp nhiều hơn vào ngôn ngữ và nội dung có sẵn trực tuyến, giá trị của dữ liệu được thu thập từ các tương tác thực sự của con người với các hệ thống thậm chí còn trở nên quan trọng hơn.

Việc giới thiệu stable diffusion, một kỹ thuật cách mạng hóa việc tạo ảnh từ văn bản mô tả, minh họa rõ hơn về tác động của LLM trong việc tạo nội dung. Tuy nhiên, nghiên cứu cho thấy rằng việc sử dụng nội dung do mô hình tạo có thể gây ra tình trạng mất khả năng phân phối nội dung từ đầu đến cuối, có khả năng làm xói mòn tính đa dạng và phong phú của dữ liệu gốc.

Mặc dù dữ liệu quy mô lớn được lấy từ web cung cấp những hiểu biết có giá trị về tương tác của con người với các hệ thống, nhưng sự hiện diện của nội dung do LLM tạo ra đưa ra những thách thức mới. Các nhà nghiên cứu nhấn mạnh sự cần thiết phải giải quyết chứng mất trí mô hình và tìm giải pháp bảo tồn lợi ích của việc đào tạo mô hình trên dữ liệu internet đồng thời giảm thiểu khả năng mất khả năng phân phối nội dung gốc.

Khi lĩnh vực AI tiếp tục phát triển, điều quan trọng là các nhà nghiên cứu, nhà phát triển và nhà hoạch định chính sách phải nhận thức được những hạn chế và thách thức liên quan đến các mô hình đào tạo về nội dung do mô hình tạo ra. Bằng cách hiểu và giải quyết các vấn đề như chứng mất trí kiểu mẫu, chúng ta có thể đảm bảo việc sử dụng công nghệ AI một cách có trách nhiệm và hiệu quả trong tương lai.

Đọc thêm về AI:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Sự chuyển đổi sang tiền điện tử của Donald Trump: Từ đối thủ thành người ủng hộ và ý nghĩa của nó đối với thị trường tiền điện tử Hoa Kỳ
Kinh doanh thị trường Câu chuyện và đánh giá Công nghệ
Sự chuyển đổi sang tiền điện tử của Donald Trump: Từ đối thủ thành người ủng hộ và ý nghĩa của nó đối với thị trường tiền điện tử Hoa Kỳ
10 Tháng Năm, 2024
Layer3 sẽ ra mắt mã thông báo L3 vào mùa hè này, phân bổ 51% tổng nguồn cung cho cộng đồng
thị trường Báo cáo tin tức Công nghệ
Layer3 sẽ ra mắt mã thông báo L3 vào mùa hè này, phân bổ 51% tổng nguồn cung cho cộng đồng
10 Tháng Năm, 2024
Cảnh báo cuối cùng của Edward Snowden dành cho các nhà phát triển Bitcoin: “Đặt quyền riêng tư thành ưu tiên ở cấp độ giao thức hoặc có nguy cơ mất nó
thị trường Bảo mật Wiki Phần mềm Câu chuyện và đánh giá Công nghệ
Cảnh báo cuối cùng của Edward Snowden dành cho các nhà phát triển Bitcoin: “Đặt quyền riêng tư thành ưu tiên ở cấp độ giao thức hoặc có nguy cơ mất nó
10 Tháng Năm, 2024
Mạng lưới Ethereum lớp 2 được hỗ trợ bởi sự lạc quan sẽ ra mắt Mainnet vào ngày 15 tháng XNUMX
Báo cáo tin tức Công nghệ
Mạng lưới Ethereum lớp 2 được hỗ trợ bởi sự lạc quan sẽ ra mắt Mainnet vào ngày 15 tháng XNUMX
10 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH