Báo cáo tin tức Công nghệ
10 Tháng Năm, 2023

Các chuyên gia cảnh báo chống 'chèn độc hại' vào bộ dữ liệu AI trong ChatGPT

Tóm lại

ChatGPT có khả năng dễ bị tổn thương do dữ liệu huấn luyện.

Theo các nhà nghiên cứu, chỉ với 60 đô la Mỹ, chúng ta có thể đầu độc 0.01% bộ dữ liệu LAION-400 hoặc COYO-700 vào năm 2022.

ChatGPT Công nghệ ngày càng trở nên phổ biến nhưng gần đây nghiên cứu gợi ý rằng công nghệ này có thể dễ bị tổn thương do dữ liệu đào tạo mà nó sử dụng. Khi các mô hình trở nên phức tạp hơn và các tập dữ liệu trở nên lớn hơn và phức tạp hơn, những kẻ độc hại có thể khai thác lỗ hổng này để thao túng các tập dữ liệu và khiến các mô hình máy học tạo ra kết quả không chính xác.

Các chuyên gia cảnh báo về 'chèn độc hại' vào bộ dữ liệu AI trong ChatGPT
@Midjourney / TataMatalata#9861
Đề nghị: Top 10 cổ phiếu triển vọng nhất được dự đoán bởi ChatGPT (AI) sẽ vượt qua các quỹ hàng đầu thế giới vào năm 2023

Mối quan tâm chính là cơ sở dữ liệu chatbot thường là tập dữ liệu “được xác minh có điều kiện”, nghĩa là có một mức độ tin cậy nhất định được đưa vào dữ liệu mà không cần xác minh rộng rãi. Nói cách khác, những bộ dữ liệu này thường có thể có những vấn đề cơ bản chưa được xem xét. Mặc dù việc xác thực các bộ dữ liệu thường không được thực hiện do kích thước lớn của chúng, nhưng vẫn tồn tại khả năng các tác nhân độc hại thao túng dữ liệu này.

Trên thực tế, các nhà nghiên cứu đã gợi ý rằng vào năm 2022, những kẻ tấn công có thể chi khoảng 60 đô la để đầu độc 0.01% bộ dữ liệu LAION-400 hoặc COYO-700. Mặc dù điều này nghe có vẻ không nhiều, nhưng những kẻ độc hại có thể sử dụng dữ liệu bị nhiễm độc này để thu lợi riêng nếu không được kiểm soát. Dữ liệu độc hại cuối cùng có thể bị rò rỉ thành các bộ dữ liệu lớn hơn, làm hỏng chất lượng dữ liệu và dẫn đến các mô hình học máy không đáng tin cậy.

Cần thực hiện các bước để bảo vệ cơ sở dữ liệu khỏi dữ liệu độc hại. Tổng hợp nhiều nguồn dữ liệu sẽ trở thành tiêu chuẩn cho chatbot tập dữ liệu đào tạo để đảm bảo dữ liệu đáng tin cậy và chính xác. Ngoài ra, các công ty nên thử nghiệm các bộ dữ liệu để đảm bảo chúng không dễ bị tấn công bởi các tác nhân độc hại.

Chatbot AI với mã độc hại có thể dễ bị tấn công

Mối đe dọa của mã độc trong chatbot có thể khá nghiêm trọng; mã độc có thể được sử dụng để đánh cắp dữ liệu người dùng, cho phép truy cập độc hại vào máy chủ và kích hoạt các hoạt động độc hại như rửa tiền hoặc trích xuất dữ liệu. Nếu một chatbot AI được đào tạo dựa trên dữ liệu có phần chèn độc hại, thì nó có thể vô tình tiêm mã độc vào các phản hồi của nó và vô tình được sử dụng như một công cụ để thu lợi độc hại.

Các tác nhân độc hại có thể lợi dụng lỗ hổng này bằng cách cố ý hoặc vô tình đưa mã độc vào dữ liệu đào tạo. Ngoài ra, vì các chatbot AI học hỏi từ dữ liệu mà nó được cung cấp, điều này cũng có khả năng dẫn đến việc chúng học các phản hồi không chính xác hoặc thậm chí là hành vi nguy hiểm.

@Midjourney / TataMatalata#9861

Một mối nguy hiểm khác mà các chatbot AI có thể gặp phải là “trang bị quá mức”. Đây là khi các mô hình dự đoán được đào tạo quá chặt chẽ về dữ liệu mà chúng được cung cấp, do đó dẫn đến dự đoán kém khi được trình bày với dữ liệu mới. Đây có thể là một vấn đề cụ thể như Chatbot AI được đào tạo về mã độc có thể trở nên hiệu quả hơn trong việc đưa mã độc vào phản hồi của họ khi họ trở nên quen thuộc hơn với dữ liệu.

Điều cần thiết là phải nhận thức được các rủi ro và thực hiện các biện pháp phòng ngừa để đảm bảo dữ liệu đào tạo được sử dụng để dạy ChatGPT là an toàn và đáng tin cậy để ngăn chặn những điểm yếu tiềm ẩn này. Dữ liệu ban đầu được sử dụng để đào tạo cũng phải được giữ riêng biệt và duy nhất; việc quảng bá "phần chèn độc hại" không được xung đột hoặc trùng lặp với các nguồn khác. Nó nên được kiểm tra và so sánh với các miền khác nếu việc “thu thập” nhiều miền được xác nhận là khả thi để xác thực dữ liệu.

Công nghệ Chatbot hứa hẹn sẽ thay đổi cách mọi người tiến hành các cuộc thảo luận của con người. Nhưng trước khi nó có thể phát huy hết tiềm năng của mình, nó cần được cải thiện và bảo vệ. Bộ dữ liệu cho chatbot cần được kiểm tra kỹ lưỡng và sẵn sàng chống lại các tác nhân độc hại. Bằng cách này, chúng tôi có thể đảm bảo rằng chúng tôi sử dụng hết tiềm năng của công nghệ và tiếp tục thúc đẩy giới hạn của trí tuệ nhân tạo.

Đọc thêm về AI:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Những người sáng lập ví Samourai bị buộc tội tạo điều kiện cho các giao dịch Darknet trị giá 2 tỷ USD

Sự e ngại của những người sáng lập Ví Samourai thể hiện một bước thụt lùi đáng chú ý đối với ngành, nhấn mạnh sự kiên trì ...

Biết thêm

Cơn sốt DOGE: Phân tích sự gia tăng giá trị gần đây của Dogecoin (DOGE)

Ngành công nghiệp tiền điện tử đang mở rộng nhanh chóng và các đồng tiền meme đang chuẩn bị cho một bước phát triển đáng kể. Dogecoin (DOGE), ...

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Tuần lễ thời trang Metaverse 2024: Quản trị phi tập trung và cơ hội đầu tư vào thời trang ảo
Nghệ thuật Phong cách sống Câu chuyện và đánh giá Công nghệ
Tuần lễ thời trang Metaverse 2024: Quản trị phi tập trung và cơ hội đầu tư vào thời trang ảo
29 Tháng Tư, 2024
Từ ý tưởng đến hiện thực: Cách Trình tạo kết cấu và Thiết lập tự động Avatar của Roblox tăng tốc khả năng sáng tạo và đổi mới
Phần mềm Câu chuyện và đánh giá Công nghệ
Từ ý tưởng đến hiện thực: Cách Trình tạo kết cấu và Thiết lập tự động Avatar của Roblox tăng tốc khả năng sáng tạo và đổi mới
29 Tháng Tư, 2024
Khối của Jack Dorsey tiết lộ hệ thống khai thác Bitcoin đột phá với chip ba nanomet tiên tiến
Phần mềm Câu chuyện và đánh giá Công nghệ
Khối của Jack Dorsey tiết lộ hệ thống khai thác Bitcoin đột phá với chip ba nanomet tiên tiến
29 Tháng Tư, 2024
Friend.Tech hoãn phát hành V2 đến ngày 3 tháng XNUMX để triển khai mã thông báo FRIEND Airdrop Chia Sẻ Cho Người Nắm Giữ Chìa Khóa
thị trường Báo cáo tin tức Công nghệ
Friend.Tech hoãn phát hành V2 đến ngày 3 tháng XNUMX để triển khai mã thông báo FRIEND Airdrop Chia Sẻ Cho Người Nắm Giữ Chìa Khóa
29 Tháng Tư, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH