Báo cáo tin tức Công nghệ
15 Tháng ba, 2023

OpenAI Tập hợp một nhóm gồm hơn 50 chuyên gia để nâng cao GPT-4An toàn của

Tóm lại

OpenAI đã thuê một nhóm gồm hơn 50 chuyên gia để đảm bảo rằng sản phẩm mới nhất của mình mô hình ngôn ngữ, GPT-4, an toàn khi sử dụng.

Nhóm bao gồm các nhà nghiên cứu và kỹ sư chuyên về chính sách, đạo đức và an toàn AI.

Mục đích là để ngăn chặn GPT-4 khỏi việc tạo ra nội dung có hại hoặc sai lệch và đảm bảo rằng nội dung đó phù hợp với các giá trị của con người.

OpenAI Tập hợp một nhóm gồm hơn 50 chuyên gia để nâng cao GPT-4An toàn của

OpenAI đã thuê hơn 50 chuyên gia từ nhiều lĩnh vực khác nhau để thực hiện GPT-4 an toàn hơn. Các chuyên gia đã làm việc với thử nghiệm đối nghịch của mô hình để xác định các rủi ro và lỗ hổng tiềm ẩn. Họ là những chuyên gia từ nhiều lĩnh vực khác nhau: rủi ro liên kết AI dài hạn, an ninh mạng, rủi ro sinh học và an ninh quốc tế. Phát hiện của họ đã giúp OpenAI đánh giá hành vi của mô hình trong các lĩnh vực rủi ro cao đòi hỏi chuyên môn thích hợp. 

Mặc dù mô hình ngôn ngữ mới nhất có những rủi ro tương tự như các mô hình ngôn ngữ nhỏ hơn, nhưng các khả năng bổ sung của GPT-4 dẫn đến những mối đe dọa mới. Vì vậy, sự tham gia của các chuyên gia đã được quan trọng trong việc đảm bảo an toàn của công nghệ.

OpenAI đã triển khai một bộ bổ sung phương pháp học tăng cường liên quan đến an toàn từ các lời nhắc đào tạo theo sở thích của con người (RLHF) và mô hình khen thưởng dựa trên quy tắc (RBRM) để cải thiện sự an toàn của GPT-4 người mẫu. Các RBRM không bị bắn GPT-4 các bộ phân loại có chức năng như một tín hiệu khen thưởng bổ sung cho GPT-4 mô hình chính sách trong quá trình tinh chỉnh RLHF. Mục đích của họ là khuyến khích hành vi phù hợp, chẳng hạn như từ chối tạo nội dung có hại hoặc không từ chối các yêu cầu vô hại.

Để đảm bảo an toàn cho GPT-4 mô hình, OpenAI bắt đầu tuyển dụng các chuyên gia bên ngoài vào tháng 2022 năm XNUMX để tiến hành các bài tập “đội đỏ”, bao gồm kiểm tra sức chịu đựng, kiểm tra ranh giới và kiểm tra đối thủ. Họ có quyền truy cập vào các phiên bản đầu tiên của GPT-4 mô hình và xác định những rủi ro ban đầu thúc đẩy nghiên cứu an toàn hơn nữa.

Phản hồi của các chuyên gia đã dẫn đến các biện pháp giảm thiểu kỹ thuật và thực thi chính sách để giảm thiểu rủi ro. Tuy nhiên, vẫn còn nhiều mối đe dọa và cần đánh giá thêm.

Nói về nhân viên tại OpenAI, ChatGPT ban đầu là phát triển với sự hỗ trợ từ các cá nhân ở một số khu vực nghèo nhất thế giới thông qua OpenAI's quan hệ đối tác với một công ty tên là Sama, công ty sử dụng hàng triệu công nhân từ các khu vực nghèo khó. Một số chuyên gia về đạo đức AI đã chỉ trích OpenAIquyết định thuê ngoài việc đào tạo nhân viên của mình ChatGPT làm mẫu cho Sama, cáo buộc công ty bóc lột lao động giá rẻ.

Tìm hiểu thêm:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Agne là một nhà báo đưa tin về các xu hướng và sự phát triển mới nhất trong metaverse, AI và Web3 các ngành công nghiệp cho Metaverse Post. Niềm đam mê kể chuyện đã khiến cô thực hiện nhiều cuộc phỏng vấn với các chuyên gia trong các lĩnh vực này, luôn tìm cách khám phá những câu chuyện thú vị và hấp dẫn. Agne có bằng Cử nhân văn học và có kiến ​​thức sâu rộng về viết về nhiều chủ đề bao gồm du lịch, nghệ thuật và văn hóa. Cô cũng tình nguyện làm biên tập viên cho tổ chức bảo vệ quyền động vật, nơi cô giúp nâng cao nhận thức về các vấn đề phúc lợi động vật. Liên hệ với cô ấy trên [email được bảo vệ].

Xem thêm bài viết
Agne Cimerman
Agne Cimerman

Agne là một nhà báo đưa tin về các xu hướng và sự phát triển mới nhất trong metaverse, AI và Web3 các ngành công nghiệp cho Metaverse Post. Niềm đam mê kể chuyện đã khiến cô thực hiện nhiều cuộc phỏng vấn với các chuyên gia trong các lĩnh vực này, luôn tìm cách khám phá những câu chuyện thú vị và hấp dẫn. Agne có bằng Cử nhân văn học và có kiến ​​thức sâu rộng về viết về nhiều chủ đề bao gồm du lịch, nghệ thuật và văn hóa. Cô cũng tình nguyện làm biên tập viên cho tổ chức bảo vệ quyền động vật, nơi cô giúp nâng cao nhận thức về các vấn đề phúc lợi động vật. Liên hệ với cô ấy trên [email được bảo vệ].

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
Kinh doanh Báo cáo tin tức Công nghệ
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
3 Tháng Năm, 2024
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
thị trường Báo cáo tin tức Công nghệ
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
3 Tháng Năm, 2024
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
thị trường Báo cáo tin tức Công nghệ
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
3 Tháng Năm, 2024
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
Kinh doanh Báo cáo tin tức Công nghệ
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
3 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH