뉴스 보도 Technology
2023 년 10 월 10 일

Microsoft는 LLM에게 Harry Potter를 잊도록 강요했습니다.

Microsoft는 LLM에게 Harry Potter를 잊도록 강요했습니다.
출처: Dall-E 3

Microsoft는 방법을 공개했습니다. 학습 데이터를 완전히 재구성하지 않고도 LLM(대형 언어 모델)에 데이터 세트 내의 특정 정보를 잊도록 지시하기 위한 것입니다. 이 방법은 LLM을 개선하고 저작권이 있는 콘텐츠와 관련된 법적 문제를 잠재적으로 해결할 수 있는 새로운 가능성을 열어줍니다.

Microsoft 팀은 최근 그들이 어떻게 만들 수 있었는지 시연했습니다. Llama-2 모델은 모델 훈련 데이터의 다른 데이터나 연구 프로젝트 페이지에 설명된 연구에서 모델의 전반적인 성능에 영향을 주지 않고 해리포터 책의 세부 사항을 잊어버립니다.

이 프로세스는 모델 데이터세트 내에서 잊어버려야 할 특정 정보를 식별하는 것부터 시작됩니다. 이 경우 줄거리 세부 사항, 캐릭터 이름, 유명한 인용문 등 JK Rowling의 상징적 시리즈와 관련된 세부 정보였습니다. 그런 다음 이러한 내용은 일반적이고 관련 없는 문구로 체계적으로 대체되었습니다.

그런 다음 연구자들은 언어 모델을 사용하여 이 일반 데이터를 기반으로 새로운 정보를 생성했습니다. 이 새로운 데이터는 원본 데이터를 재교육하는 데 사용되었습니다. Llama-2 모델 점차적으로. 각 단계마다 모델은 해리포터 책에 대해 질문을 받을 때 환각적인 반응을 보이기 시작할 때까지 해리포터 책과 거리를 두었습니다.

이 접근 방식의 한 가지 눈에 띄는 특징은 모델의 일반적인 성능을 손상시키지 않는다는 것입니다. 이는 LLM이 특정 데이터에 대해 점점 더 잊어버리는 동안 전체적인 언어 기능은 그대로 유지된다는 것을 의미합니다.

이 접근 방식은 여전히 ​​개선되고 있음에도 불구하고 그 의미는 광범위합니다. 특히 법적 청구 및 저작권 문제와 관련된 상황에서는 LLM 및 기타 AI 모델을 만드는 사람들에게 생명선을 제공할 수 있습니다.

이러한 혁신은 AI 모델에 저작권이 있는 콘텐츠를 사용하는 것에 대한 법적 분쟁이 증가하는 시기에 이루어졌습니다. 예를 들어, 뉴욕타임스는 최근 삭제를 요구했다. 그 출판물 중 GPT-4 데이터세트. 성공적인 경우 법적 도전, 개발자는 일반적으로 시간이 많이 걸리고 리소스 집약적인 프로세스인 모델 데이터 세트를 재구성해야 합니다. Microsoft의 방법을 더욱 개선하고 채택한다면 이러한 과제에 대한 효율적인 솔루션을 제공할 수 있습니다.

대규모 언어 모델 내에서 특정 정보를 선택적으로 잊어버리는 Microsoft의 방법(LLM)는 저작권이 있는 콘텐츠 문제를 잠재적으로 해결하고 개선을 간소화하는 AI 개발의 중요한 혁신입니다. 이 접근 방식은 다양한 도메인에 적용되어 책임 있는 AI 개발 및 적용을 입증할 수 있습니다.

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Espresso Systems, 롤업 상호 운용성 향상을 위해 AggLayer 개발을 위해 Polygon Lab과 협력
근무지에서 발생 뉴스 보도 Technology
Espresso Systems, 롤업 상호 운용성 향상을 위해 AggLayer 개발을 위해 Polygon Lab과 협력
2024 년 5 월 9 일
ZKP 기반 인프라 프로토콜 ZKBase, 로드맵 공개, 5월 테스트넷 출시 계획
뉴스 보도 Technology
ZKP 기반 인프라 프로토콜 ZKBase, 로드맵 공개, 5월 테스트넷 출시 계획
2024 년 5 월 9 일
BLOCKCHANCE와 CONF3RENCE가 독일 최대 규모를 위해 통합되었습니다. Web3 도르트문트 회의
근무지에서 발생 시장 소프트웨어 이야기와 리뷰 Technology
BLOCKCHANCE와 CONF3RENCE가 독일 최대 규모를 위해 통합되었습니다. Web3 도르트문트 회의
2024 년 5 월 9 일
NuLink가 Bybit에서 출시되었습니다 Web3 IDO 플랫폼. 구독 기간이 13월 XNUMX일까지 연장됩니다
시장 뉴스 보도 Technology
NuLink가 Bybit에서 출시되었습니다 Web3 IDO 플랫폼. 구독 기간이 13월 XNUMX일까지 연장됩니다
2024 년 5 월 9 일
CRYPTOMERIA LABS PTE. LTD.