Microsoft는 LLM에게 Harry Potter를 잊도록 강요했습니다.
Microsoft는 방법을 공개했습니다. 학습 데이터를 완전히 재구성하지 않고도 LLM(대형 언어 모델)에 데이터 세트 내의 특정 정보를 잊도록 지시하기 위한 것입니다. 이 방법은 LLM을 개선하고 저작권이 있는 콘텐츠와 관련된 법적 문제를 잠재적으로 해결할 수 있는 새로운 가능성을 열어줍니다.
Microsoft 팀은 최근 그들이 어떻게 만들 수 있었는지 시연했습니다. Llama-2 모델은 모델 훈련 데이터의 다른 데이터나 연구 프로젝트 페이지에 설명된 연구에서 모델의 전반적인 성능에 영향을 주지 않고 해리포터 책의 세부 사항을 잊어버립니다.
이 프로세스는 모델 데이터세트 내에서 잊어버려야 할 특정 정보를 식별하는 것부터 시작됩니다. 이 경우 줄거리 세부 사항, 캐릭터 이름, 유명한 인용문 등 JK Rowling의 상징적 시리즈와 관련된 세부 정보였습니다. 그런 다음 이러한 내용은 일반적이고 관련 없는 문구로 체계적으로 대체되었습니다.
그런 다음 연구자들은 언어 모델을 사용하여 이 일반 데이터를 기반으로 새로운 정보를 생성했습니다. 이 새로운 데이터는 원본 데이터를 재교육하는 데 사용되었습니다. Llama-2 모델 점차적으로. 각 단계마다 모델은 해리포터 책에 대해 질문을 받을 때 환각적인 반응을 보이기 시작할 때까지 해리포터 책과 거리를 두었습니다.
이 접근 방식의 한 가지 눈에 띄는 특징은 모델의 일반적인 성능을 손상시키지 않는다는 것입니다. 이는 LLM이 특정 데이터에 대해 점점 더 잊어버리는 동안 전체적인 언어 기능은 그대로 유지된다는 것을 의미합니다.
이 접근 방식은 여전히 개선되고 있음에도 불구하고 그 의미는 광범위합니다. 특히 법적 청구 및 저작권 문제와 관련된 상황에서는 LLM 및 기타 AI 모델을 만드는 사람들에게 생명선을 제공할 수 있습니다.
이러한 혁신은 AI 모델에 저작권이 있는 콘텐츠를 사용하는 것에 대한 법적 분쟁이 증가하는 시기에 이루어졌습니다. 예를 들어, 뉴욕타임스는 최근 삭제를 요구했다. 그 출판물 중 GPT-4 데이터세트. 성공적인 경우 법적 도전, 개발자는 일반적으로 시간이 많이 걸리고 리소스 집약적인 프로세스인 모델 데이터 세트를 재구성해야 합니다. Microsoft의 방법을 더욱 개선하고 채택한다면 이러한 과제에 대한 효율적인 솔루션을 제공할 수 있습니다.
대규모 언어 모델 내에서 특정 정보를 선택적으로 잊어버리는 Microsoft의 방법(LLM)는 저작권이 있는 콘텐츠 문제를 잠재적으로 해결하고 개선을 간소화하는 AI 개발의 중요한 혁신입니다. 이 접근 방식은 다양한 도메인에 적용되어 책임 있는 AI 개발 및 적용을 입증할 수 있습니다.
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.