뉴스 보도 Technology
2022 년 11 월 17 일

Google은 뉴스 기사를 설명하기 위해 AI 모델을 도입했습니다.

요컨대

Google, 뉴스 기사의 고품질 시각적 요약 생성을 위한 새로운 AI 모델 발표

Google은이 발표 뉴스 기사의 "일관되고 유창한" 시각적 요약을 자동으로 생성할 수 있는 새로운 인공 지능(AI) 모델입니다. 이 거대 기술 기업은 이 모델이 생성 긴 텍스트의 "고품질" 시각적 요약.

Google은 뉴스 기사를 설명하기 위해 AI 모델을 도입했습니다.
에 의해 만들어진 이미지 Stable Diffusion

이 모델은 문장의 맥락을 "이해"한 다음 원본 텍스트의 중요한 정보를 유지하는 일러스트레이션을 생성하도록 설계된 변환기로 알려진 딥 러닝 알고리즘을 기반으로 합니다.

Google은 현재 대중적인 텍스트를 이미지로 "내가 본 것은 내가 그리는 것" 원칙의 "정면" 묘사를 기반으로 하는 시스템입니다. 또한 개별 진술과 문구가 아닌 "전체로서의 그림"을 만들기 위해 이미지를 선택합니다(실제로 모든 사람이 지금 하고 있는 것처럼). 즉, 문맥과 의미를 염두에 두고 전체 기사에 대해 그림을 선택합니다.

Google은 이 모델이 뉴스 기사에서 여러 문장의 요약을 생성할 수 있으며 대규모 데이터 세트에서 학습 약 31만 개의 기사, 22만 개의 사진, 덤불 속에 숨겨진 1만 개의 동영상이 포함된 NewsStories.

이 프로젝트에서 우리는 이미지 모음과 함께 긴 텍스트인 시각적 요약을 만드는 완전히 새로운 도전에 도전하고 있습니다. 두 개의 MIL(Multiple Instance Learning) 하위 작업을 마스터함으로써 목표는 각 기사와 입력 사진 간의 의미론적 유사성을 최대화하는 것입니다.

첫 번째 단계는 언어와 이미지 인코더를 모두 사용하여 적절한 표현으로 번역된 후 이미지를 전체 기사와 일치시키는 것입니다.

두 번째 단계에서는 텍스트 기사를 별도의 문장으로 나누고 각 문장을 다른 표현으로 인코딩하는 작업이 수반됩니다. 목표는 상호 정보를 최적화하는 것입니다. defi이미지와 텍스트 시퀀스 사이의 확률 분포 측면에서 설명됩니다. 그 결과 최고의 정밀도를 얻었습니다.

Google은 뉴스 기사를 설명하기 위해 AI 모델을 도입했습니다.
에 의해 만들어진 이미지 Stable Diffusion

결론적으로 이 연구는 자동화된 내러티브 일러스트레이션과 같은 응용 프로그램에서 스토리와 일러스트레이션 컬렉션을 일치시키는 어려운 작업에 이르기까지 다양한 기여를 합니다. 회사에서는 말한다. 모델 다른 언어에도 적용할 수 있으며 다른 사이트의 기사를 포함하도록 데이터 세트를 확장하는 작업을 하고 있습니다.

더 많은 관련 기사 읽기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
근무지에서 발생 뉴스 보도 Technology
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
2024 년 5 월 3 일
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
시장 뉴스 보도 Technology
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
2024 년 5 월 3 일
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
시장 뉴스 보도 Technology
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
2024 년 5 월 3 일
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
근무지에서 발생 뉴스 보도 Technology
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
2024 년 5 월 3 일
CRYPTOMERIA LABS PTE. LTD.