Báo cáo tin tức Công nghệ
Tháng Mười Một 17, 2022

Google giới thiệu mô hình AI minh họa tin bài

Tóm lại

Google công bố mô hình AI mới để tạo ra các bản tóm tắt trực quan chất lượng cao cho các bài báo

Google có công bố một mô hình trí tuệ nhân tạo (AI) mới mà nó cho biết có thể tự động tạo ra các bản tóm tắt trực quan “mạch lạc và trôi chảy” của các bài báo. Gã khổng lồ công nghệ cho biết mô hình này có thể giúp người dùng dễ tiếp cận thông tin hơn bằng cách tạo ra tóm tắt trực quan “chất lượng cao” của các đoạn văn bản dài.

Google giới thiệu mô hình AI minh họa tin bài
Hình ảnh được tạo bởi Stable Diffusion

Mô hình này dựa trên một thuật toán học sâu được gọi là máy biến áp, được thiết kế để “hiểu” ngữ cảnh của một câu và sau đó tạo ra một hình minh họa giữ lại thông tin quan trọng từ văn bản gốc.

Google hoàn thành nhiệm vụ khó khăn hơn nhiều là hiểu ngữ cảnh tổng thể của toàn bộ văn bản, trái ngược với cách phổ biến hiện nay chuyển văn bản thành hình ảnh các hệ thống, dựa trên mô tả “trực diện” của nguyên tắc “tôi thấy gì, tôi vẽ gì”. Ngoài ra, việc lựa chọn hình ảnh được thực hiện để tạo ra một “bức tranh tổng thể” thay vì các câu và cụm từ riêng lẻ (như thực tế mọi người đang làm hiện nay). Nói cách khác, hình ảnh được chọn cho toàn bộ bài viết trong khi ghi nhớ ngữ cảnh và ý nghĩa.

Google cho biết mô hình này có thể tạo ra các bản tóm tắt của nhiều câu từ một bài báo và nó đã được được đào tạo trên một tập dữ liệu lớn NewsStories, chứa gần 31 triệu bài báo, 22 triệu bức ảnh và 1 triệu video ẩn trong bụi rậm.

Trong dự án này, chúng tôi đang thực hiện một thử thách hoàn toàn mới: tạo bản tóm tắt trực quan, là những văn bản dài hơn kèm theo một bộ sưu tập hình ảnh. Bằng cách thành thạo hai nhiệm vụ phụ MIL (Học nhiều trường hợp), mục đích là để tối đa hóa sự giống nhau về ngữ nghĩa giữa mỗi bài viết và ảnh đầu vào.

Bước đầu tiên là khớp hình ảnh với bài viết hoàn chỉnh sau khi nó đã được dịch sang dạng trình bày thích hợp bằng cách sử dụng cả bộ mã hóa ngôn ngữ và hình ảnh.

Bước thứ hai đòi hỏi phải chia một bài báo văn bản thành các câu riêng biệt và mã hóa từng câu thành một cách biểu diễn khác nhau. Mục tiêu là để tối ưu hóa thông tin lẫn nhau, defixét về mặt phân phối xác suất, giữa các chuỗi hình ảnh và văn bản. Kết quả là độ chính xác lớn nhất đã thu được.

Google giới thiệu mô hình AI minh họa tin bài
Hình ảnh được tạo bởi Stable Diffusion

Tóm lại, nghiên cứu này có nhiều đóng góp khác nhau, từ các ứng dụng như minh họa tường thuật tự động cho đến nhiệm vụ đầy thách thức là khớp một câu chuyện và một bộ sưu tập các hình minh họa. Công ty cho biết kiểu mẫu cũng có thể được áp dụng cho các ngôn ngữ khác và nó đang nỗ lực mở rộng bộ dữ liệu để bao gồm các bài báo từ các trang web khác.

Đọc thêm bài viết liên quan:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Hot Stories
Tham gia bản tin của chúng tôi.
Tin mới nhất

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Binance ngừng hỗ trợ các sản phẩm và dịch vụ BIDR, khuyên người dùng chuyển đổi tiền trước ngày 20 tháng XNUMX
thị trường Báo cáo tin tức Công nghệ
Binance ngừng hỗ trợ các sản phẩm và dịch vụ BIDR, khuyên người dùng chuyển đổi tiền trước ngày 20 tháng XNUMX
6 Tháng Năm, 2024
Vi phạm bảo mật tấn công GNUS.AI của Hệ sinh thái Fantom, dẫn đến thiệt hại 1.27 triệu USD
thị trường Báo cáo tin tức Công nghệ
Vi phạm bảo mật tấn công GNUS.AI của Hệ sinh thái Fantom, dẫn đến thiệt hại 1.27 triệu USD
6 Tháng Năm, 2024
Đột phá về tiền điện tử tháng 2024 năm XNUMX: Chiến thắng của Bitgert Coin
Báo cáo tin tức
Đột phá về tiền điện tử tháng 2024 năm XNUMX: Chiến thắng của Bitgert Coin
6 Tháng Năm, 2024
Mạng Bitcoin vượt qua 1 tỷ giao dịch sau XNUMX năm ra mắt
thị trường Báo cáo tin tức Công nghệ
Mạng Bitcoin vượt qua 1 tỷ giao dịch sau XNUMX năm ra mắt
6 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH