Google випускає оновлений агент глибокого дослідження з новим API взаємодій для розробників
Коротко
Google щойно випустив оновлену версію свого агента Deep Research, яка тепер доступна розробникам через новий Interactions API, а споживчі версії незабаром з’являться в Search, NotebookLM та додатку Gemini.
Технологічна компанія Google заявила про випуск суттєво оновленої версії свого агента Deep Research, який тепер доступний розробникам через новий Interactions API, а також планується, що він стане доступним для споживачів у Search, NotebookLM та застосунку Gemini.
Розробники вперше можуть інтегрувати найсучасніші автономні дослідницькі можливості Google безпосередньо у власні програми. Gemini Deep Research розроблено для розширеного збору та синтезу інформації, а його система міркувань працює на базі Gemini 3 Pro, яку називають найфактичнішою моделлю компанії на сьогоднішній день. Вона навчена зменшувати галюцинації та підвищувати чіткість і надійність складних звітів. Розширюючи багатоетапне навчання з підкріпленням для пошуку, агент може самостійно орієнтуватися в складних інформаційних середовищах з підвищеною точністю.
Агент крок за кроком будує свій дослідницький процес, генеруючи запити, переглядаючи результати, визначаючи відсутню інформацію та продовжуючи процес, доки не завершить розслідування. Новий реліз включає значні покращення продуктивності веб-пошуку, що дозволяє глибшу навігацію по веб-сайтах для отримання вузькоспецифічних даних.
За даними Google, остання версія забезпечує найсучаснішу продуктивність у Humanity's Last Exam (HLE) та DeepSearchQA, а також досягає найвищих результатів на сьогоднішній день у BrowseComp. Вона оптимізована для створення добре досліджених звітів за значно нижчою вартістю та незабаром буде інтегрована в Google Search, NotebookLM, Google Finance та покращену версію програми Gemini.
Ранні випробування вже показують суттєві успіхи в галузях, де точність та детальне контекстуальне розуміння є важливими. У сфері фінансових послуг компанії почали використовувати Gemini Deep Research оптимізувати ранні етапи комплексної перевірки шляхом агрегування ринкових показників, інформації про конкурентів та міркувань щодо дотримання вимог як з публічних, так і з власних джерел. Це зробило агента цінним інструментом для інвестиційних команд, які проводять попередні робочі процеси.
У науковому секторі цей агент застосовується для складних досліджень, пов'язаних з безпекою. Axiom Bio, компанія, що розробляє системи штучного інтелекту для прогнозування токсичності ліків, повідомила, що Gemini Deep Research забезпечила глибину початкового аналізу та точність у біомедичній літературі, що дозволило її дослідницьким та відкриттям просуватися швидше.
Для розробників, які створюють автоматизовані дослідницькі системи, агент Gemini Deep Research пропонує широкий функціонал для синтезу інформації та створення детальних, перевірених звітів. Він підтримує уніфікований аналіз користувацьких документів, таких як PDF-файли, CSV-файли та текстові файли, разом із загальнодоступними веб-джерелами, поєднуючи завантаження файлів з інструментом пошуку файлів.
Він ефективно керує широким контекстом, дозволяючи розробникам включати великі обсяги довідкового матеріалу безпосередньо в підказку. Структуру виводу можна формувати за допомогою підказок, що забезпечує повний контроль над макетом звіту, заголовками та представленням даних. Система надає детальні цитати для тверджень, забезпечуючи прозорість щодо походження даних, та підтримує структуровані виводи, включаючи схеми JSON, для спрощеної інтеграції в наступні програми.
Тест Google Open-Sources DeepSearchQA для покращення можливостей багатоетапного веб-дослідження
Крім того, Google оголосив про відкритий вихід нового бенчмарку під назвою DeepSearchQA, створеного для оцінки ефективності дослідницьких агентів, які виконують комплексні, багатоетапні веб-запити. DeepSearchQA включає 900 вручну побудованих завдань причинно-наслідкового ланцюжка, що охоплюють 17 предметних областей, причому кожен крок базується на висновках попереднього. Замість того, щоб покладатися на прості питання для пошуку фактів, бенчмарк вимірює здатність агента створювати повні та вичерпні набори відповідей, що дозволяє оцінити як точність дослідження, так і охоплення пошуку.
DeepSearchQA також призначений як діагностичний ресурс для вивчення впливу тривалого часу міркування. Внутрішнє тестування показало, що продуктивність покращується, коли агентам надається більше можливостей для виконання додаткових пошуків та циклів міркування, і Google планує розширити цю область у майбутніх ітераціях.
Матеріали для порівняння публікуються для заохочення подальшого прогресу в напрямку створення більш потужних дослідницьких агентів. Розробники та дослідники можуть переглянути набір даних, таблицю лідерів та стартовий Colab, а також вивчити базову методологію, описану в супровідному технічному звіті.
Хоча ринок глибоких досліджень вже є дуже конкурентним, оновлений агент Google впроваджує помітні покращення, що базуються на можливостях існуючого... Gemini 3 моделі. Цей реліз також знаменує собою перший випадок, коли розробники можуть інтегрувати цю технологію безпосередньо у власні програми, що значно покращує функціональність досліджень у продуктах сторонніх виробників.
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Аліса, відданий журналіст на MPost, спеціалізується на криптовалюті, доказах з нульовим знанням, інвестиціях і великій сфері Web3. З гострим поглядом на нові тенденції та технології, вона надає всебічне висвітлення, щоб інформувати та залучати читачів до постійно змінюваного ландшафту цифрових фінансів.
інші статті
Аліса, відданий журналіст на MPost, спеціалізується на криптовалюті, доказах з нульовим знанням, інвестиціях і великій сфері Web3. З гострим поглядом на нові тенденції та технології, вона надає всебічне висвітлення, щоб інформувати та залучати читачів до постійно змінюваного ландшафту цифрових фінансів.