Google izdaja nadgrajenega agenta za globoke raziskave z novim API-jem za interakcije za razvijalce
Na kratko
Google je pravkar izdal nadgrajeno različico svojega agenta Deep Research, ki je zdaj na voljo razvijalcem prek novega API-ja Interactions – kmalu pa bo na voljo tudi za potrošnike v storitvah Search, NotebookLM in aplikaciji Gemini.
Tehnološko podjetje google je izjavil, da je izdal bistveno nadgrajeno različico svojega agenta Deep Research, ki je zdaj dostopna razvijalcem prek novega API-ja Interactions, pri čemer je načrtovana razpoložljivost za potrošnike za Search, NotebookLM in aplikacijo Gemini.
Razvijalci lahko prvič integrirajo Googlove najnaprednejše avtonomne raziskovalne zmogljivosti neposredno v svoje aplikacije. Gemini Deep Research je zasnovan za obsežne naloge zbiranja in sinteze informacij, njegov sistem sklepanja pa poganja Gemini 3 Pro, ki je opisan kot doslej najbolj faktografski model podjetja. Usposobljen je bil za zmanjšanje halucinacij ter izboljšanje jasnosti in zanesljivosti kompleksnih poročil. Z razširitvijo večstopenjskega učenja z okrepitvijo za iskanje lahko agent samostojno krmari po zapletenih informacijskih okoljih z izboljšano natančnostjo.
Agent korak za korakom gradi svoj raziskovalni potek dela z ustvarjanjem poizvedb, pregledovanjem rezultatov, identifikacijo manjkajočih informacij in nadaljevanjem postopka, dokler ne zaključi preiskave. Nova izdaja vključuje večje nadgradnje delovanja spletnega iskanja, ki omogočajo globljo navigacijo po spletnih mestih za pridobivanje zelo specifičnih podatkov.
Po navedbah Googla najnovejša različica zagotavlja najsodobnejšo zmogljivost pri Humanity's Last Exam (HLE) in DeepSearchQA, hkrati pa dosega doslej najmočnejše rezultate pri BrowseComp. Optimizirana je za izdelavo dobro raziskanih poročil po bistveno nižjih stroških in bo kmalu integrirana v Google Search, NotebookLM, Google Finance in izboljšano različico aplikacije Gemini.
Zgodnje testiranje že kaže znatne izboljšave na področjih, kjer sta natančnost in podrobno razumevanje konteksta bistvenega pomena. V finančnih storitvah so podjetja začela uporabljati Gemini Deep Research poenostaviti zgodnje faze skrbnega pregleda z združevanjem tržnih kazalnikov, vpogledov v konkurenco in vidikov skladnosti iz javnih in lastniških virov. Zaradi tega je agent dragoceno orodje za investicijske ekipe, ki izvajajo predhodne delovne procese.
V znanstvenem sektorju se sredstvo uporablja za kompleksne raziskave, povezane z varnostjo. Axiom Bio, podjetje, ki razvija sisteme umetne inteligence za napovedovanje toksičnosti zdravil, je poročalo, da je Gemini Deep Research zagotovil poglobljeno začetno analizo in natančnost v biomedicinski literaturi, kar je omogočilo hitrejši napredek raziskovalnih in odkrivalnih procesov.
Razvijalcem, ki gradijo avtomatizirane raziskovalne sisteme, agent Gemini Deep Research ponuja široko funkcionalnost za sintetiziranje informacij in ustvarjanje podrobnih, preverljivih poročil. Podpira enotno analizo uporabniških dokumentov, kot so PDF-ji, CSV-ji in besedilne datoteke, skupaj z javnimi spletnimi viri, tako da združuje nalaganje datotek z orodjem za iskanje datotek.
Učinkovito upravlja obsežen kontekst, kar razvijalcem omogoča, da v poziv vključijo velike količine osnovnega gradiva neposredno. Strukturo izhodnih podatkov je mogoče oblikovati s pozivi, kar omogoča popoln nadzor nad postavitvijo poročila, naslovi in predstavitvijo podatkov. Sistem ponuja podrobne navedbe trditev, kar zagotavlja preglednost glede izvora podatkov, in podpira strukturirane izhodne podatke, vključno s shemami JSON, za poenostavljeno integracijo v nadaljnje aplikacije.
Googlov odprtokodni test DeepSearchQA za izboljšanje zmogljivosti večstopenjskega spletnega raziskovanja
Poleg tega je Google napovedal odprtokodno uporabo novega merila uspešnosti, imenovanega DeepSearchQA, ki je bilo ustvarjeno za oceno učinkovitosti raziskovalnih agentov pri obsežnih, večstopenjskih spletnih preiskavah. DeepSearchQA vključuje 900 ročno izdelanih nalog vzročne verige, ki zajemajo 17 predmetnih področij, pri čemer vsak korak gradi na zaključkih prejšnjega. Namesto da se zanaša na preprosta vprašanja za iskanje dejstev, merilo uspešnosti meri sposobnost agenta, da ustvari popolne in izčrpne nabore odgovorov, kar omogoča oceno tako natančnosti raziskave kot pokritosti iskanja.
DeepSearchQA je namenjen tudi kot diagnostični vir za preučevanje učinkov podaljšanega časa sklepanja. Interno testiranje je pokazalo, da se učinkovitost izboljša, ko imajo agenti več možnosti za izvajanje dodatnih iskanj in ciklov sklepanja, kar je področje, ki ga Google pričakuje, da bo v prihodnjih iteracijah razširil.
Primerjalna gradiva so objavljena z namenom spodbujanja nadaljnjega napredka k bolj zmogljivim raziskovalnim agentom. Razvijalci in raziskovalci lahko pregledajo nabor podatkov, lestvico najboljših in začetni Colab ter preučijo osnovno metodologijo, opisano v priloženem tehničnem poročilu.
Čeprav je področje globokih raziskav že zelo konkurenčno, Googlov posodobljeni agent uvaja opazne izboljšave, ki gradijo na zmogljivostih obstoječega. Gemini 3 modeli. Izdaja pomeni tudi prvo priložnost, da lahko razvijalci to tehnologijo integrirajo neposredno v svoje aplikacije, kar ponuja znatno izboljšanje raziskovalne funkcionalnosti v izdelkih drugih proizvajalcev.
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Alisa, predana novinarka pri MPost, je specializirano za kriptovalute, dokazila brez znanja, naložbe in obsežno področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.
več člankov
Alisa, predana novinarka pri MPost, je specializirano za kriptovalute, dokazila brez znanja, naložbe in obsežno področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.