Google udostępnia ulepszoną wersję agenta Deep Research z nowym interfejsem API interakcji dla programistów
W skrócie
Firma Google właśnie wydała ulepszoną wersję swojego agenta Deep Research, dostępną teraz dla deweloperów za pośrednictwem nowego interfejsu API Interactions. Wkrótce wersja konsumencka zostanie wdrożona w aplikacjach Search, NotebookLM i Gemini.
Firma technologiczna Google poinformowała o wydaniu znacząco ulepszonej wersji swojego agenta Deep Research, który jest teraz dostępny dla deweloperów za pośrednictwem nowego interfejsu API Interactions, a jego dostępność dla konsumentów planowana jest dla aplikacji Search, NotebookLM i Gemini.
Po raz pierwszy programiści mogą zintegrować najbardziej zaawansowane, autonomiczne funkcje badawcze Google bezpośrednio z własnymi aplikacjami. Gemini Deep Research zostało zaprojektowane z myślą o rozszerzonych zadaniach gromadzenia i syntezy informacji, a jego system wnioskowania opiera się na Gemini 3 Pro, opisywanym jako najbardziej oparty na faktach model firmy. Został on wyszkolony w celu redukcji halucynacji oraz zwiększenia przejrzystości i wiarygodności złożonych raportów. Dzięki rozszerzeniu wieloetapowego uczenia się przez wzmacnianie w wyszukiwaniu, agent może samodzielnie poruszać się po złożonych środowiskach informacyjnych z większą dokładnością.
Agent krok po kroku konstruuje swój proces badawczy, generując zapytania, przeglądając wyniki, identyfikując brakujące informacje i kontynuując proces aż do zakończenia badania. Nowa wersja zawiera istotne ulepszenia wydajności wyszukiwania internetowego, umożliwiające głębszą nawigację po stronach internetowych w celu wyodrębnienia bardzo szczegółowych danych.
Według Google, najnowsza wersja zapewnia najwyższą wydajność w testach Humanity's Last Exam (HLE) i DeepSearchQA, a jednocześnie osiąga najlepsze jak dotąd wyniki w BrowseComp. Jest zoptymalizowana pod kątem generowania rzetelnych raportów przy znacznie niższych kosztach i wkrótce zostanie zintegrowana z wyszukiwarką Google, NotebookLM, Google Finance oraz ulepszoną wersją aplikacji Gemini.
Wczesne testy już wykazują znaczące korzyści w obszarach, w których dokładność i szczegółowe zrozumienie kontekstu są niezbędne. W sektorze usług finansowych firmy zaczęły korzystać z Głębokie badania Bliźniąt Usprawnienie wczesnych faz due diligence poprzez agregację wskaźników rynkowych, spostrzeżeń dotyczących konkurencji i kwestii zgodności z przepisami, pochodzących zarówno ze źródeł publicznych, jak i zastrzeżonych. Dzięki temu agent stał się cennym narzędziem dla zespołów inwestycyjnych przeprowadzających wstępne procesy.
W sektorze naukowym agent jest stosowany w złożonych badaniach związanych z bezpieczeństwem. Axiom Bio, firma opracowująca systemy sztucznej inteligencji do przewidywania toksyczności leków, poinformowała, że Gemini Deep Research zapewniło dogłębną wstępną analizę i precyzję w zakresie literatury biomedycznej, co pozwoliło na szybszy postęp w procesach badawczych i odkrywczych.
Dla programistów tworzących zautomatyzowane systemy badawcze agent Gemini Deep Research oferuje szeroką funkcjonalność w zakresie syntezy informacji i generowania szczegółowych, weryfikowalnych raportów. Obsługuje ujednoliconą analizę dokumentów użytkownika, takich jak pliki PDF, CSV i pliki tekstowe, a także publicznych źródeł internetowych, łącząc funkcję przesyłania plików z narzędziem wyszukiwania plików.
Skutecznie zarządza rozbudowanym kontekstem, umożliwiając programistom dodawanie obszernych informacji bezpośrednio do komunikatu. Strukturę wyników można kształtować za pomocą komunikatów, co zapewnia pełną kontrolę nad układem raportu, nagłówkami i prezentacją danych. System zapewnia szczegółowe cytowania roszczeń, zapewniając przejrzystość w zakresie pochodzenia danych, oraz obsługuje ustrukturyzowane wyniki, w tym schematy JSON, co usprawnia integrację z aplikacjami niższego szczebla.
Google udostępnia kod źródłowy narzędzia DeepSearchQA Benchmark, aby usprawnić możliwości wieloetapowego badania sieci
Ponadto Google ogłosiło udostępnienie nowego benchmarku o nazwie DeepSearchQA, stworzonego w celu oceny skuteczności agentów badawczych w obsłudze kompleksowych, wieloetapowych zapytań internetowych. DeepSearchQA obejmuje 900 ręcznie skonstruowanych zadań opartych na łańcuchu przyczynowo-skutkowym, obejmujących 17 obszarów tematycznych, przy czym każdy etap bazuje na wnioskach z poprzedniego. Zamiast opierać się na prostych pytaniach dotyczących wyszukiwania faktów, benchmark mierzy zdolność agenta do generowania kompletnych i wyczerpujących zestawów odpowiedzi, umożliwiając ocenę zarówno dokładności badań, jak i zasięgu wyszukiwania.
DeepSearchQA ma również służyć jako narzędzie diagnostyczne do badania wpływu wydłużonego czasu rozumowania. Testy wewnętrzne wykazały, że wydajność poprawia się, gdy agenci mają więcej możliwości przeprowadzania dodatkowych wyszukiwań i cykli rozumowania, a Google planuje rozszerzyć ten obszar w przyszłych iteracjach.
Materiały testowe są publikowane, aby zachęcić do dalszego rozwoju w kierunku bardziej wydajnych agentów badawczych. Deweloperzy i badacze mogą zapoznać się ze zbiorem danych, rankingiem liderów i platformą Colab, a także z metodologią opisaną w załączonym raporcie technicznym.
Chociaż środowisko Deep Research jest już bardzo konkurencyjne, zaktualizowany agent Google wprowadza znaczące udoskonalenia, które bazują na możliwościach istniejącego Gemini 3 modele. To wydanie oznacza również, że po raz pierwszy deweloperzy mogą zintegrować tę technologię bezpośrednio z własnymi aplikacjami, co znacząco usprawnia funkcjonalność badawczą w produktach innych firm.
Zastrzeżenie
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Alisa, oddana dziennikarka w MPost, specjalizuje się w kryptowalutach, dowodach wiedzy zerowej, inwestycjach i ekspansywnej dziedzinie Web3. Ze szczególnym uwzględnieniem pojawiających się trendów i technologii zapewnia wszechstronne informacje, aby informować czytelników i angażować ich w stale zmieniający się krajobraz finansów cyfrowych.
Więcej artykułów
Alisa, oddana dziennikarka w MPost, specjalizuje się w kryptowalutach, dowodach wiedzy zerowej, inwestycjach i ekspansywnej dziedzinie Web3. Ze szczególnym uwzględnieniem pojawiających się trendów i technologii zapewnia wszechstronne informacje, aby informować czytelników i angażować ich w stale zmieniający się krajobraz finansów cyfrowych.