Meta predstavuje hlasové konverzácie s umelou inteligenciou poháňané Muse Spark, vizuálnou inteligenciou v reálnom čase a multimodálnymi odpoveďami
Stručne
Spoločnosť Meta zavádza Muse Spark AI s hlasovými konverzáciami, vizuálnou interakciou v reálnom čase, nákupnými nástrojmi a multimodálnym uvažovaním naprieč aplikáciami a nositeľnými zariadeniami, čím rozširuje možnosti inteligentných asistentov naprieč platformami.

Technologická spoločnosť meta oznámila spustenie nových hlasových konverzácií s umelou inteligenciou, ktoré využíva systém Muse Spark. Ide o systém navrhnutý tak, aby umožňoval prirodzenejšiu interakciu s umelou inteligenciou Meta vrátane možnosti prerušovať odpovede, meniť témy počas konverzácie a plynule prepínať medzi jazykmi. Aktualizované rozhranie tiež umožňuje asistentovi generovať obrázky počas dialógu a zobrazovať kontextové odporúčania čerpané zo služieb, ako sú Reels, mapy a ďalšie integrované platformy Meta.
Popri vylepšeniach hlasovej interakcie spoločnosť zavádza do svojich aplikácií aj funkcie živej umelej inteligencie, čím rozširuje funkcionalitu, ktorá je už dostupná v okuliaroch s umelou inteligenciou. Táto funkcia umožňuje používateľom aktivovať kameru zariadenia a interagovať s Meta AI v reálnom čase, klásť otázky o objektoch, prostrediach alebo miestach priamo v ich zornom poli. Systém je navrhnutý tak, aby poskytoval kontextové pochopenie fyzického okolia, či už ide o identifikáciu orientačných bodov, pomoc s domácimi prácami alebo interpretáciu vizuálnych informácií na požiadanie.
Zavedená bola aj nová sada funkcií súvisiacich s nakupovaním. V režime nakupovania dokáže Meta AI teraz vyhľadávať v ponukách na Facebook Marketplace v kombinácii so širšími internetovými výsledkami, pričom v jednom rozhraní zobrazuje použité aj nové položky. Výsledky sa zobrazujú spolu s mapou zobrazujúcou umiestnenie položiek s ďalšími možnosťami filtrovania na základe ceny, štýlu a vzdialenosti. Asistent tiež podporuje priame odkazy na konkrétne značky alebo tvorcov, čo používateľom umožňuje prehliadať verejné obsahové kanály a zoznamy produktov v štruktúrovanej mriežke.
Muse Spark sa postupne nasadzuje v celom hardvérovom ekosystéme spoločnosti Meta vrátane okuliarov Ray-Ban Meta a Oakley Meta v Spojených štátoch a Kanade, pričom v nasledujúcich mesiacoch sa plánuje ďalšie rozšírenie pre zariadenia Meta Ray-Ban Display. Model sa tiež integruje do softvérových platforiem spoločnosti Meta vrátane WhatsApp, Instagram, Facebook, Messenger a Threads, kde sa zobrazuje vo vyhľadávacích funkciách, skupinových chatoch, príspevkoch a iných interakčných bodoch.
Medzi ďalšie experimentálne funkcie patria „bočné chaty“, ktoré umožňujú používateľom prístup k Meta AI zvnútra skupinových konverzácií a generovanie súkromných, kontextovo orientovaných odpovedí na základe prebiehajúcich diskusií, ako aj zmienky o @meta.ai v rámci príspevkov a odpovedí vo Vláknach. Tieto integrácie majú rozšíriť pomoc AI v komunikačných a sociálnych prostrediach.
Meta posúva Muse Spark do pozície multimodálneho systému umelej inteligencie novej generácie
Predstavenie Muse Spark nasleduje po širšom vývoji infraštruktúry umelej inteligencie spoločnosti Meta, ktorá je opísaná ako súčasť novej generácie rozsiahlych jazykových modelov vyvinutých spoločnosťou Meta Superintelligence Labs. Model je prvý v sérii navrhnutej na postupné škálovanie s dôrazom na uvažovanie, multimodálne porozumenie a koordináciu úloh. Hoci bol v pôvodnej podobe opísaný ako kompaktný a rýchly, je určený na podporu zložitých úloh uvažovania v oblasti vedy, matematiky, zdravotníctva a každodenného riešenia problémov.
Meta AI bola tiež aktualizovaná, aby podporovala viacero režimov uvažovania, čo umožňuje systému prispôsobiť sa v závislosti od zložitosti úlohy. Architektúra dokáže paralelne nasadiť viacero subagentov, pričom každý z nich spracováva rôzne komponenty dotazu, ako je plánovanie, porovnávanie alebo syntéza výskumu, s cieľom zlepšiť hĺbku a efektivitu odpovede.
Multimodálne možnosti systému mu umožňujú spracovávať vizuálne vstupy spolu s textom, čo umožňuje funkcie, ako je identifikácia objektov na obrázkoch, analýza porovnaní produktov a interpretácia scén v reálnom čase. Zavedené boli aj rozšírené aplikácie v oblasti zdravotníckych dotazov, vyvinuté v spolupráci so zdravotníckymi odborníkmi s cieľom zlepšiť kvalitu informačných odpovedí, najmä ak ide o vizuálne údaje.
Muse Spark navyše podporuje funkcie vizuálneho kódovania, ktoré umožňujú používateľom generovať interaktívne nástroje, ako sú webové stránky, dashboardy a jednoduché hry priamo z výziev. Systém dokáže tiež integrovať kontextový obsah z ekosystému Meta, vrátane príspevkov, Reelov a komunitných diskusií, aby obohatil odpovede o relevantnosť pre reálny svet.
Spoločnosť Meta uviedla, že ďalšie zavádzanie vylepšeného prostredia umelej inteligencie bude pokračovať vo všetkých regiónoch a na rôznych platformách, pričom sa plánuje rozšírená dostupnosť jej aplikácií a nositeľných zariadení. Spoločnosť tiež uviedla, že vybrané komponenty technológie budú sprístupnené prostredníctvom prístupu k rozhraniu API v súkromnej ukážke a že budúce verzie môžu byť open-source.
Disclaimer
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Alisa, oddaná novinárka v MPost, špecializuje sa na kryptomeny, umelú inteligenciu, investície a rozsiahlu oblasť Web3. So záujmom o nové trendy a technológie poskytuje komplexné pokrytie s cieľom informovať a zapojiť čitateľov do neustále sa vyvíjajúceho prostredia digitálnych financií.
Ďalšie články
Alisa, oddaná novinárka v MPost, špecializuje sa na kryptomeny, umelú inteligenciu, investície a rozsiahlu oblasť Web3. So záujmom o nové trendy a technológie poskytuje komplexné pokrytie s cieľom informovať a zapojiť čitateľov do neustále sa vyvíjajúceho prostredia digitálnych financií.



