Novinky Technika
Ledna 04, 2024

JPMorgan vyvíjí generativní jazykový model DocLLM pro analýzu podnikových dokumentů

JPMorgan vyvíjí generativní jazykový model DocLLM pro analýzu podnikových dokumentů

Gigant finančních služeb JPMorgan oznámila představení nového nástroje s názvem DocLLM – a smart jazykový model navrženy tak, aby porozuměly různým typům obchodních dokumentů.

Tyto dokumenty zahrnují formuláře, faktury, zprávy a smlouvy, které často obsahují složité informace v textovém i prostorovém uspořádání, podle uvolněný papír.

Dále uvedl, že na rozdíl od jiných podobných modelů DocLLM nespoléhá na drahé obrazové technologie. Namísto použití nákladné technologie související s obrázky se DocLLM zaměřuje na pochopení struktury dokumentů pomocí identifikace a defining obdélníky (ohraničovací rámečky) kolem důležitých textových segmentů. Tyto ohraničující rámečky slouží jako vodítko pro model k rozpoznání a analýze obsahu v těchto konkrétních oblastech.

Model má jedinečnou funkci nazvanou „rozvolněná prostorová pozornost“ – což znamená, že model může efektivně věnovat pozornost a samostatně zpracovávat informace v rámci těchto načrtnutých oblastí, čímž mu pomáhá porozumět vztahu mezi textem a rozložením v dokumentu.  

DocLLM je zvláště dobrý při práci s dokumenty s nepravidelným rozvržením a různými typy obsahu. Během školení se naučí doplňovat chybějící části textu, takže je efektivní při práci s různými strukturami dokumentů.

DocLLM pro řešení stávajících problémů s obchodními dokumenty

V oblasti podnikových datových sad hrají podstatnou roli dokumenty se složitým uspořádáním, jako jsou faktury, účtenky, smlouvy, objednávky a formuláře. Automatická interpretace a analýza těchto vizuálně složitých dokumentů nabízí významné výhody, které vedou k rozvoji Řešení řízená umělou inteligencí.

Navzdory značnému pokroku, kterého dosáhla AI dokumentů (DocAI) v úkolech, jako je extrakce, klasifikace a odpovídání na otázky, přetrvávají problémy v aplikacích v reálném světě. Existuje mezera ve výkonu, zejména pokud jde o přesnost, spolehlivost, porozumění kontextu a schopnost zobecnit na neznámé domény.

Za tímto účelem JPMorgan přichází s DocLLM. Podle zveřejněného dokumentu použila JPMorgan k trénování DocLLM data ze dvou hlavních zdrojů: IIT-CDIP Test Collection 1.0 a DocBank. První datový soubor obsahuje více než 5 milionů právních dokumentů souvisejících s tabákovým průmyslem v 1990. letech a druhý obsahuje 500,000 XNUMX dokumentů s odlišným uspořádáním.

Testy ukazují, že DocLLM funguje lépe než jiné podobné modely v různých úlohách souvisejících s dokumenty. Převyšuje ekvivalentní modely ve 14 z 16 datových sad a prokazuje svou přizpůsobivost ve 4 z 5 nových nastavení.

Do budoucna plánuje společnost JPMorgan zlepšit DocLLM začleněním funkcí souvisejících s viděním v odlehčeném provedení s cílem ještě více vylepšit jeho schopnosti.

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.

Další články
Kumar Gandharv
Kumar Gandharv

Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

Od zvlnění k velké zelené DAO: Jak kryptoměnové projekty přispívají k charitě

Pojďme prozkoumat iniciativy využívající potenciál digitálních měn pro charitativní účely.

Vědět více

AlphaFold 3, Med-Gemini a další: The Way AI Transforms Healthcare in 2024

Umělá inteligence se ve zdravotnictví projevuje různými způsoby, od odhalování nových genetických korelací až po posílení robotických chirurgických systémů...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Crypto Exchange Jupiter představí Jupiter Swap V3, Dynamic Slippage, mezi další klíčové aktualizace v nadcházejících týdnech
Trhy Novinky Technika
Crypto Exchange Jupiter představí Jupiter Swap V3, Dynamic Slippage, mezi další klíčové aktualizace v nadcházejících týdnech
Června 14, 2024
Polygon debutuje ve svém Governance Hub a poskytuje jednotné transparentní rozhraní pro komunitní správu
Novinky Technika
Polygon debutuje ve svém Governance Hub a poskytuje jednotné transparentní rozhraní pro komunitní správu 
Června 14, 2024
Binance registruje více než 30 milionů nových uživatelů V roce 2024 překonala aktiva zákazníků milník 100 miliard USD
Trhy Novinky Technika
Binance registruje více než 30 milionů nových uživatelů V roce 2024 překonala aktiva zákazníků milník 100 miliard USD
Června 14, 2024
Amazon podporuje generativní spouštění AI s investicí 230 milionů dolarů, přiděluje 80 milionů dolarů svému druhému programu AWS Generative AI Accelerator
Business Novinky Technika
Amazon podporuje generativní spouštění AI s investicí 230 milionů dolarů, přiděluje 80 milionů dolarů svému druhému programu AWS Generative AI Accelerator
Června 14, 2024
CRYPTOMERIA LABS PTE. LTD.