Nieuwsverslag Technologie
08 maart 2024

RagaAI lanceert open-source LLM-hub om de evaluatie en veiligheid van taalmodellen te vergemakkelijken

In het kort

RagaAI lanceerde 'RagaAI LLM Hub', een open-sourceplatform voor het evalueren en opzetten van vangrails voor AI-specifieke taalmodellen.

RagaAI lanceert open-source LLM-hub om de evaluatie en veiligheid van taalmodellen te vergemakkelijken

AI-testplatform Raga AI heeft onlangs de lancering aangekondigd van “RagaAI LLM-hub”, een open source en ondernemingsklaar platform dat is ontworpen voor het evalueren en opzetten van vangrails voor Grote taalmodellen (LLM's). Met meer dan 100 zorgvuldig vervaardigde statistieken wil het platform catastrofale fouten in LLM's en Retrieval Augmented Generation (RAG)-applicaties voorkomen.

De RagaAI LLM Hub biedt ontwikkelaars en organisaties een robuuste toolkit om LLM's effectief te beoordelen en te vergelijken, waarbij cruciale aspecten worden behandeld zoals relevantie en begrip, inhoudskwaliteit, Hallucinatie, Veiligheid en vooringenomenheid, contextrelevantie, vangrails en scannen op kwetsbaarheden. Daarnaast biedt het een reeks op metrische gegevens gebaseerde tests voor kwantitatieve analyse.

“Holistische evaluatie van LLM's is momenteel een belangrijke vereiste in de wereld van het bouwen van LLM's, nu datawetenschappers en bedrijven uitzoeken welke technologie en stack voor hen werken. Het diagnosticeren van een probleem vereist het minutieus identificeren van het probleem bij de bron, en gezien de honderden mogelijke hoofdoorzaken zijn er honderden meetgegevens nodig om die hoofdoorzaak vast te stellen.” Gaurav Aggarwal, vertelde oprichter van RagaAI MPost.

“Het vermogen van RagaAI LLM Hub voor uitgebreide tests voegt aanzienlijke waarde toe aan de workflow van ontwikkelaars, waardoor cruciale tijd wordt bespaard door ad-hocanalyses te elimineren en de LLM-ontwikkeling drie keer te versnellen.”  

De RagaAI LLM Hub is ontworpen om problemen gedurende de hele LLM-levenscyclus aan te pakken, van proof-of-concept tot productietoepassingen, en identificeert onderliggende problemen binnen LLM-aanvragen en vergemakkelijkt de oplossing ervan bij de bron, waardoor een revolutie teweeg wordt gebracht in de aanpak om betrouwbaarheid en betrouwbaarheid te garanderen.

RagaAI beweert dat zijn LLM Hub deze mogelijkheid ondersteunt door middel van een reeks tests die verschillende besluitvormingsaspecten bestrijken:

  • Prompts: Het herhaalt en identificeert optimale promptsjablonen, terwijl er vangrails worden opgezet om vijandige aanvallen te beperken.
  • Contextbeheer voor RAG's: het helpt gebruikers bij het vinden van de optimale balans tussen LLM-prestaties en kosten/latentie bij het werken op schaal.
  • Reactie genereren: Het maakt gebruik van meetgegevens om hallucinaties in LLM-reacties te identificeren en zet vangrails op om vooringenomenheid, PII-lekken en andere potentiële problemen te voorkomen.
Bron: Raga AI

Het verzachten van AI-hallucinaties en vooroordelen door middel van LLM-diagnose

De RagaAI LLM Hub vindt toepassingen in verschillende sectoren, waaronder e-commerce, financiën, marketing, juridische zaken en gezondheidszorg, en ondersteunt ontwikkelaars en ondernemingen bij taken zoals chatbots, het maken van inhoud, het samenvatten van teksten en het genereren van broncode.

Naast evaluatie helpt de RagaAI LLM Hub bij het opzetten van vangrails om gegevensprivacy en wettelijke naleving te garanderen, en bevordert het ethische en verantwoordelijke AI praktijken, vooral in gevoelige sectoren als financiën, gezondheidszorg en recht.

“Een van onze klanten op het gebied van e-commerce gebruikte LLM's voor een chatbot voor klantenondersteuning, en de chatbot gaf verkeerde antwoorden. Met behulp van RagaAI werd dit probleem met succes gedetecteerd en opgelost”, vertelde Gaurav Agarwal van RagaAI MPost. “Bij zorgverzekeringen is het belangrijk dat de persoonlijke gegevens van patiënten worden beschermd. Bij een van onze klanten werd een deel van de belangrijke persoonlijke informatie gedeeld met de derde partij – een groot probleem met de gegevensprivacy. Met behulp van RagaAI LLM Hub-vangrails werden deze en soortgelijke andere problemen in realtime gedetecteerd en voorkomen.

Gaurav Agarwal, oprichter van RagaAI

Daarnaast wil het de reputatierisico’s beperken door zich te houden aan maatschappelijke normen en waarden.

“RagaAI helpt bij het opzetten van vangrails, zoals de detectie van persoonlijk identificeerbare informatie (PII) in LLM-reacties. Dit zorgt ervoor dat er nooit persoonlijke gegevens uit interne documenten worden gelekt door de LLM-applicatie en is van cruciaal belang voor Responsible AI”, legt Gaurav Agarwal uit. “Deze en andere vangrails, zoals het garanderen van onpartijdige en eerlijke reacties, het niet becommentariëren van concurrenten en het verwijderen van materiële niet-openbare informatie (MNPI) zijn van cruciaal belang voor bedrijven die maatschappelijke schade en reputatieschade willen voorkomen.”

De lancering van de RagaAI LLM Hub volgt op een succes $ 4.7 miljoen in een startfinancieringsronde in januari 2024 onder leiding van pi Ventures, om zijn bedrijf uit te breiden AI-onderzoek, ontwikkeling en klantenbestand in de VS en Europa.

“Ons doel is om de beste technologie te bieden om LLM’s betrouwbaar en betrouwbaar te maken. Het investeert aanzienlijk in de ontwikkeling van sleuteltechnologieën om aspecten van LLM-kwaliteitsborging aan te pakken. Het open source maken van deze technologie is onze inspanning om dit voor iedereen beschikbaar te maken, zodat de ontwikkelaarsgemeenschap kan voortbouwen op de best beschikbare oplossing”, aldus Gaurav Agarwal.

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Victor is Managing Tech Editor/Writer bij Metaverse Post en omvat kunstmatige intelligentie, crypto, datawetenschap, metaverse en cyberbeveiliging binnen het ondernemingsdomein. Hij kan bogen op een half decennium aan media- en AI-ervaring bij bekende mediakanalen zoals VentureBeat, DatatechVibe en Analytics India Magazine. Als mediamentor aan prestigieuze universiteiten, waaronder Oxford en USC, en met een masterdiploma in data science en analytics, is Victor zeer toegewijd om op de hoogte te blijven van opkomende trends. Hij biedt lezers de nieuwste en meest inzichtelijke verhalen uit de Tech- en Web3 landschap.

Meer artikelen
Victor Dei
Victor Dei

Victor is Managing Tech Editor/Writer bij Metaverse Post en omvat kunstmatige intelligentie, crypto, datawetenschap, metaverse en cyberbeveiliging binnen het ondernemingsdomein. Hij kan bogen op een half decennium aan media- en AI-ervaring bij bekende mediakanalen zoals VentureBeat, DatatechVibe en Analytics India Magazine. Als mediamentor aan prestigieuze universiteiten, waaronder Oxford en USC, en met een masterdiploma in data science en analytics, is Victor zeer toegewijd om op de hoogte te blijven van opkomende trends. Hij biedt lezers de nieuwste en meest inzichtelijke verhalen uit de Tech- en Web3 landschap.

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Sophon lanceert Liquidity Farming en wijst 10% van het totale SOPH-tokenaanbod toe aan beloningsdeelnemers
markten Nieuwsverslag Technologie
Sophon lanceert Liquidity Farming en wijst 10% van het totale SOPH-tokenaanbod toe aan beloningsdeelnemers
18 June 2024
API3 introduceert Oracle Stack On Bitlayer voor verbeterde ontwikkelaarservaring
Nieuwsverslag Technologie
API3 introduceert Oracle Stack On Bitlayer voor verbeterde ontwikkelaarservaring
18 June 2024
Vervuiling beperken? Hoe de voormalige energievarkens van Bitcoin ernaar streven de koolstofbui van AI te stoppen
Advies Business markten Software Technologie
Vervuiling beperken? Hoe de voormalige energievarkens van Bitcoin ernaar streven de koolstofbui van AI te stoppen
18 June 2024
dForce introduceert gedecentraliseerde Stablecoin sUSX voor het verdienen van rendement en biedt gebruikers verbeterde liquiditeit
Nieuwsverslag Technologie
dForce introduceert gedecentraliseerde Stablecoin sUSX voor het verdienen van rendement en biedt gebruikers verbeterde liquiditeit
18 June 2024