Opinion Technologie
19 décembre 2023

« L'industrie technologique s'orientera vers une dépendance réduite aux GPU en 2024 », affirme Greg Osuri, PDG d'Akash Network.

En bref

PDG d'Overclock Labs et d'Akash Network, Greg Osuri affirme que l'adoption de GPU moins performants remodèlera le paysage technologique en 2024 et débloquera des effets d'entraînement.

« L'industrie technologique s'orientera vers une dépendance réduite aux GPU en 2024 », prédit Greg Osuri, PDG d'Overclock Labs et d'Akash Network.

Alors que les principaux acteurs de l'industrie technologique continuent de dominer le marché avec GPU puissants, une évolution notable vers moins puces puissantes est attendue pour 2024. Cette décision, motivée par la nécessité d’alternatives, devrait remodeler le paysage, permettant aux petites entreprises et aux startups de contribuer de manière significative au développement en cours. Boum de l'IA.

La demande en calcul haute performance, en particulier pour la formation de grands modèles de langage, a dépassé les capacités des fournisseurs traditionnels tels que AWS, Microsoft Azure et Google Cloud. Les petites entreprises ont du mal à se permettre et à réserver ces ressources hautes performances, ce qui conduit à un intérêt croissant pour les réseaux distribués et sans autorisation.

Dans une conversation avec Metaverse Post — Greg Osuri, PDG d'Overclock Labs et Réseau Akash, mettent en lumière les facteurs déterminants et les implications potentielles derrière cette tendance de transformation.

La plate-forme cloud décentralisée Akash Network a récemment annoncé une mise à niveau importante vers le cloud avec Mainnet 8. La nouvelle mise à niveau a introduit des améliorations clés visant à simplifier Accès au GPU et améliorez l'expérience de déploiement.

Greg Osuri identifie l'optimisation des exigences en matière d'ensembles de données comme un élément clé dans l'adoption de GPU moins performants.

L’adaptation de bas rang (LoRA) apparaît comme une technique cruciale dans ce changement. Cette modification stratégique se concentre sur les poids critiques, réduit le nombre de paramètres nécessaires et préserve les connaissances pré-entraînées d'origine dans le modèle.

"Ceux qui recherchent des alternatives face à la compression des GPU progresseront en utilisant des exigences d'ensemble de données moins intensives, en déployant des techniques plus efficaces telles que l'adaptation de bas rang (LoRA) pour former des modèles de langage et en répartissant les charges de travail de manière parallèle", a déclaré Greg Osuri d'Akash Network. Metaverse Post. « Cela implique le déploiement de clusters de puces de niveau inférieur pour accomplir des tâches équivalentes à un plus petit nombre d'A100 et H100s. Une nouvelle ère du cloud computing va émerger, dans laquelle le pouvoir sera décentralisé et non entre les mains de quelques-uns.

Il dit que la parallélisation des charges de travail via des clusters de puces de moindre taille est une autre stratégie. Par rapport à l'utilisation traditionnelle des GPU, les clusters offrent une meilleure évolutivité, une meilleure rentabilité et des capacités de charge de travail distribuées. Les défis incluent toutefois la latence du transfert de données, les problèmes de synchronisation, limites d'évolutivité et les frais de communication.

« Plus les données sont volumineuses, plus les coûts de communication entre machines non colocalisées sont coûteux et difficiles. Des méthodes/techniques plus efficaces seront donc probablement nécessaires pour surmonter les barrières de communication coûteuses et difficiles. Une combinaison de matériel et de logiciels est nécessaire pour une mise en œuvre réussie », a déclaré Greg Osuri.

L’essor des réseaux distribués et sans autorisation apparaît comme un catalyseur crucial, permettant aux organisations d’exploiter le potentiel des GPU moins performants et d’augmenter l’utilisation globale des puces.

« Pour parvenir à l'optimisation, les organisations doivent envisager des lots plus petits qui nécessitent moins de mémoire GPU, s'entraîner sur un sous-ensemble de données à déboguer, utiliser des modèles pré-entraînés car ils nécessitent moins de ressources de calcul et répartir la formation sur plusieurs GPU », a expliqué Greg Osuri. "Cela permet aux petites entreprises et aux startups d'innover et d'apporter de réelles contributions au boom de l'IA sans dépendre entièrement des GPU les plus puissants."

Les réseaux distribués peuvent renforcer le paysage technologique

Greg Osuri, d'Akash Network, estime que l'adoption de GPU moins performants favorisera un environnement plus diversifié et plus compétitif, atténuant ainsi les inquiétudes liées à la domination des géants de la technologie sur le marché. Paysage de l'IA. Il affirme que cette approche constitue une solution rentable et axée sur les développeurs pour accéder à une large gamme de GPU, permettant ainsi aux petits acteurs de rivaliser sur un pied d'égalité.

« Des solutions innovantes et décentralisées continuent d'émerger, répondant à l'augmentation de la demande, garantissant un accès équitable aux GPU et favorisant l'innovation dans le cloud computing et la formation de modèles d'IA. En donnant un accès sans autorisation aux ressources informatiques – y compris les Nvidia A100 et H100 – provenant d’une gamme de fournisseurs, allant de l’indépendant à l’hyperscale, ces plates-formes informatiques sont dans une position unique pour atténuer les inefficacités », a-t-il déclaré.

Les petites entreprises et les startups devraient tirer parti de la transition vers des GPU moins performants pour apporter des contributions significatives au Domaine IA. Des exemples, tels que l’utilisation par Thumper.ai d’un cluster de 32 Nvidia A100, mettent en évidence l’optimisation de la puissance de calcul sous-utilisée pour des taux de déploiement plus rapides.

« En proposant une approche rentable et axée sur les développeurs pour accéder à une large gamme de GPU, des puces de centre de données hautes performances aux modèles grand public, les petits acteurs pourront accéder au même calcul que les entreprises plus établies qui disposent de flexibilité dans leurs opérations. dépenses », a ajouté Greg Osuri.

En regardant les implications plus larges, M. Osuri prévoit un changement de paradigme potentiel dans l’industrie technologique. L’évolution vers des GPU moins puissants et une informatique décentralisée pourrait conduire au développement de nouvelles applications et de nouveaux cas d’utilisation, s’étendant au-delà de l’IA à d’autres domaines technologiques.

"La flexibilité inhérente d'un réseau distribué pourrait permettre aux développeurs et chercheurs indépendants d'expérimenter des applications entièrement nouvelles et de débloquer de nouvelles façons de développer des architectures d'applications radicalement ouvertes", a déclaré Greg Osuri d'Akash Network. Metaverse Post. «Cet effet d'entraînement pourrait conduire au développement d'applications et de services plus décentralisés entre les secteurs, à un partage plus large des ressources informatiques et des connaissances, au « retour » de Crypto et les terres parsemées de blockchain, et l’intégration avec les technologies existantes.

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Victor est rédacteur/rédacteur technique en chef chez Metaverse Post et couvre l'intelligence artificielle, la cryptographie, la science des données, le métaverse et la cybersécurité dans le domaine de l'entreprise. Il possède une demi-décennie d'expérience dans les médias et l'IA, travaillant dans des médias bien connus tels que VentureBeat, DatatechVibe et Analytics India Magazine. En tant que mentor en médias dans des universités prestigieuses, dont Oxford et USC, et titulaire d'une maîtrise en science et analyse des données, Victor est profondément engagé à rester au courant des tendances émergentes. Il propose aux lecteurs les récits les plus récents et les plus perspicaces de la technologie et Web3 paysage.

Plus d'articles
Victor Dey
Victor Dey

Victor est rédacteur/rédacteur technique en chef chez Metaverse Post et couvre l'intelligence artificielle, la cryptographie, la science des données, le métaverse et la cybersécurité dans le domaine de l'entreprise. Il possède une demi-décennie d'expérience dans les médias et l'IA, travaillant dans des médias bien connus tels que VentureBeat, DatatechVibe et Analytics India Magazine. En tant que mentor en médias dans des universités prestigieuses, dont Oxford et USC, et titulaire d'une maîtrise en science et analyse des données, Victor est profondément engagé à rester au courant des tendances émergentes. Il propose aux lecteurs les récits les plus récents et les plus perspicaces de la technologie et Web3 paysage.

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Soland, l'algorithme minier alimenté par ZKP, annonce son lancement et sa prévente de mineurs de 20 jours
Rapport de nouvelles Technologie
Soland, l'algorithme minier alimenté par ZKP, annonce son lancement et sa prévente de mineurs de 20 jours
13 mai 2024
Notcoin prévoit de distribuer 5% de son offre de jetons à 500,000 XNUMX membres de la communauté et utilisateurs de Crypto Exchange
Marchés Rapport de nouvelles Technologie
Notcoin prévoit de distribuer 5% de son offre de jetons à 500,000 XNUMX membres de la communauté et utilisateurs de Crypto Exchange
13 mai 2024
Le passage de Donald Trump à la cryptographie : d'opposant à défenseur, et ce que cela signifie pour le marché américain des cryptomonnaies
La Brochure Marchés Histoires et critiques Technologie
Le passage de Donald Trump à la cryptographie : d'opposant à défenseur, et ce que cela signifie pour le marché américain des cryptomonnaies
10 mai 2024
Layer3 lancera le jeton L3 cet été, allouant 51 % de l'offre totale à la communauté
Marchés Rapport de nouvelles Technologie
Layer3 lancera le jeton L3 cet été, allouant 51 % de l'offre totale à la communauté
10 mai 2024
CRYPTOMERIA LABS PTE. LTD.