Ex-engenheiro da DeepMind desenvolve YugoGPT, um ChatGPT Clone para línguas eslavas do sul
Em Breve
YugoGPT é um modelo de linguagem generativo para as línguas eslavas do sul, superando as capacidades linguísticas de ChatGPT e outros modelos de IA.
Aleksa Gordic, fundadora da Runa AI – uma startup que constrói multilíngue IA generativa modelos fundamentais para empresas - anunciou a disponibilidade de YugoGPT.
Gordic afirma que é o maior gerador modelo de linguagem para as línguas sérvia, croata, bósnia e montenegrina, construída com a ideia de ensiná-la a fazer mais ou menos a mesma coisa que ChatGPT para inglês, ou seja, entender textos, responder perguntas e atuar como assistente de IA para pessoas e empresas da região.
O bósnio, o croata, o montenegrino e o sérvio (BCMS) são línguas eslavas do sul mutuamente inteligíveis, faladas no sudeste da Europa, nomeadamente na Bósnia e Herzegovina, Croácia, Montenegro e Sérvia.
“Se você perguntar ChatGPT como pagar seus impostos este ano, ele lhe oferecerá uma resposta, mas presumirá que você está pagando nos EUA. Por outro lado, você pode treinar um modelo de linguagem grande (LLM) para suas próprias necessidades locais. Essa é a vantagem do yugoGPT”, disse Gordic em entrevista à mídia sérvia Biznis.rs, quando questionado por que a população da região precisa chatGPT em suas línguas.
Motivado por um sentimento de frustração com as deficiências evidentes fora do território inglês Processamento de linguagem natural (PNL), Gordic embarcou na criação de YugoGPT no início deste verão, para elevar o padrão dos modelos linguísticos para além dos limites do cenário da PNL dominado pelo inglês.
“Acreditamos que a IA deve servir todos os idiomas e estamos construindo modelos GenAI/fundacionais multilíngues para empresas”, disse Aleksa Gordic em uma postagem no LinkedIn.
“Nosso próximo passo será levantar financiamento inicial, a fim de acelerar, obter um cluster de GPU e construir uma plataforma LLM empresarial”, acrescentou.
Capacidades únicas de YugoGPT
“YugoGPT 7B vence significativamente Mistral e LLaMA 2 da Meta (anteriormente Facebook) e agora é oficialmente o melhor LLM de código aberto do mundo para sérvio e outros idiomas HBS (croata, bósnio, montenegrino)”, Gordic mencionado no LinkedIn.
Segundo Gordic, proporcionará acessibilidade dos parâmetros do modelo a pessoas físicas e jurídicas. Isto aumentará a flexibilidade, permitindo a personalização de conhecimentos em diversas áreas, como finanças, impostos, psicologia e muito mais.
Em meio a preocupações com a segurança e privacidade dos dados, inúmeras empresas expressam hesitação em confiar nas APIs americanas, alegando desconforto com o envio de dados confidenciais para servidores de terceiros. Gordic esclarece essa tendência, observando uma preferência crescente pela utilização de recursos de IA diretamente em sistemas de computação internos.
Gordic enfatiza que ter acesso aos parâmetros do modelo concede às organizações maior controle sobre as funcionalidades da IA, abordando as apreensões associadas ao envolvimento de terceiros.
Gordic, formado em eletrônica em 2017 pela Faculdade de Engenharia Elétrica de Belgrado, trabalhou como engenheiro de software e aprendizado de máquina no Centro de Desenvolvimento da Microsoft na Sérvia no projeto HoloLens de 2018 a 2021. Depois disso, ingressou na DeepMind do Google, com especialização em idiomas. modelos com capacidades de compreensão de imagem e vídeo.
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Kumar é um jornalista de tecnologia experiente com especialização nas interseções dinâmicas de IA/ML, tecnologia de marketing e campos emergentes como criptografia, blockchain e NFTS. Com mais de 3 anos de experiência no setor, Kumar estabeleceu um histórico comprovado na elaboração de narrativas convincentes, na condução de entrevistas perspicazes e no fornecimento de insights abrangentes. A experiência de Kumar reside na produção de conteúdo de alto impacto, incluindo artigos, relatórios e publicações de pesquisa para plataformas importantes do setor. Com um conjunto único de habilidades que combina conhecimento técnico e narrativa, Kumar se destaca na comunicação de conceitos tecnológicos complexos para diversos públicos de maneira clara e envolvente.
Mais artigosKumar é um jornalista de tecnologia experiente com especialização nas interseções dinâmicas de IA/ML, tecnologia de marketing e campos emergentes como criptografia, blockchain e NFTS. Com mais de 3 anos de experiência no setor, Kumar estabeleceu um histórico comprovado na elaboração de narrativas convincentes, na condução de entrevistas perspicazes e no fornecimento de insights abrangentes. A experiência de Kumar reside na produção de conteúdo de alto impacto, incluindo artigos, relatórios e publicações de pesquisa para plataformas importantes do setor. Com um conjunto único de habilidades que combina conhecimento técnico e narrativa, Kumar se destaca na comunicação de conceitos tecnológicos complexos para diversos públicos de maneira clara e envolvente.