Stability AI'с СтаблеВицуна је први чет-бот обучен са људским повратним информацијама
Укратко
Stability AI објављује СтаблеВицуна, први велики цхатбот отвореног кода, који користи учење за појачавање са људским повратним информацијама (РЛХФ).
СтаблеВицуна је заснована на Вицуна цхатбот-у и користи параметар од 13 милијарди LLaMA модел.
Stability AI има увео његов најновији пробој у АИ, СтаблеВицуна, први велики цхатбот отвореног кода обучен уз помоћ људских повратних информација. Иновативни цхатбот је замисао Stability AI, компанија која је креирала популарни модел слике отвореног кода, Stable Diffusionи најновији алгоритам за генерисање АИ слике, ДеепФлоид.
СтаблеВицуна је заснована на Вицуна цхатботу објављеном у априлу, који користи параметар од 13 милијарди LLaMA модел. Оно што поставља Вицуна варијанту Stability AI а Царпер АИ осим тога је његова употреба учења са појачањем са људским повратним информацијама (РЛХФ). Овај метод омогућава да се модел континуирано побољшава.
Stability AI сугерише да су цхат ботови успешни због два типа метода обуке: фино подешавање инструкција и учење уз помоћ људских повратних информација. Међутим, већина постојећих модела цхатбот користи само једну од ових метода, а не оба. Недавно су скупови података за РЛХФ обуку постали јавно доступни. Дакле, заједно са алатом за обуку прилагођеном кориснику, ово је омогућило стварање СтаблеВицуна, који је први велики цхатбот модел који обухвата обе врсте обуке.
СтаблеВицуна укључује генерисање текста, једноставне математичке функције и могућност писања кода. Упоредив је са другим цхатботовима отвореног кода у уобичајеним мерилима.
Према Тхе Децодер, чет-ботови отвореног кода фино подешени са подацима из других чет робота ризикују да појачају постојеће грешке и предрасуде кроз понављајућу обуку, узрокујући ефекат ехо коморе. Подаци финог подешавања такође могу да погоршају халуцинације увођењем информација које нису присутне у оригиналном моделу.
Корисници могу да приступе демонстрацији цхатбот-а ХуггингФаце. Компанија је такође открила планове да у будућности обезбеди СтаблеВицуна преко интерфејса за ћаскање.
Опширније:
Одрицање од одговорности
У складу са Смернице пројекта Труст, имајте на уму да информације дате на овој страници нису намењене и не треба да се тумаче као правни, порески, инвестициони, финансијски или било који други облик савета. Важно је да инвестирате само оно што можете приуштити да изгубите и да тражите независан финансијски савет ако сумњате. За додатне информације, предлажемо да погледате одредбе и услове, као и странице помоћи и подршке које пружа издавач или оглашивач. MetaversePost је посвећен тачном, непристрасном извештавању, али тржишни услови су подложни променама без претходне најаве.
О аутору
Агне је новинарка која покрива најновије трендове и развој метаверзума, вештачке интелигенције и Web3 индустрије за Metaverse Post. Њена страст за приповедањем прича ју је навела да води бројне интервјуе са стручњацима из ових области, увек настојећи да открије узбудљиве и занимљиве приче. Агне је дипломирала књижевност и има богато искуство у писању о широком спектру тема, укључујући путовања, уметност и културу. Такође је волонтирала као уредница за организацију за права животиња, где је помогла у подизању свести о питањима добробити животиња. Контактирајте је [емаил заштићен].
više чланакаАгне је новинарка која покрива најновије трендове и развој метаверзума, вештачке интелигенције и Web3 индустрије за Metaverse Post. Њена страст за приповедањем прича ју је навела да води бројне интервјуе са стручњацима из ових области, увек настојећи да открије узбудљиве и занимљиве приче. Агне је дипломирала књижевност и има богато искуство у писању о широком спектру тема, укључујући путовања, уметност и културу. Такође је волонтирала као уредница за организацију за права животиња, где је помогла у подизању свести о питањима добробити животиња. Контактирајте је [емаил заштићен].