Звіт про новини Технологія
Жовтень 10, 2023

Аналіз Google відкриває дивовижні дані про магістратуру права та точність пошукових систем

Аналіз Google відкриває дивовижні дані про магістратуру права та точність пошукових систем

На початку вересня Яндекс провів закриту міні-конференцію з генеративного штучного інтелекту, забезпечивши платформу для глибокого занурення у світ штучного інтелекту. Тим не менш, конференція принесла значні відкриття, особливо щодо довгоочікуваного ЯндексаGPT 2.

Яндекс представив ЯндексGPT 2 змусив спільноту штучного інтелекту дзижчати в очікуванні. Творці цієї моделі дослідили різні відмінні риси, включаючи спеціалізований модуль, призначений для пошуку та надання відповідей на основі даних результатів пошуку.

Примітно, що відкриття команди розкрили вражаючий аспект: навіть після навчання на величезному сховищі внутрішніх даних Яндекса, що охоплює більше десяти років роботи над механізмами нейронного пошуку, ця власна модель все одно не досягла неймовірних результатів. GPT-4. Цей значний розвиток підкреслює чудові успіхи, досягнуті GPT-4. Це спостереження підкреслює GPT-4вищість як над власними розробками, так і над попередніми ітераціями з відкритим кодом.

Розширюючи такі фундаментальні ідеї, Google провів дослідження оцінити точність відповідей від Великі мовні моделі (LLM) має доступ до пошукової системи. Хоча поняття інтеграції зовнішнього інструменту з LLMs не є новим, Google виявив, що складність полягає в детальній оцінці та перевірці цих моделей. Вирішальними факторами, що формують цю інтеграцію, є вибір ретельно розробленої підказки та внутрішні можливості LLMs.

Методологія тестування LLM Google

Підібраний корпус із 600 питань був розділений на чотири окремі групи. Кожна група віддала пріоритет фактичній точності, але одна група виділялася тим, що включила запитання, які ґрунтуються на хибних передумовах.

Наприклад, запитання на зразок «що написав Трамп після того, як його розбанили в Twitter?» містив неточну передумову, оскільки Трампа не було скасовано. Решта три групи ввели змінні відповіді застарілості: ніколи, рідко і часто. Очікувалося, що в групі «ніколи» LLM відповідатимуть виключно з пам’яті, тоді як запитання про останні події вимагали пошуку в режимі реального часу. Кожна група складалася зі 125 питань.

Питання були представлені різноманітним моделям. Інтригуюче те, що питання, що містять хибні передумови, виявили домінування GPT-4 та ChatGPT, які вміло спростували такі припущення, вказавши на їхню спеціальну підготовку для вирішення таких проблем.

Послідував порівняльний аналіз, піттинг ChatGPT, GPT-4, Пошук в Google (на основі текстових фрагментів або відповідей на першій сторінці) та PPLX.AI (платформа, що використовує ChatGPT щоб зібрати відповіді Google, спрямовані на розробників) один проти одного. У цьому контексті магістри надавали відповіді виключно зі своєї пам’яті.

Заслуговує на увагу спостереження: пошук Google давав правильні відповіді в середньому в 40% випадків у чотирьох групах. Точність «вічних» запитань становила 70%, а запитань із помилковими передумовами впала лише до 11%. ChatGPTпродуктивність у середньому становила 26%, тоді як GPT-4 досяг 28%, вражаюче відповідаючи на запитання з помилковими припущеннями у 42% випадків. PPLX.AI продемонстрував 52% успіху.

Дослідження було глибше, інтегрувавши новий підхід. Кожне запитання спонукало до пошуку Google із результатами, включеними в підказку. Після цього LLM повинні були «прочитати» цю інформацію, перш ніж складати свої відповіді. Ця техніка дозволила проводити кількакратне навчання (де приклади представлені в підкажіть керувати моделлю) і вдумливе поетапне обмірковування перед відповіддю.

Результати були просто вражаючими. GPT-4 показав дивовижний рейтинг якості 77%, відповідаючи на «вічні» запитання з точністю 96%, а на запитання з хибними припущеннями — із похвальною точністю 75%. Поки ChatGPT запропонував трохи менш вражаючі показники, він перевершив як PPLX.AI, так і пошук Google.

Освоєння дизайну підказок штучного інтелекту: ключові ідеї від експертів PPLX.AI і Google

Здатність ефективно керувати великими мовними моделями (LLM) через лабіринт інформації – це не маленький подвиг. Проте недавнє дослідження в ШІ підказує висвітлює ключові стратегії, які обіцяють покращити якість відповідей, створених LLM, пропонуючи зазирнути в нюанси механізмів допомоги ШІ.

Підґрунтя для цього одкровення було закладено завдяки ретельному швидкому структуруванню. Цей метод складається з кількох компонентів, пропонуючи чіткий шлях до отримання точних відповідей, міцно заснованих на розумінні контексту. Початковий аспект включає ілюстративні приклади, які служать керівними маркерами, спрямовуючи LLM до правильної відповіді на основі контекстуальних підказок.

другий рівень показує фактичний запит разом із 10-15 результатами пошуку. Ці результати виходять за рамки простих посилань на веб-сторінки, охоплюючи велику кількість інформації, включаючи текстовий вміст, релевантні запити, запитання, відповіді та графіки знань. Цей підхід забезпечує ШІ повною бібліотекою знань.

Удосконалення цієї системи йде далі. Вирішальне відкриття виявилося, якщо розташувати посилання в хронологічному порядку в підказці, розмістивши найновіші доповнення в кінці. Таке хронологічне розташування відображає еволюцію інформації, дозволяючи моделі розрізняти часову шкалу змін. Включення дат у кожен приклад зіграло ключову роль у покращенні контекстуального розуміння.

У той час як код використовувати ця нюансована структура підказок з нетерпінням очікується, її відсутність спонукала ентузіастів наважитися на переписування шаблонів підказок на основі наданих зображень.

З цього вторгнення в механіку підказок штучного інтелекту можна зробити кілька ключових висновків:

1) PPLX.AI, платформа, яка використовує ChatGPT для агрегування відповідей Google виявився багатообіцяючим варіантом. Навіть співробітники Google натякали на його перевагу.

2) Експериментування з різними елементами привело до покращення показників відповіді. Точність у швидкому будівництві, здається, є окремим мистецтвом.

3) GPT-4 демонструє похвальну майстерність в обробці великих наборів новин і текстів. Хоча це не можна охарактеризувати як «чудове», його якість навіть у швидко мінливих сценаріях новин коливається біля позначки 60%. Спільнота ШІ заохочується критично оцінювати такі показники.

4) Оскільки екосистема ШІ продовжує розширюватися, LLM, інтегровані в пошукові системи, готові стати повсюдними, обслуговуючи широкий спектр користувачів. Присутність ШІ в повсякденному житті досвід пошуку має висхідну траєкторію, що означає трансформаційний зсув у способі доступу до інформації та її обробки.

Багатогранний підхід пропонує багатообіцяючий спосіб отримати точні відповіді з цих складних мовних моделей, оскільки він включає ілюстративні приклади, чітко defiнед запиту та великої кількості контекстної інформації. Хронологічне розташування посилань у підказках призвело до значного розуміння, підкреслюючи важливість адаптації до динамічної природи інформації. LLMs можуть орієнтуватися в часовій шкалі змін завдяки цій часовій обізнаності, що покращує їхнє розуміння контексту.

Ключові слова:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Pyth Network розгортає Pull Oracle на Solana, надаючи розробникам доступ до цін Oracle
Звіт про новини Технологія
Pyth Network розгортає Pull Oracle на Solana, надаючи розробникам доступ до цін Oracle
17 Червня, 2024.
ШІ та ігрові партнери Aethir Airdrop Токени власникам вузла перевірки
Featured Звіт про новини Технологія
ШІ та ігрові партнери Aethir Airdrop Токени власникам вузла перевірки
17 Червня, 2024.
Notional Finance повністю припинить підтримку V2 до кінця липня, закликає користувачів перейти на V3
Звіт про новини Технологія
Notional Finance повністю припинить підтримку V2 до кінця липня, закликає користувачів перейти на V3
17 Червня, 2024.
Tether запускає платформу Alloy за підтримки Tether Gold і представляє перший токен aUSD₮
ринки Звіт про новини Технологія
Tether запускає платформу Alloy за підтримки Tether Gold і представляє перший токен aUSD₮
17 Червня, 2024.
CRYPTOMERIA LABS PTE. LTD.