דיווח חדשות טכנולוגיה
מאי 08, 2026

חדש OpenAI מודלים של אודיו מפעילים עוזרי קול בזמן אמת עם תרגום רב לשוני ובינה של סטרימינג

בקיצור

OpenAI שוחרר GPTמודלים של Realtime-2, Translate ו-Whisper, המרחיבים את הבינה המלאכותית הקולית בזמן אמת עם חשיבה, תרגום ותמלול עבור יישומי שיחה מתקדמים.

חדש OpenAI מודלים של אודיו מפעילים עוזרי קול בזמן אמת עם תרגום רב לשוני ובינה של סטרימינג

OpenAI הכריזה על סט חדש של מודלים של אודיו בתוך מערכת האקולוגית של ה-API שלה, המסמנת הרחבה ביכולות קול בזמן אמת עבור מפתחים ויישומים מונעי בינה מלאכותית. ההפצה כוללת GPT-זמן אמת-2, GPTתרגום בזמן אמת, ו GPT-לחישה בזמן אמת, כל אחת מהן נועדה לאפשר אינטראקציות קוליות מתקדמות, מגיבות ומודעות להקשר יותר במגוון מקרי שימוש.

GPT-Realtime-2 ממוצב כמודל הקול המתקדם ביותר של החברה עד כה, ומציג GPT-5-היגיון מחלקתי לשיחות שמע חיות. המודל נועד לטפל בבקשות משתמש מורכבות, לשמור על המשכיות הקשרית ולתמוך בהיגיון רב-שלבי תוך כדי אינטראקציה בזמן אמת. הוא מיועד ליישומים שבהם סוכני קול חייבים לא רק להגיב במהירות אלא גם לפרש כוונה, לנהל הפרעות ולבצע משימות באמצעות שימוש משולב בכלים.

לצדו, GPT-Realtime-Translate מאפשר תרגום דיבור בזמן אמת ביותר מ-70 שפות קלט ל-13 שפות פלט. המערכת בנויה לשמור על זרימה בשיחה תוך שמירה על משמעות ותזמון, ומאפשרת לדוברים לתקשר בשפות שונות ללא עיכובים מורגשים. יכולת זו מכוונת לתמיכת לקוחות גלובלית, חינוך, נסיעות ושירותי תקשורת חוצי גבולות.

המודל השלישי, GPT-לחישה בזמן אמת, מתמקדת בתמלול דיבור לטקסט בסטרימינג. היא מספקת תמלול רציף ובזמן השהייה נמוך בזמן שמשתמשים מדברים, ומאפשרת כיתובים בזמן אמת, תיעוד חי ועיבוד מיידי של תוכן מדובר. המודל מיועד לסביבות בהן נדרשת המרה מהירה של דיבור לטקסט, כגון פגישות, שידורי מדיה וזרימות עבודה ארגוניות.

OpenAI תיאר את הגרסה המשולבת כצעד לקראת ממשקי קול שמתקדמים מעבר למערכות פקודה ותגובה בסיסיות. במקום פשוט לזהות דיבור וליצור תשובות, המודלים נועדו לתמוך בהיגיון רציף, תרגום, תמלול וביצוע פעולות במסגרת זרימת שיחה אחת. המטרה היא לאפשר מערכות מבוססות קול שיכולות לתפקד יותר כמו עוזרים אינטראקטיביים המסוגלים להשלים משימות תוך שמירה על דיאלוג טבעי.

GPT-Realtime-2 מקדם את ארכיטקטורת הבינה המלאכותית הקולית עם מערכות קול-לפעולה וחלונות הקשר מורחבים

החברה הדגישה מספר דפוסי עיצוב מתפתחים שמאפשרת הטכנולוגיה. אלה כוללים מערכות קול-לפעולה, שבהן משתמשים יכולים לתאר משימות המבוצעות באמצעות חשיבה אוטומטית ושילוב כלים; יישומי מערכות-לקול, שבהם תוכנה מייצרת הנחיות מדוברות המבוססות על נתונים הקשריים; ומערכות תרגום קול-לקול, המאפשרות תקשורת רב-לשונית בזמן אמת בין דוברים.

GPT-Realtime-2 מציג שיפורים ארכיטקטוניים נוספים לשימוש בייצור. אלה כוללים חלונות הקשר ארוכים יותר שהורחבו ל-128K טוקנים, התנהגות שחזור משופרת במהלך הפרעות או שגיאות, ביצוע כלים מקביל עם משוב שקוף והתאמת צלילים ניתנת לשליטה רבה יותר בהתאם להקשר השיחה. מפתחים יכולים גם לכוונן את רמות ההיגיון כדי לאזן בין מהירות ומורכבות בהתבסס על צרכי היישום.

מדדי ביצועים שצוטטו על ידי OpenAI מצביעים על תוצאות משופרות במשימות חשיבה מבוססות שמע ומעקב אחר הוראות בהשוואה לגרסאות קודמות של מודלי זמן אמת. המערכת גם מדגימה טיפול חזק יותר בטרמינולוגיה ספציפית לתחום והתנהגות יציבה יותר בסביבות שיחה מרובות תורות.

הגרסה משלבת גם מנגנוני בטיחות, כולל ניטור בזמן אמת וסיווג תוכן בתוך הפעלות פעילות, לצד בקרות ברמת המפתח לאמצעי הגנה נוספים. המודלים זמינים דרך ממשק ה-API בזמן אמת וממוקמים לפריסה ביישומים ארגוניים, צרכניים ויישומים הפונים למפתחים, כאשר התמחור בנוי על סמך מדדי עיבוד אודיו מבוססי שימוש.

הכנסת GPT-Realtime-2 והמודלים הנלווים אליו משקפים מעבר רחב יותר לעבר מערכות מחשוב מבוססות קול המסוגלות להסיק, לתרגם ולתמלל בזמן אמת, במטרה להפוך את האינטראקציה המדוברת עם תוכנה לפונקציונלית, אדפטיבית ובעלת יכולת תפעולית רבה יותר.

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

אליסה, עיתונאית מסורה ב- MPost, מתמחה בקריפטו, בינה מלאכותית, השקעות והתחום הנרחב של Web3. עם עין חדה לטרנדים וטכנולוגיות מתפתחות, היא מספקת סיקור מקיף כדי ליידע ולערב את הקוראים בנוף ההולך ומתפתח של מימון דיגיטלי.

מאמרים נוספים
אליסה דוידסון
אליסה דוידסון

אליסה, עיתונאית מסורה ב- MPost, מתמחה בקריפטו, בינה מלאכותית, השקעות והתחום הנרחב של Web3. עם עין חדה לטרנדים וטכנולוגיות מתפתחות, היא מספקת סיקור מקיף כדי ליידע ולערב את הקוראים בנוף ההולך ומתפתח של מימון דיגיטלי.

Hot Stories
הצטרף לניוזלטר שלנו.
כתבות ומאמרים

כיצד מינמקס בונה את מסוף המסחר המקצועי של בינה מלאכותית? חיזוי השווקים עדיין חסר בשנת 2026.

מינמקס עיבד נפח של כ-100,000 דולר בשלושת הימים הראשונים של יוני, רובו דרך ...

יודע יותר

השקט שלפני סופת סולאנה: מה אומרים עכשיו גרפים, לווייתנים ואותות בשרשרת

סולאנה הפגינה ביצועים חזקים, המונעים על ידי אימוץ גובר, עניין מוסדי ושיתופי פעולה מרכזיים, תוך שהיא מתמודדת עם פוטנציאל...

יודע יותר
קראו עוד
קראו עוד
עדכון גייט: מחוזים עתידיים על סחורות ועד תחזיות גביע העולם - גייט מדווחת על צמיחה בכל החזיתות
תקציר דיווח חדשות טכנולוגיה
עדכון גייט: מחוזים עתידיים על סחורות ועד תחזיות גביע העולם - גייט מדווחת על צמיחה בכל החזיתות
יוני 12, 2026
גלאסנוד: שוק אופציות הביטקוין מראה כי הלם המכירה הראשוני נספג
שוקי דיווח חדשות טכנולוגיה
גלאסנוד: שוק אופציות הביטקוין מראה כי הלם המכירה הראשוני נספג
יוני 12, 2026
החסות היא הפריסה: ספורט וההיגיון החדש של שילוב בינה מלאכותית
דעה לייףסטייל טכנולוגיה
החסות היא הפריסה: ספורט וההיגיון החדש של שילוב בינה מלאכותית
יוני 12, 2026
מורגן סטנלי, ויזה ופלאטרווייב: שותפויות קריפטו החל מהשבוע השני של יוני
עסקים דיווח חדשות טכנולוגיה
מורגן סטנלי, ויזה ופלאטרווייב: שותפויות קריפטו החל מהשבוע השני של יוני
יוני 12, 2026
CRYPTOMERIA LABS PTE. בע"מ.