OpenAI"S ChatGPT חושף שדרוג גדול, מוסיף שיחה קולית וצ'אט תמונה
בקיצור
OpenAI ישיקו יכולות קול ותמונה חדשות ב ChatGPT במהלך השבועיים הקרובים.
תכונות אלו יהיו זמינות רק למשתמשי Plus ו-Enterprise.
OpenAI הודיעה היום כי היא תשיק יכולות קול ותמונה חדשות ב ChatGPT. התכונות החדשות יאפשרו למשתמשים לנהל איתם שיחה קולית ChatGPT או צ'אט עם הצ'אטבוט באמצעות תמונות.
ההודעה באה בעקבות טענות של משתמשי Reddit שטענו שהם קיבלו גישה אליהם OpenAIהדגמים של ובהמשך שיתפו מידע זה בפלטפורמה. Redditor FeltSteam תיאר מודל בינה מלאכותית עם שם העבודה של Arrakis, שלפי הדיווחים מאפשר למשתמשים "להזין כל שילוב של טקסט, אודיו ווידאו".
"יכולת הקול החדשה מופעלת על ידי מודל חדש של טקסט לדיבור, המסוגל ליצור אודיו דמוי אדם מטקסט בלבד וממספר שניות של דיבור לדוגמה", כתבה Open AI ב בלוג. "שיתפנו פעולה עם שחקני קול מקצועיים כדי ליצור כל אחד מהקולות. אנו משתמשים גם ב-Whisper, מערכת זיהוי הדיבור שלנו בקוד פתוח, כדי לתמלל את המילים המדוברות שלך לטקסט."
מצאתי כמה ספקולציות מוזרות לא מאומתות לגבי דגמים פנימיים רבי עוצמה ב- Reddit.
— ים פלג (@Yampeleg) ספטמבר 25, 2023
- אנא קח הכל עם גרגר מלח. –
ככל הנראה,
שני משתמשים שונים טוענים שהם קיבלו גישה OpenAIהמודלים הפנימיים של וחולקים מידע על reddit.
FeltSteam… pic.twitter.com/JRJH4xADZX
עם התכונות החדשות, משתמשים יכולים לנהל שיחה הלוך ושוב עם ChatGPT באמצעות הקולות שלהם. הם יכולים גם לדון על תמונות עם הצ'אטבוט. התכונות יושקו במהלך השבועיים הקרובים למשתמשי Plus ו-Enterprise.
יכולת הקול תגיע ל-iOS ולאנדרואיד כאופט-אין בעוד שתכונת התמונה תהיה זמינה בכל הפלטפורמות.
כדי להתחיל להשתמש בפונקציית הקול, משתמשים יכולים לעבור להגדרות → תכונות חדשות באפליקציה לנייד ולבחור "שיחות קוליות". לאחר מכן, המשתמש צריך להקיש על כפתור האוזניות שנמצא בפינה השמאלית העליונה של מסך הבית ולבחור את הקול המועדף עליו מתוך מבחר של חמישה קולות שונים.
לשוחח איתו ChatGPT באמצעות תמונות, המשתמש יכול להקיש על כפתור הצילום כדי לצלם תמונה או לבחור תמונה. אם אתה משתמש ב-iOS או אנדרואיד, הקש על לחצן הפלוס לפני שתמשיך. בנוסף, הם יכולים להשתתף בדיונים עם מספר תמונות או להשתמש בהן כדי להנחות את הצ'אטבוט.
OpenAI אומר שהבנת התמונה מופעלת על ידי מולטי-מודאלי GPT-3.5 ו GPT-4. מודלים אלה ממנפים יכולות חשיבה שפה לניתוח מגוון מגוון של תוכן חזותי, הכולל תצלומים, צילומי מסך ומסמכים המכילים שילוב של טקסט ותמונות.
OpenAIהשותפות של Spotify
גם ספוטיפיי הודיעה היום תכונת התרגום הקולי המופעל על ידי AI. התכונה החדשה יכולה לתרגם פודקאסטים לשפות שונות, תוך שימוש בקולו המקורי של הפודקאסט.
לפי הסף, תכונת תרגום זו מסתמכת עליה OpenAIכלי התמלול הקולי של Whisper, המסוגל לתמלל דיבור באנגלית ולתרגם שפות שונות לאנגלית.
כחלק מהפיילוט, החברה התחברה עם הפודקאסטים דקס שפרד, מוניקה פדמן, לקס פרידמן, ביל סימונס וסטיבן ברטלט כדי ליצור תרגומי קול מונעי בינה מלאכותית בשפות כמו ספרדית, צרפתית וגרמנית לפרקי קטלוג ספציפיים ולפרקים הבאים. משחרר.
"אנו מאמינים שגישה מחושבת ל-AI יכולה לעזור לבנות קשרים עמוקים יותר בין מאזינים ליוצרים, מרכיב מרכזי במשימתה של Spotify לנצל את הפוטנציאל של היצירתיות האנושית", אמר זיאד סולטן, סמנכ"ל התאמה אישית ב-Spotify, בהצהרה.
פרקים מתורגמים בקול של יוצרי פיילוט יהיו זמינים ברחבי העולם למשתמשי פרימיום וחינמי.
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
סינדי היא עיתונאית ב Metaverse Post, המכסה נושאים הקשורים ל web3, NFT, metaverse ו-AI, עם התמקדות בראיונות עם Web3 שחקני התעשייה. היא דיברה עם יותר מ-30 מנהלים ברמת C ומספרת, והביאה את התובנות החשובות שלהם לקוראים. במקור מסינגפור, סינדי מבוססת כעת בטביליסי, ג'ורג'יה. היא בעלת תואר ראשון בלימודי תקשורת ומדיה מאוניברסיטת דרום אוסטרליה ובעלת ניסיון של עשור בעיתונות ובכתיבה. צור איתה קשר דרך [מוגן בדוא"ל] עם הצעות לעיתונות, הודעות והזדמנויות לראיונות.
מאמרים נוספיםסינדי היא עיתונאית ב Metaverse Post, המכסה נושאים הקשורים ל web3, NFT, metaverse ו-AI, עם התמקדות בראיונות עם Web3 שחקני התעשייה. היא דיברה עם יותר מ-30 מנהלים ברמת C ומספרת, והביאה את התובנות החשובות שלהם לקוראים. במקור מסינגפור, סינדי מבוססת כעת בטביליסי, ג'ורג'יה. היא בעלת תואר ראשון בלימודי תקשורת ומדיה מאוניברסיטת דרום אוסטרליה ובעלת ניסיון של עשור בעיתונות ובכתיבה. צור איתה קשר דרך [מוגן בדוא"ל] עם הצעות לעיתונות, הודעות והזדמנויות לראיונות.