דיווח חדשות טכנולוגיה
ספטמבר 25, 2023

OpenAI"S ChatGPT חושף שדרוג גדול, מוסיף שיחה קולית וצ'אט תמונה

בקיצור

OpenAI ישיקו יכולות קול ותמונה חדשות ב ChatGPT במהלך השבועיים הקרובים.

תכונות אלו יהיו זמינות רק למשתמשי Plus ו-Enterprise.

OpenAI הודיעה היום כי היא תשיק יכולות קול ותמונה חדשות ב ChatGPT. התכונות החדשות יאפשרו למשתמשים לנהל איתם שיחה קולית ChatGPT או צ'אט עם הצ'אטבוט באמצעות תמונות.

ההודעה באה בעקבות טענות של משתמשי Reddit שטענו שהם קיבלו גישה אליהם OpenAIהדגמים של ובהמשך שיתפו מידע זה בפלטפורמה. Redditor FeltSteam תיאר מודל בינה מלאכותית עם שם העבודה של Arrakis, שלפי הדיווחים מאפשר למשתמשים "להזין כל שילוב של טקסט, אודיו ווידאו".

"יכולת הקול החדשה מופעלת על ידי מודל חדש של טקסט לדיבור, המסוגל ליצור אודיו דמוי אדם מטקסט בלבד וממספר שניות של דיבור לדוגמה", כתבה Open AI ב בלוג. "שיתפנו פעולה עם שחקני קול מקצועיים כדי ליצור כל אחד מהקולות. אנו משתמשים גם ב-Whisper, מערכת זיהוי הדיבור שלנו בקוד פתוח, כדי לתמלל את המילים המדוברות שלך לטקסט."

עם התכונות החדשות, משתמשים יכולים לנהל שיחה הלוך ושוב עם ChatGPT באמצעות הקולות שלהם. הם יכולים גם לדון על תמונות עם הצ'אטבוט. התכונות יושקו במהלך השבועיים הקרובים למשתמשי Plus ו-Enterprise.

יכולת הקול תגיע ל-iOS ולאנדרואיד כאופט-אין בעוד שתכונת התמונה תהיה זמינה בכל הפלטפורמות.

כדי להתחיל להשתמש בפונקציית הקול, משתמשים יכולים לעבור להגדרות → תכונות חדשות באפליקציה לנייד ולבחור "שיחות קוליות". לאחר מכן, המשתמש צריך להקיש על כפתור האוזניות שנמצא בפינה השמאלית העליונה של מסך הבית ולבחור את הקול המועדף עליו מתוך מבחר של חמישה קולות שונים.

לשוחח איתו ChatGPT באמצעות תמונות, המשתמש יכול להקיש על כפתור הצילום כדי לצלם תמונה או לבחור תמונה. אם אתה משתמש ב-iOS או אנדרואיד, הקש על לחצן הפלוס לפני שתמשיך. בנוסף, הם יכולים להשתתף בדיונים עם מספר תמונות או להשתמש בהן כדי להנחות את הצ'אטבוט.

OpenAI אומר שהבנת התמונה מופעלת על ידי מולטי-מודאלי GPT-3.5 ו GPT-4. מודלים אלה ממנפים יכולות חשיבה שפה לניתוח מגוון מגוון של תוכן חזותי, הכולל תצלומים, צילומי מסך ומסמכים המכילים שילוב של טקסט ותמונות.

OpenAIהשותפות של Spotify

גם ספוטיפיי הודיעה היום תכונת התרגום הקולי המופעל על ידי AI. התכונה החדשה יכולה לתרגם פודקאסטים לשפות שונות, תוך שימוש בקולו המקורי של הפודקאסט.

לפי הסף, תכונת תרגום זו מסתמכת עליה OpenAIכלי התמלול הקולי של Whisper, המסוגל לתמלל דיבור באנגלית ולתרגם שפות שונות לאנגלית.

כחלק מהפיילוט, החברה התחברה עם הפודקאסטים דקס שפרד, מוניקה פדמן, לקס פרידמן, ביל סימונס וסטיבן ברטלט כדי ליצור תרגומי קול מונעי בינה מלאכותית בשפות כמו ספרדית, צרפתית וגרמנית לפרקי קטלוג ספציפיים ולפרקים הבאים. משחרר.

"אנו מאמינים שגישה מחושבת ל-AI יכולה לעזור לבנות קשרים עמוקים יותר בין מאזינים ליוצרים, מרכיב מרכזי במשימתה של Spotify לנצל את הפוטנציאל של היצירתיות האנושית", אמר זיאד סולטן, סמנכ"ל התאמה אישית ב-Spotify, בהצהרה.

פרקים מתורגמים בקול של יוצרי פיילוט יהיו זמינים ברחבי העולם למשתמשי פרימיום וחינמי.

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

סינדי היא עיתונאית ב Metaverse Post, המכסה נושאים הקשורים ל web3, NFT, metaverse ו-AI, עם התמקדות בראיונות עם Web3 שחקני התעשייה. היא דיברה עם יותר מ-30 מנהלים ברמת C ומספרת, והביאה את התובנות החשובות שלהם לקוראים. במקור מסינגפור, סינדי מבוססת כעת בטביליסי, ג'ורג'יה. היא בעלת תואר ראשון בלימודי תקשורת ומדיה מאוניברסיטת דרום אוסטרליה ובעלת ניסיון של עשור בעיתונות ובכתיבה. צור איתה קשר דרך [מוגן בדוא"ל] עם הצעות לעיתונות, הודעות והזדמנויות לראיונות.

מאמרים נוספים
סינדי טאן
סינדי טאן

סינדי היא עיתונאית ב Metaverse Post, המכסה נושאים הקשורים ל web3, NFT, metaverse ו-AI, עם התמקדות בראיונות עם Web3 שחקני התעשייה. היא דיברה עם יותר מ-30 מנהלים ברמת C ומספרת, והביאה את התובנות החשובות שלהם לקוראים. במקור מסינגפור, סינדי מבוססת כעת בטביליסי, ג'ורג'יה. היא בעלת תואר ראשון בלימודי תקשורת ומדיה מאוניברסיטת דרום אוסטרליה ובעלת ניסיון של עשור בעיתונות ובכתיבה. צור איתה קשר דרך [מוגן בדוא"ל] עם הצעות לעיתונות, הודעות והזדמנויות לראיונות.

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
אלגוריתם הכרייה המופעל על ידי ZKPs Soland מכריזה על השקה ומכירה מוקדמת של כורה ל-20 יום
דיווח חדשות טכנולוגיה
אלגוריתם הכרייה המופעל על ידי ZKPs Soland מכריזה על השקה ומכירה מוקדמת של כורה ל-20 יום
מאי 13, 2024
Notcoin מתכננת להפיץ 5% מאספקת האסימונים שלה ל-500,000 חברי קהילה ומשתמשי בורסת קריפטו
שוקי דיווח חדשות טכנולוגיה
Notcoin מתכננת להפיץ 5% מאספקת האסימונים שלה ל-500,000 חברי קהילה ומשתמשי בורסת קריפטו
מאי 13, 2024
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
עסקים שוקי סיפורים וסקירות טכנולוגיה
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
מאי 10, 2024
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
שוקי דיווח חדשות טכנולוגיה
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
מאי 10, 2024
CRYPTOMERIA LABS PTE. בע"מ.