รายงานข่าว เทคโนโลยี
September 25, 2023

OpenAI's ChatGPT เปิดตัวการอัพเกรดครั้งใหญ่ เพิ่มการสนทนาด้วยเสียงและการแชทด้วยรูปภาพ

ในบทสรุป

OpenAI จะเปิดตัวความสามารถด้านเสียงและภาพใหม่ๆ ใน ChatGPT ในอีกสองสัปดาห์ข้างหน้า

คุณสมบัติเหล่านี้จะใช้ได้เฉพาะกับผู้ใช้ Plus และ Enterprise เท่านั้น

OpenAI ประกาศในวันนี้ว่าจะเปิดตัวความสามารถด้านเสียงและรูปภาพใหม่ ChatGPT. คุณสมบัติใหม่นี้จะช่วยให้ผู้ใช้สนทนาด้วยเสียงได้ ChatGPT หรือสนทนากับแชทบอทผ่านรูปภาพ

การประกาศดังกล่าวเป็นไปตามคำกล่าวอ้างของผู้ใช้ Reddit ที่อ้างว่าพวกเขาสามารถเข้าถึงได้ OpenAIของโมเดลและต่อมาได้แบ่งปันข้อมูลนี้บนแพลตฟอร์ม Redditor FeltSteam อธิบายโมเดล AI ด้วยชื่อการทำงานของ Arrakis ซึ่งมีรายงานว่าอนุญาตให้ผู้ใช้สามารถ "ป้อนข้อความ เสียง และวิดีโอผสมกัน"

“ความสามารถด้านเสียงใหม่ขับเคลื่อนโดยโมเดลการอ่านออกเสียงข้อความใหม่ ซึ่งสามารถสร้างเสียงเหมือนมนุษย์จากเพียงข้อความและคำพูดตัวอย่างเพียงไม่กี่วินาที” Open AI เขียนไว้ใน โพสต์บล็อก. “เราร่วมมือกับนักพากย์มืออาชีพเพื่อสร้างเสียงแต่ละเสียง นอกจากนี้เรายังใช้ Whisper ซึ่งเป็นระบบรู้จำคำพูดแบบโอเพ่นซอร์สของเราเพื่อถอดเสียงคำพูดของคุณเป็นข้อความ”

ด้วยคุณสมบัติใหม่นี้ ผู้ใช้สามารถมีส่วนร่วมในการสนทนาไปมาได้ ChatGPT โดยใช้เสียงของพวกเขา พวกเขายังสามารถพูดคุยเกี่ยวกับรูปภาพด้วยแชทบอทได้ คุณลักษณะนี้จะเปิดตัวในอีกสองสัปดาห์ข้างหน้าสำหรับผู้ใช้ Plus และ Enterprise

ความสามารถด้านเสียงจะมาใน iOS และ Android โดยสามารถเลือกได้ ในขณะที่ฟีเจอร์รูปภาพจะพร้อมใช้งานบนทุกแพลตฟอร์ม

หากต้องการเริ่มใช้ฟังก์ชันเสียง ผู้ใช้สามารถไปที่การตั้งค่า → คุณสมบัติใหม่บนแอปมือถือ และเลือก "การสนทนาด้วยเสียง" จากนั้น ผู้ใช้ควรแตะปุ่มหูฟังที่มุมขวาบนของหน้าจอหลัก และเลือกเสียงที่ต้องการจากเสียงที่แตกต่างกันห้าเสียง

ที่จะสนทนาด้วย ChatGPT ผ่านรูปภาพ ผู้ใช้สามารถแตะปุ่มรูปภาพเพื่อถ่ายภาพหรือเลือกหนึ่งภาพได้ หากใช้ iOS หรือ Android ให้แตะปุ่มบวกก่อนดำเนินการต่อ นอกจากนี้ พวกเขายังสามารถมีส่วนร่วมในการสนทนาด้วยรูปภาพหลายรูป หรือใช้รูปภาพเหล่านั้นเพื่อเป็นแนวทางให้กับแชทบอท

OpenAI กล่าวว่าความเข้าใจภาพนั้นขับเคลื่อนโดยหลายรูปแบบ GPT-3.5 และ GPT-4. โมเดลเหล่านี้ใช้ประโยชน์จากความสามารถในการให้เหตุผลทางภาษาเพื่อวิเคราะห์เนื้อหาภาพที่หลากหลาย ครอบคลุมภาพถ่าย ภาพหน้าจอ และเอกสารที่มีข้อความและรูปภาพผสมกัน

OpenAIความร่วมมือระหว่าง Spotify กับ Spotify

สปอทิฟายด้วย ประกาศในวันนี้ คุณสมบัติการแปลด้วยเสียงที่ขับเคลื่อนด้วย AI ฟีเจอร์ใหม่นี้สามารถแปลพอดแคสต์เป็นภาษาต่างๆ ได้โดยใช้เสียงต้นฉบับของผู้ทำพอดแคสต์

ตามที่ Vergeคุณลักษณะการแปลนี้อาศัย OpenAIเครื่องมือถอดเสียงของ Whisper ซึ่งสามารถถอดเสียงคำพูดภาษาอังกฤษและแปลภาษาต่างๆ เป็นภาษาอังกฤษได้

ในฐานะส่วนหนึ่งของโครงการนำร่อง บริษัทได้ร่วมมือกับพอดคาสต์เตอร์ Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons และ Steven Bartlett เพื่อสร้างการแปลด้วยเสียงที่ขับเคลื่อนด้วย AI ในภาษาต่างๆ เช่น สเปน ฝรั่งเศส และเยอรมัน สำหรับตอนในแค็ตตาล็อกเฉพาะและที่กำลังจะมีขึ้น เผยแพร่

“เราเชื่อว่าแนวทาง AI ที่รอบคอบสามารถช่วยสร้างการเชื่อมต่อที่ลึกซึ้งยิ่งขึ้นระหว่างผู้ฟังและผู้สร้าง ซึ่งเป็นองค์ประกอบสำคัญของภารกิจของ Spotify ในการปลดล็อกศักยภาพของความคิดสร้างสรรค์ของมนุษย์” Ziad Sultan รองประธานฝ่าย Personalization ของ Spotify กล่าวในแถลงการณ์

ตอนที่แปลด้วยเสียงจากผู้สร้างนำร่องจะพร้อมให้บริการทั่วโลกสำหรับผู้ใช้ระดับพรีเมียมและผู้ใช้ฟรี

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

ซินดี้เป็นนักข่าวที่ Metaverse Postครอบคลุมหัวข้อที่เกี่ยวข้องกับ web3, NFT, metaverse และ AI โดยเน้นไปที่การสัมภาษณ์กับ Web3 ผู้เล่นในอุตสาหกรรม เธอได้พูดคุยกับผู้บริหารระดับ C มากกว่า 30 คนและเพิ่มขึ้นเรื่อยๆ เพื่อนำข้อมูลเชิงลึกอันมีค่ามาสู่ผู้อ่าน Cindy มีพื้นเพมาจากสิงคโปร์ ปัจจุบันประจำอยู่ที่เมืองทบิลิซี รัฐจอร์เจีย เธอสำเร็จการศึกษาระดับปริญญาตรีสาขาการสื่อสารและสื่อศึกษาจากมหาวิทยาลัยเซาท์ออสเตรเลีย และมีประสบการณ์ด้านสื่อสารมวลชนและการเขียนมาหลายทศวรรษ ติดต่อเธอได้ทาง [ป้องกันอีเมล] ด้วยการแถลงข่าว ประกาศ และโอกาสในการสัมภาษณ์

บทความอื่น ๆ
ซินดี้ แทน
ซินดี้ แทน

ซินดี้เป็นนักข่าวที่ Metaverse Postครอบคลุมหัวข้อที่เกี่ยวข้องกับ web3, NFT, metaverse และ AI โดยเน้นไปที่การสัมภาษณ์กับ Web3 ผู้เล่นในอุตสาหกรรม เธอได้พูดคุยกับผู้บริหารระดับ C มากกว่า 30 คนและเพิ่มขึ้นเรื่อยๆ เพื่อนำข้อมูลเชิงลึกอันมีค่ามาสู่ผู้อ่าน Cindy มีพื้นเพมาจากสิงคโปร์ ปัจจุบันประจำอยู่ที่เมืองทบิลิซี รัฐจอร์เจีย เธอสำเร็จการศึกษาระดับปริญญาตรีสาขาการสื่อสารและสื่อศึกษาจากมหาวิทยาลัยเซาท์ออสเตรเลีย และมีประสบการณ์ด้านสื่อสารมวลชนและการเขียนมาหลายทศวรรษ ติดต่อเธอได้ทาง [ป้องกันอีเมล] ด้วยการแถลงข่าว ประกาศ และโอกาสในการสัมภาษณ์

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

จาก Ripple สู่ Big Green DAO: โครงการ Cryptocurrency มีส่วนสนับสนุนการกุศลอย่างไร

เรามาสำรวจความคิดริเริ่มที่ใช้ประโยชน์จากศักยภาพของสกุลเงินดิจิทัลเพื่อการกุศลกันดีกว่า

รู้เพิ่มเติม

AlphaFold 3, Med-Gemini และอื่นๆ: วิธีที่ AI พลิกโฉมการดูแลสุขภาพในปี 2024

AI แสดงให้เห็นในรูปแบบต่างๆ ในการดูแลสุขภาพ ตั้งแต่การเปิดเผยความสัมพันธ์ทางพันธุกรรมใหม่ๆ ไปจนถึงการเสริมศักยภาพให้กับระบบการผ่าตัดด้วยหุ่นยนต์ ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
เครื่องมือ AI ฟรี 10 อันดับแรกสำหรับการสร้างเนื้อหา การตัดต่อวิดีโอ และอื่นๆ
AI Wiki ย่อยอาหาร การศึกษา ไลฟ์สไตล์ ซอฟต์แวร์ เทคโนโลยี
เครื่องมือ AI ฟรี 10 อันดับแรกสำหรับการสร้างเนื้อหา การตัดต่อวิดีโอ และอื่นๆ
May 14, 2024
คณะกรรมการกำกับหลักทรัพย์ฮ่องกงเตือนถึงการหลอกลวงแบบ Deepfake ที่มุ่งเป้าไปที่อุตสาหกรรม Crypto: ผลกระทบต่อความปลอดภัยของนักลงทุน
ไลฟ์สไตล์ Security Wiki ซอฟต์แวร์ เรื่องราวและบทวิจารณ์ เทคโนโลยี
คณะกรรมการกำกับหลักทรัพย์ฮ่องกงเตือนถึงการหลอกลวงแบบ Deepfake ที่มุ่งเป้าไปที่อุตสาหกรรม Crypto: ผลกระทบต่อความปลอดภัยของนักลงทุน
May 14, 2024
Ripple และ Evmos ร่วมมือกันในการพัฒนา XRP Ledger EVM Sidechain ด้วยเทคโนโลยี EvmOS
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Ripple และ Evmos ร่วมมือกันในการพัฒนา XRP Ledger EVM Sidechain ด้วยเทคโนโลยี EvmOS
May 14, 2024
5ireChain ริเริ่ม 'Testnet Thunder: GA' ที่สร้างแรงจูงใจสำหรับการทดสอบความเครียดของเครือข่าย เชิญชวนผู้ใช้ให้เข้าร่วม Airdrop รางวัล
รายงานข่าว เทคโนโลยี
5ireChain ริเริ่ม 'Testnet Thunder: GA' ที่สร้างแรงจูงใจสำหรับการทดสอบความเครียดของเครือข่าย เชิญชวนผู้ใช้ให้เข้าร่วม Airdrop รางวัล
May 14, 2024
CRYPTOMERIA LABS PTE. บจก.