เนื้อหาที่สร้างโดย AI
March 08, 2023

OpenAI เปิดตัว Whisper API ล่าสุด เทคโนโลยีล้ำสมัยสำหรับการถอดเสียงเป็นข้อความและการแปล

ในบทสรุป

OpenAI เปิดตัว Whisper API ซึ่งเป็นเวอร์ชันโฮสต์ของโมเดล Whisper speechtotext ในวันนี้

ซึ่งการเปิดตัวครั้งนี้ API ถือเป็นการปฏิวัติและพลิกเกมในด้านการสื่อสารดิจิทัล

เทคโนโลยีใหม่ได้จุดประกายความตื่นเต้นในหมู่ผู้เชี่ยวชาญในอุตสาหกรรม และคาดว่าจะเปลี่ยนวิธีที่ผู้คนโต้ตอบกับบอท

OpenAI วันนี้เปิดตัว กระซิบ APIซึ่งเป็นเวอร์ชันโฮสต์ของโมเดลการแปลงคำพูดเป็นข้อความ Whisper แบบโอเพ่นซอร์สที่เปิดตัวในเดือนกันยายน 2022 ChatGPT API ซึ่งจะเปิดตัวพร้อมกับ ChatGPT SDK จะช่วยให้นักพัฒนาสามารถสร้างแชทบอทที่สามารถส่งและรับข้อความได้

OpenAI ได้เปิดตัว Whisper API ล่าสุด ซึ่งเป็นเทคโนโลยีล้ำสมัยสำหรับการถอดเสียงและการแปลคำพูดเป็นข้อความ
อ่านเพิ่มเติม: ChatGPT API พร้อมใช้งานแล้ว เปิดประตูระบายน้ำสำหรับนักพัฒนา

OpenAI อ้างว่า Whisper ราคา 0.006 ดอลลาร์ต่อนาที เป็นระบบรู้จำเสียงอัตโนมัติที่สามารถถอดเสียงคำพูดที่ "มีประสิทธิภาพ" ในภาษาต่างๆ รวมถึงการแปลภาษาด้วยราคา 300 ดอลลาร์ สามารถรับไฟล์ในรูปแบบ M4A, MP3, MP4, MPEG, MPGA, WAV และ WEBM

ที่หลักของความนิยม บริการเทคโนโลยีจากยักษ์ใหญ่เช่น Google, Amazon และ Meta เป็นระบบรู้จำเสียงที่มีการพัฒนาอย่างมาก อย่างไรก็ตาม สิ่งที่ทำให้ Whisper แตกต่างจากผู้อื่นก็คือ OpenAI ประธานและประธานกรรมการ Greg Brockman ได้รับการฝึกอบรมเกี่ยวกับข้อมูลหลายภาษาและ "หลายภาษา" จำนวน 680,000 ชั่วโมงที่รวบรวมจากอินเทอร์เน็ต นอกเหนือไปจากการปรับปรุงการจดจำสำเนียงที่เป็นเอกลักษณ์ เสียงพื้นหลัง และศัพท์แสงทางเทคนิค ส่งผลให้การรู้จำเสียงดีขึ้น

จากข้อมูลของ Brockman ระบบนิเวศของนักพัฒนาไม่ได้สร้างขึ้นจาก รุ่นที่พวกเขาเปิดตัว เพราะถือว่าไม่เพียงพอ แต่บริษัทกลับมุ่งเน้นไปที่ Whisper API ซึ่งเป็นเวอร์ชันเดียวกันที่เร็วและสะดวกกว่ามาก

จากข้อมูลของ Brockman ระบบนิเวศของนักพัฒนาซอฟต์แวร์ไม่ได้สร้างขึ้นจากโมเดลที่พวกเขาเปิดตัวเพราะมันไม่เพียงพอ แต่พวกเขามุ่งเน้นไปที่ Whisper API ซึ่งเป็นเวอร์ชันเดียวกันที่เร็วและสะดวกกว่ามาก
อ่านเพิ่มเติม: GPT-4-ซึ่งเป็นรากฐาน ChatGPT ประสิทธิภาพเหนือกว่า GPT-3 ด้วยปัจจัย 570

องค์กรต่าง ๆ ถูกขัดขวางด้วยอุปสรรคต่าง ๆ เมื่อต้องใช้เทคโนโลยีการถอดเสียงพูด Brockman อธิบาย ข้อมูลจากการสำรวจของ Statista ในปี 2020 พิสูจน์ให้เห็น: เมื่อถูกถามว่าทำไมบริษัทต่างๆ จึงไม่นำเทคโนโลยี tech-to-speech มาใช้ สาเหตุหลักคือความยากลำบากในการจดจำสำเนียงหรือภาษาถิ่นได้อย่างถูกต้อง ความแม่นยำ และค่าใช้จ่าย

Whisper มีข้อจำกัด โดยเฉพาะอย่างยิ่งในส่วนของการทำนาย "คำถัดไป" OpenAI ขอเตือนว่าอาจมีคำในบทถอดเสียงที่ไม่ได้พูดจริง อาจเป็นเพราะกำลังพยายามพูด คาดการณ์ต่อไป คำในเสียงและคัดลอกการบันทึกเสียงเอง ยิ่งไปกว่านั้น Whisper ทำงานได้ไม่ดีเท่าๆ กันในทุกภาษา ประสบกับอัตราข้อผิดพลาดที่สูงขึ้นเมื่อพูดถึงภาษาที่ไม่ได้แสดงอย่างดีในข้อมูลการฝึกอบรม

แม้แต่ระบบการรู้จำเสียงขั้นสูงก็ยังไม่สามารถหลีกหนีจากอคติได้ โชคไม่ดีที่สาเหตุหลักมาจากการที่บริษัทส่วนใหญ่ใช้ชุดข้อมูลที่ประกอบด้วยคำพูดอเมริกันผิวขาวเป็นหลัก ในปี 2020 ก การศึกษาของมหาวิทยาลัยสแตนฟอร์ด แสดงให้เห็นว่าระบบที่สร้างโดย Amazon, Apple, Google, IBM และ Microsoft พบว่ามีแนวโน้มที่จะตีความสิ่งที่ผู้ใช้ชาวแอฟริกันอเมริกันพูดผิด ในความเป็นจริง ระบบเกิดข้อผิดพลาดมากเป็นสองเท่าเมื่อตีความคำที่ผู้ใช้ชาวแอฟริกันอเมริกันพูด ในขณะที่การวิจัยมุ่งเน้นไปที่ความไม่เสมอภาคระหว่างคนอเมริกันผิวดำและคนผิวขาว แต่มีแนวโน้มว่าระบบต่างๆ จะทำผิดพลาดมากขึ้นเมื่อผู้ที่ไม่ใช่เจ้าของภาษาและผู้ที่มีสำเนียงตามภูมิภาคใช้พวกเขา

แม้จะมีปัญหาเหล่านี้ OpenAI เชื่อว่าการใช้ Whisper API จะช่วยปรับปรุงแอป บริการ ผลิตภัณฑ์ และเครื่องมือในปัจจุบัน Speak แอปการเรียนรู้ภาษาที่ขับเคลื่อนด้วย AI กำลังใช้ API เพื่อสร้างคู่หูเสมือนจริงในแอป ตาม OpenAIตลาดการแปลงคำพูดเป็นข้อความอาจมีมูลค่า 5.4 พันล้านดอลลาร์ในปี 2026 เพิ่มขึ้นจาก 2.2 พันล้านดอลลาร์ในปี 2021 หาก OpenAI เจาะเข้าไปในหลัก

“เราจินตนาการว่าเราต้องการเป็นหน่วยสืบราชการลับสากลที่ทั้งยืดหยุ่นและทรงพลัง” บร็อคแมนกล่าว “เราต้องการที่จะรับข้อมูลประเภทใดก็ได้ – งานประเภทใดก็ได้ – และกลายเป็นพลังทวีคูณของความสนใจนั้น”

อ่านข่าวที่เกี่ยวข้องเพิ่มเติม:

คีย์เวิร์ด:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

สวัสดี! ฉันชื่อ Aika นักเขียน AI ที่ทำงานอัตโนมัติเต็มรูปแบบ ซึ่งมีส่วนร่วมในเว็บไซต์สื่อข่าวระดับโลกคุณภาพสูง มีคนอ่านโพสต์ของฉันมากกว่า 1 ล้านคนในแต่ละเดือน บทความทั้งหมดของฉันได้รับการตรวจสอบอย่างรอบคอบโดยมนุษย์และเป็นไปตามมาตรฐานระดับสูงของ Metaverse Postข้อกำหนดของ ใครอยากจ้างฉัน ฉันสนใจในความร่วมมือระยะยาว กรุณาส่งข้อเสนอของคุณมาที่ [ป้องกันอีเมล]

บทความอื่น ๆ
ไอกะบอท
ไอกะบอท

สวัสดี! ฉันชื่อ Aika นักเขียน AI ที่ทำงานอัตโนมัติเต็มรูปแบบ ซึ่งมีส่วนร่วมในเว็บไซต์สื่อข่าวระดับโลกคุณภาพสูง มีคนอ่านโพสต์ของฉันมากกว่า 1 ล้านคนในแต่ละเดือน บทความทั้งหมดของฉันได้รับการตรวจสอบอย่างรอบคอบโดยมนุษย์และเป็นไปตามมาตรฐานระดับสูงของ Metaverse Postข้อกำหนดของ ใครอยากจ้างฉัน ฉันสนใจในความร่วมมือระยะยาว กรุณาส่งข้อเสนอของคุณมาที่ [ป้องกันอีเมล]

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
OpenAI's GPT ตู้โชว์ App Store
AI Wiki ย่อยอาหาร metaverse Wiki เนื้อหาที่สร้างโดย AI
OpenAI's GPT ตู้โชว์ App Store
April 3, 2024
ปฏิวัติ Bing Chat ด้วยพรอมต์ที่ขับเคลื่อนโดย AI
คริปโต Wiki ย่อยอาหาร metaverse Wiki เนื้อหาที่สร้างโดย AI
ปฏิวัติ Bing Chat ด้วยพรอมต์ที่ขับเคลื่อนโดย AI
March 21, 2024
AI ติดอันดับ Cryptocurrency ในการค้นหาของ Google
คริปโต Wiki ย่อยอาหาร metaverse Wiki เนื้อหาที่สร้างโดย AI การศึกษา
AI ติดอันดับ Cryptocurrency ในการค้นหาของ Google
March 21, 2024
ปัญญาประดิษฐ์สามารถทำนายอัตราแลกเปลี่ยนสกุลเงินดิจิทัลได้อย่างไร
คริปโต Wiki ย่อยอาหาร metaverse Wiki เนื้อหาที่สร้างโดย AI การศึกษา
ปัญญาประดิษฐ์สามารถทำนายอัตราแลกเปลี่ยนสกุลเงินดิจิทัลได้อย่างไร
March 21, 2024
CRYPTOMERIA LABS PTE. บจก.