Laporan Berita Teknologi
Semoga 08, 2026

Baru OpenAI Model Audio Memperkasakan Pembantu Suara Masa Nyata Dengan Terjemahan Berbilang Bahasa dan Kecerdasan Penstriman

Secara ringkas

OpenAI dikeluarkan GPTModel -Realtime-2, Translate dan Whisper, mengembangkan AI suara masa nyata dengan penaakulan, penterjemahan dan transkripsi untuk aplikasi perbualan lanjutan.

Baru OpenAI Model Audio Memperkasakan Pembantu Suara Masa Nyata Dengan Terjemahan Berbilang Bahasa dan Kecerdasan Penstriman

OpenAI mengumumkan satu set model audio baharu dalam ekosistem APInya, menandakan pengembangan dalam keupayaan suara masa nyata untuk pembangun dan aplikasi berasaskan AI. Keluaran ini merangkumi GPT-Masa Nyata-2, GPT-Terjemahan Masa Nyata, dan GPT-Realtime-Whisper, setiap satunya direka bentuk untuk mendayakan interaksi suara yang lebih canggih, responsif dan peka konteks merentasi pelbagai kes penggunaan.

GPT-Realtime-2 diletakkan sebagai model suara paling canggih syarikat setakat ini, memperkenalkan GPT-5-kelaskan penaakulan ke dalam perbualan audio langsung. Model ini direka bentuk untuk mengendalikan permintaan pengguna yang kompleks, mengekalkan kesinambungan kontekstual dan menyokong penaakulan berbilang langkah sambil berinteraksi dalam masa nyata. Ia bertujuan untuk aplikasi di mana ejen suara bukan sahaja mesti bertindak balas dengan cepat tetapi juga mentafsir niat, mengurus gangguan dan melaksanakan tugas melalui penggunaan alat bersepadu.

Di samping itu, GPT-Realtime-Translate membolehkan terjemahan pertuturan secara langsung merentasi lebih 70 bahasa input ke dalam 13 bahasa output. Sistem ini dibina untuk mengekalkan aliran perbualan sambil mengekalkan makna dan masa, membolehkan penutur berkomunikasi dalam pelbagai bahasa tanpa kelewatan yang ketara. Keupayaan ini disasarkan kepada sokongan pelanggan global, pendidikan, perjalanan dan perkhidmatan komunikasi rentas sempadan.

Model ketiga, GPT-Realtime-Whisper, memberi tumpuan kepada penstriman transkripsi pertuturan-ke-teks. Ia menyediakan transkripsi berterusan dan berlatensi rendah semasa pengguna bercakap, membolehkan kapsyen masa nyata, dokumentasi langsung dan pemprosesan hiliran segera bagi kandungan lisan. Model ini direka bentuk untuk persekitaran yang memerlukan penukaran pertuturan kepada teks yang pantas, seperti mesyuarat, siaran media dan aliran kerja perusahaan.

OpenAI menggambarkan keluaran gabungan ini sebagai langkah ke arah antara muka suara yang melangkaui sistem arahan dan tindak balas asas. Daripada sekadar mengecam pertuturan dan menjana balasan, model ini bertujuan untuk menyokong penaakulan, terjemahan, transkripsi dan pelaksanaan tindakan berterusan dalam satu aliran perbualan. Matlamatnya adalah untuk membolehkan sistem berasaskan suara yang boleh berfungsi lebih seperti pembantu interaktif yang mampu menyelesaikan tugas sambil mengekalkan dialog semula jadi.

GPT-Realtime-2 Memajukan Seni Bina AI Suara Dengan Sistem Suara-Ke-Tindakan Dan Tingkap Konteks Diperluas

Syarikat itu mengetengahkan beberapa corak reka bentuk baharu yang didayakan oleh teknologi ini. Ini termasuk sistem suara-ke-tindakan, di mana pengguna boleh menerangkan tugasan yang dilaksanakan melalui penaakulan automatik dan penyepaduan alat; aplikasi sistem-ke-suara, di mana perisian menjana panduan lisan berdasarkan data kontekstual; dan sistem terjemahan suara-ke-suara, yang membolehkan komunikasi berbilang bahasa masa nyata antara penutur.

GPT-Realtime-2 memperkenalkan penambahbaikan seni bina tambahan untuk kegunaan pengeluaran. Ini termasuk tetingkap konteks yang lebih panjang yang dikembangkan kepada 128K token, tingkah laku pemulihan yang lebih baik semasa gangguan atau ralat, pelaksanaan alat selari dengan maklum balas yang telus dan pelarasan nada yang lebih terkawal bergantung pada konteks perbualan. Pembangun juga boleh memperhalusi tahap penaakulan untuk mengimbangi kelajuan dan kerumitan berdasarkan keperluan aplikasi.

Penanda aras prestasi yang dipetik oleh OpenAI menunjukkan hasil yang lebih baik dalam penaakulan berasaskan audio dan tugasan mengikuti arahan berbanding lelaran model masa nyatanya yang sebelumnya. Sistem ini juga menunjukkan pengendalian terminologi khusus domain yang lebih kukuh dan tingkah laku yang lebih stabil dalam tetapan perbualan berbilang pusingan.

Keluaran ini juga menggabungkan mekanisme keselamatan, termasuk pemantauan masa nyata dan pengelasan kandungan dalam sesi aktif, di samping kawalan peringkat pembangun untuk perlindungan tambahan. Model ini tersedia melalui API Masa Nyata dan diposisikan untuk penggunaan merentasi aplikasi perusahaan, pengguna dan pembangun, dengan penetapan harga berstruktur pada metrik pemprosesan audio berasaskan penggunaan.

Pengenalan GPT-Realtime-2 dan model yang disertakan mencerminkan peralihan yang lebih luas ke arah sistem pengkomputeran berasaskan suara yang mampu menaakul, menterjemah dan menyalin dalam masa nyata, dengan tujuan menjadikan interaksi lisan dengan perisian lebih berfungsi, adaptif dan berkemampuan operasi.

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Alisa, seorang wartawan yang berdedikasi di MPost, pakar dalam kripto, AI, pelaburan dan bidang yang luas Web3. Dengan memerhatikan trend dan teknologi yang sedang muncul, beliau menyampaikan liputan komprehensif untuk memaklumkan dan melibatkan pembaca dalam landskap kewangan digital yang sentiasa berkembang.

lebih banyak artikel
Alisa Davidson
Alisa Davidson

Alisa, seorang wartawan yang berdedikasi di MPost, pakar dalam kripto, AI, pelaburan dan bidang yang luas Web3. Dengan memerhatikan trend dan teknologi yang sedang muncul, beliau menyampaikan liputan komprehensif untuk memaklumkan dan melibatkan pembaca dalam landskap kewangan digital yang sentiasa berkembang.

Bagaimana Minmax Membina Terminal Dagangan AI Profesional Pasaran Ramalan Masih Kekurangan Pada Tahun 2026

Minmax memproses kira-kira $100,000 dalam jumlah dalam tiga hari pertama bulan Jun, kebanyakannya melalui ...

Mengetahui lebih lanjut

Ketenangan Sebelum Ribut Solana: Apa Carta, Paus dan Isyarat Dalam Rangkaian Yang Dikatakan Sekarang

Solana telah menunjukkan prestasi yang kukuh, didorong oleh peningkatan penerimaan, kepentingan institusi dan perkongsian utama, sambil menghadapi potensi ...

Mengetahui lebih lanjut
Maklumat Lanjut
Maklumat Lanjut
Perdebatan Bawah Bitcoin: Galaxy, NYDIG, Dan Standard Chartered Diverge, Tetapi Bitwise Mengatakan Kenaikan Adalah Persoalan Sebenar
pasaran Laporan Berita Teknologi
Perdebatan Bawah Bitcoin: Galaxy, NYDIG, Dan Standard Chartered Diverge, Tetapi Bitwise Mengatakan Kenaikan Adalah Persoalan Sebenar
Jun 16, 2026
Pemegang Bitcoin Jangka Panjang Mencapai Bahagian Rekod Bekalan Ketika Pasaran Menunggu Keputusan FOMC Pertama Warsh
pasaran Laporan Berita Teknologi
Pemegang Bitcoin Jangka Panjang Mencapai Bahagian Rekod Bekalan Ketika Pasaran Menunggu Keputusan FOMC Pertama Warsh
Jun 16, 2026
Inveniam Akan Memperoleh MANTRA Dalam Langkah Memperluas Infrastruktur AI, RWA Dan Rantaian Blok Institusi
Laporan Berita Teknologi
Inveniam Akan Memperoleh MANTRA Dalam Langkah Memperluas Infrastruktur AI, RWA Dan Rantaian Blok Institusi
Jun 16, 2026
Inco Lightning Dilancarkan di Pangkalan, Memperluas Privasi Kontrak Pintar Dengan Pengiraan Tersulit dan Perlindungan Data
Laporan Berita Teknologi
Inco Lightning Dilancarkan di Pangkalan, Memperluas Privasi Kontrak Pintar Dengan Pengiraan Tersulit dan Perlindungan Data
Jun 16, 2026