Laporan berita Teknologi
15 Maret, 2023

GPT-4 Dapat Menangani Permintaan Gambar, Dokumen, Diagram, dan Tangkapan Layar Anda

Singkatnya

GPT-4 dapat menangani permintaan gambar, dokumen, diagram, dan tangkapan layar. Ini merupakan perbaikan GPT-3, yang hanya menangani teks.

GPT-4 memiliki kinerja unggul dalam berbagai ujian dan tes serta dapat mengakses informasi dan detail tambahan melalui gambar yang mungkin tidak tersedia dalam bentuk tertulis.

gpt-4 gambar mendokumentasikan tangkapan layar

OpenAItonggak terbaru, model baru GPT-4, dapat menerima permintaan yang menyertakan gambar, dokumen dengan teks, diagram, atau tangkapan layar sebagai masukan. Ini merupakan peningkatan yang signifikan dibandingkan versi sebelumnya, GPT-3, yang hanya dapat memahami dan menampilkan teks. Dengan fitur baru ini, GPT-4 menghasilkan keluaran teks dengan masukan yang terdiri dari teks dan gambar yang diselingi.

“Di berbagai domain—termasuk dokumen dengan teks dan foto, diagram, atau tangkapan layar—GPT-4 menunjukkan kemampuan serupa seperti pada input hanya teks,”

OpenAI Menulis

ChatGPT-4 memiliki ukuran yang lebih besar dibandingkan pendahulunya, yang menunjukkan bahwa ia telah menjalani pelatihan pada jumlah data yang lebih besar dan memuat lebih banyak bobot dalam file modelnya, sehingga mengakibatkan biaya pengoperasian yang lebih tinggi. Bahasa AI terbaru dapat menghasilkan teks mirip manusia dengan menggunakan belajar mendalam dan dilatih sebelumnya pada kumpulan data besar.

GPT-4 memiliki menunjukkan kinerja yang unggul atas bahasa AI lainnya dalam berbagai ujian dan tes karena kemampuannya untuk mengakses informasi dan detail tambahan melalui gambar yang mungkin tidak tersedia dalam bentuk tertulis.

Baru GPT-4 model dapat memberi tahu Anda apa sebenarnya yang digambarkan dalam ilustrasi, menganalisisnya, dan bahkan menjelaskan maknanya. Dalam demonya, GPT-4 menjelaskan lelucon visual dimana kabel VGA dihubungkan ke iPhone. Ini juga bisa menjelaskan apa yang tidak biasa dalam gambar yang menampilkan “menyetrika secara ekstrem”, yang dapat Anda lihat di bawah.

gpt-4 gambar
Sumber: OpenAI

Namun, ada juga implikasi yang lebih bermanfaat GPT-4pengetahuan yang baru ditemukan. Dalam pemaparannya terlihat bahwa PGT-4 dapat mengetahui apa saja yang bisa dimasak dari bahan-bahan yang tertera pada gambar. Artinya, model tersebut dapat membantu Anda memasak jika Anda memiliki produk makanan dan tidak tahu apa yang harus dilakukan dengannya. Ambil potret makanan yang Anda miliki, dan Obrolan-GPT dapat memberi tahu Anda apa yang bisa Anda siapkan dari bahan-bahan yang Anda miliki di rumah.

Kemampuan untuk memahami dan menafsirkan informasi visual membuat GPT-4 alat yang ampuh untuk tugas-tugas seperti pembuatan teks gambar, menjawab pertanyaan visual, dan bahkan pembuatan konten. Dengan integrasi pemahaman teks dan visual, GPT-4 memiliki potensi untuk merevolusi berbagai industri, seperti periklanan, desain, dan e-commerce, serta membantu orang melakukan tugas-tugas yang membosankan dan biasa-biasa saja.

Maju model bahasa juga 'memahami' tangkapan layar dan dokumen dengan teks, tabel, diagram, atau representasi visual lainnya. Misalnya, jika Anda mengunggah makalah penelitian tiga halaman dan memerlukan ringkasan dan penjelasannya, GPT-4 mampu melakukannya. 

Jangkar Bloomberg Jon Erlichman mendemonstrasikan bagaimana dia mampu mengubah desain sketsa tangan menjadi situs web fungsional.

Teknologi baru ini juga dapat digunakan sebagai alat bantu mobilitas karena dapat digunakan untuk mendeskripsikan lingkungan bagi penyandang tunanetra. Untuk tujuan ini, Open AI telah bermitra dengan aplikasi bernama Jadilah Mata Saya yang telah dirancang untuk membantu penyandang tunanetra ketika mereka perlu melihat sesuatu, misalnya, saat berbelanja bahan makanan. Aplikasi ini memungkinkan "sukarelawan dan profesional yang dapat melihat membantu mereka untuk menyelesaikan tugas besar dan kecil untuk membantu orang buta dan kurang penglihatan menjalani kehidupan yang lebih mandiri." Sekarang, ia juga menawarkan alat sukarelawan virtual yang didukung oleh OpenAI'S GPT-4.

Meskipun OpenAI'S GPT-4 saat ini menawarkan kemampuan untuk memproses teks dan gambar sebagai masukan, model tersebut belum dilengkapi untuk menangani masukan audio dan video. Namun demikian, ada indikasi bahwa modalitas ini mungkin disertakan dalam teknologi berikutnya.

Baca lebih lanjut:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Agne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].

lebih artikel
Agne Cimerman
Agne Cimerman

Agne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].

Hari Hukuman Tiba: Nasib CZ Digantung Saat Pengadilan AS Mempertimbangkan Permohonan DOJ

Changpeng Zhao siap menghadapi hukuman di pengadilan AS di Seattle hari ini.

Tahu lebih banyak

Pendiri Dompet Samourai Dituduh Memfasilitasi $2 Miliar dalam Penawaran Darknet

Kekhawatiran para pendiri Samourai Wallet menunjukkan kemunduran besar bagi industri ini, yang menggarisbawahi ...

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Kebangkitan AI dalam Pengembangan Game pada tahun 2024
AI Wiki Metaverse Wiki Pendidikan pasar Perangkat lunak Teknologi
Kebangkitan AI dalam Pengembangan Game pada tahun 2024
1 Mei 2024
Di Dalam Lab Inovasi AI Baru Estée Lauder: Melihat Lebih Dekat Bagaimana AI Generatif Mengubah Merek Kecantikan
Gaya Hidup Perangkat lunak Cerita dan Ulasan Teknologi
Di Dalam Lab Inovasi AI Baru Estée Lauder: Melihat Lebih Dekat Bagaimana AI Generatif Mengubah Merek Kecantikan
1 Mei 2024
Chainlink Dan Rapid Addition Berkolaborasi Untuk Mengembangkan Adaptor Blockchain Berbasis CCIP
Bisnis Laporan berita Teknologi
Chainlink Dan Rapid Addition Berkolaborasi Untuk Mengembangkan Adaptor Blockchain Berbasis CCIP
1 Mei 2024
BitSmiley Meluncurkan Alphanet V1, Debut di Jaringan Bitcoin Layer 2 Bitlayer
Laporan berita Teknologi
BitSmiley Meluncurkan Alphanet V1, Debut di Jaringan Bitcoin Layer 2 Bitlayer
1 Mei 2024