OpenAI melepaskan yang kuat ChatGPT AI chatbot
Singkatnya
ChatGPT adalah model AI percakapan paling cerdas
ChatGPT, berlawanan dengan GPT-3, adalah model yang telah diajarkan dengan cermat untuk melakukan obrolan interaktif dan menjaga alur wacana. Model yang digunakan untuk melatih ChatGPT, yang dilakukan pelatihan pada awal tahun 2022, adalah dari GPT-3.5 series.
Format dialog memungkinkan ChatGPT untuk menanggapi pertanyaan tambahan, mengakui kesalahannya, menyangkal asumsi yang salah, dan menolak permintaan yang tidak relevan. Chatbot sangat cerdas dan dapat membuat surat, membuat lelucon lucu, dan menjawab pertanyaan.
Sama seperti InstruksiGPT, OpenAI menggunakan Reinforcement Learning from Human Feedback (RLHF) untuk melatih model ini, dengan sedikit variasi dalam pengaturan pengumpulan data. OpenAI menggunakan penyetelan halus yang diawasi untuk melatih model awal dengan meminta pelatih AI manusia bertindak sebagai pengguna dan asisten AI dalam obrolan. Ini memberi pelatih akses ke rekomendasi penulisan sampel untuk membantu mereka membuat tanggapan mereka.
Beberapa contoh dialog ditampilkan dalam gambar.
Itu perlu mengumpulkan data perbandingan, yang terdiri dari dua atau lebih model balasan yang dinilai berdasarkan kualitas, untuk mengembangkan model hadiah untuk pembelajaran penguatan. Pengembang merekam diskusi yang dilakukan pelatih AI dengan chatbot untuk mengumpulkan informasi ini. Pencipta memilih pernyataan tertulis model secara acak, mengambil sampel sejumlah kesimpulan potensial, dan meminta pelatih AI untuk memeringkatnya. Itu dapat menyesuaikan model menggunakan Pengoptimalan Kebijakan Proksimal menggunakan model hadiah ini.
Bicaralah dengan chatbot ini di sini. Namun, saat ini server sedang penuh.
Baca lebih lanjut tentang GPT-3:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikelDamir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.