Alat 'Think' Baru dari Anthropic Memungkinkan Claude Berhenti Sejenak dan Berpikir dalam Situasi Penggunaan Alat yang Kompleks
Singkatnya Anthropic memperkenalkan alat “Think”, yang memungkinkan Claude menambahkan langkah berpikir tambahan—lengkap dengan ruang yang ditentukan—sebelum sampai pada jawaban akhirnya.
Perusahaan yang mengkhususkan diri dalam keselamatan dan penelitian AI, Antropik memperkenalkan alat “Think”, yang menyediakan ruang khusus untuk berpikir terstruktur selama mengerjakan tugas yang rumit. Alat ini memungkinkan Claude untuk memasukkan langkah berpikir tambahan—lengkap dengan ruang yang telah ditentukan—sebelum mencapai jawaban akhirnya.
Meskipun konsepnya mungkin tampak mirip dengan pemikiran yang diperluas, ada beberapa perbedaan utama. Pemikiran yang diperluas terjadi sebelum Claude mulai membuat respons, di mana ia mempertimbangkan dan menyempurnakan pendekatannya secara mendalam. Sebaliknya, alat "Think" digunakan setelah Claude mulai membuat respons, yang memungkinkannya untuk berhenti sejenak dan menilai apakah ia telah mengumpulkan semua informasi yang diperlukan untuk melanjutkan. Ini sangat bermanfaat selama tugas yang melibatkan rangkaian panggilan alat yang panjang atau percakapan multi-langkah dengan pengguna.
Alat "Think" sangat efektif dalam situasi ketika Claude tidak memiliki cukup informasi dari kueri pengguna saja dan perlu memproses data eksternal (seperti hasil dari panggilan alat). Alasan di balik alat ini kurang komprehensif dibandingkan proses berpikir yang diperluas dan lebih terfokus pada pengintegrasian informasi baru yang muncul selama tugas.
Anthropic merekomendasikan penggunaan pemikiran yang diperluas untuk skenario yang lebih sederhana, seperti panggilan alat yang tidak berurutan atau instruksi yang lugas. Ini juga efektif untuk tugas-tugas seperti pengodean, matematika, dan fisika, di mana Claude tidak perlu bergantung pada alat eksternal. Alat ini lebih cocok untuk tugas-tugas yang lebih kompleks, di mana Claude harus menganalisis keluaran alat dengan saksama, menavigasi pedoman terperinci dalam lingkungan yang sarat kebijakan, atau membuat keputusan berurutan yang saling membangun, di mana kesalahan dapat menimbulkan konsekuensi.
Praktik Terbaik untuk Menerapkan Alat 'Think'
Untuk memaksimalkan manfaat alat “Think” dengan Claude, Anthropic merekomendasikan praktik implementasi berikut berdasarkan eksperimen τ-bench-nya.
Strategi yang paling efektif adalah dengan menawarkan instruksi yang jelas tentang kapan dan bagaimana menggunakan alat "Think". Hal ini khususnya terlihat jelas dalam domain maskapai penerbangan τ-bench, di mana contoh-contoh khusus domain sangat meningkatkan efektivitas model dalam menerapkan alat "think". Contoh-contoh ini harus mencakup panduan tentang beberapa aspek, seperti: menguraikan tingkat detail yang diharapkan dalam proses penalaran, memecah instruksi yang rumit menjadi langkah-langkah yang dapat ditindaklanjuti, menyediakan pohon keputusan untuk menangani skenario umum, dan membantu menilai apakah semua informasi yang diperlukan telah dikumpulkan.
Selain itu, Antropik menemukan bahwa untuk instruksi yang panjang atau rumit, menempatkannya dalam perintah sistem lebih efektif daripada memasukkannya dalam deskripsi alat itu sendiri. Hal ini memungkinkan model untuk lebih mengintegrasikan proses berpikir ke dalam perilaku keseluruhannya dengan menyediakan konteks yang lebih luas.
Mengintegrasikan alat “Think” ke dalam implementasi Claude relatif mudah dan dapat menghasilkan peningkatan. Perusahaan menyarankan untuk memulai dengan kasus penggunaan yang menantang, terutama kasus di mana Claude kesulitan dengan kepatuhan kebijakan atau penalaran yang rumit dalam rangkaian panjang panggilan alat. Pengguna dapat memulai dengan menambahkan alat definition dan menerapkan alat "berpikir" yang disesuaikan khusus untuk domain tersebut. Proses ini memerlukan pengkodean minimal tetapi memfasilitasi penalaran yang lebih terstruktur. Pengguna juga harus mempertimbangkan untuk menyertakan petunjuk tentang kapan dan bagaimana menggunakan alat tersebut, bersama dengan contoh-contoh yang relevan dengan domain dalam perintah sistem.
Setelah alat ini tersedia, pengguna didorong untuk memantau dan menyempurnakan penggunaannya dengan mengamati bagaimana Claude menerapkannya dalam praktik. Mereka dapat menyesuaikan perintah untuk mendorong pola pikir yang lebih efektif. Penambahan alat baru memiliki sedikit kekurangan dalam hal kinerja. Alat ini tidak akan mengubah perilaku eksternal kecuali Claude memilih untuk menggunakannya, dan alat ini tidak mengganggu alat atau alur kerja yang ada.
Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.
Kamu mungkin juga menyukai
Satuan Tugas Kripto SEC akan membahas DeFi, tokenisasi di meja bundar yang baru dijadwalkan
Ringkasan Cepat SEC AS mengumumkan pada hari Selasa bahwa mereka telah menjadwalkan empat diskusi meja bundar lagi antara April dan Juni. Diskusi tersebut akan membahas topik termasuk tokenisasi dan DeFi. Meja bundar ini merupakan bagian dari upaya agensi untuk memberikan lebih banyak kejelasan pada ruang kripto.

Pasangan perdagangan margin spot baru - CRO/USDT
21Shares Membawa ETP Bitcoin, Solana, dan XRP ke Pasar Nordik

Pasar Kripto AS Siap untuk Prime Time, Menurut CEO Ripple

Berita trending
LainnyaHarga kripto
Lainnya








