Alat 'Think' Baru dari Anthropic Memungkinkan Claude Berhenti Sejenak dan Berpikir dalam Situasi Penggunaan Alat yang Kompleks

Bitget App

Trading lebih cerdas

MPOST2025/03/24 11:44

Oleh:MPOST

Singkatnya Anthropic memperkenalkan alat “Think”, yang memungkinkan Claude menambahkan langkah berpikir tambahan—lengkap dengan ruang yang ditentukan—sebelum sampai pada jawaban akhirnya.

Perusahaan yang mengkhususkan diri dalam keselamatan dan penelitian AI, Antropik memperkenalkan alat “Think”, yang menyediakan ruang khusus untuk berpikir terstruktur selama mengerjakan tugas yang rumit. Alat ini memungkinkan Claude untuk memasukkan langkah berpikir tambahan—lengkap dengan ruang yang telah ditentukan—sebelum mencapai jawaban akhirnya.

Meskipun konsepnya mungkin tampak mirip dengan pemikiran yang diperluas, ada beberapa perbedaan utama. Pemikiran yang diperluas terjadi sebelum Claude mulai membuat respons, di mana ia mempertimbangkan dan menyempurnakan pendekatannya secara mendalam. Sebaliknya, alat "Think" digunakan setelah Claude mulai membuat respons, yang memungkinkannya untuk berhenti sejenak dan menilai apakah ia telah mengumpulkan semua informasi yang diperlukan untuk melanjutkan. Ini sangat bermanfaat selama tugas yang melibatkan rangkaian panggilan alat yang panjang atau percakapan multi-langkah dengan pengguna.

Alat "Think" sangat efektif dalam situasi ketika Claude tidak memiliki cukup informasi dari kueri pengguna saja dan perlu memproses data eksternal (seperti hasil dari panggilan alat). Alasan di balik alat ini kurang komprehensif dibandingkan proses berpikir yang diperluas dan lebih terfokus pada pengintegrasian informasi baru yang muncul selama tugas.

Anthropic merekomendasikan penggunaan pemikiran yang diperluas untuk skenario yang lebih sederhana, seperti panggilan alat yang tidak berurutan atau instruksi yang lugas. Ini juga efektif untuk tugas-tugas seperti pengodean, matematika, dan fisika, di mana Claude tidak perlu bergantung pada alat eksternal. Alat ini lebih cocok untuk tugas-tugas yang lebih kompleks, di mana Claude harus menganalisis keluaran alat dengan saksama, menavigasi pedoman terperinci dalam lingkungan yang sarat kebijakan, atau membuat keputusan berurutan yang saling membangun, di mana kesalahan dapat menimbulkan konsekuensi.

Praktik Terbaik untuk Menerapkan Alat 'Think'

Untuk memaksimalkan manfaat alat “Think” dengan Claude, Anthropic merekomendasikan praktik implementasi berikut berdasarkan eksperimen τ-bench-nya.

Strategi yang paling efektif adalah dengan menawarkan instruksi yang jelas tentang kapan dan bagaimana menggunakan alat "Think". Hal ini khususnya terlihat jelas dalam domain maskapai penerbangan τ-bench, di mana contoh-contoh khusus domain sangat meningkatkan efektivitas model dalam menerapkan alat "think". Contoh-contoh ini harus mencakup panduan tentang beberapa aspek, seperti: menguraikan tingkat detail yang diharapkan dalam proses penalaran, memecah instruksi yang rumit menjadi langkah-langkah yang dapat ditindaklanjuti, menyediakan pohon keputusan untuk menangani skenario umum, dan membantu menilai apakah semua informasi yang diperlukan telah dikumpulkan.

Selain itu, Antropik menemukan bahwa untuk instruksi yang panjang atau rumit, menempatkannya dalam perintah sistem lebih efektif daripada memasukkannya dalam deskripsi alat itu sendiri. Hal ini memungkinkan model untuk lebih mengintegrasikan proses berpikir ke dalam perilaku keseluruhannya dengan menyediakan konteks yang lebih luas.

Mengintegrasikan alat “Think” ke dalam implementasi Claude relatif mudah dan dapat menghasilkan peningkatan. Perusahaan menyarankan untuk memulai dengan kasus penggunaan yang menantang, terutama kasus di mana Claude kesulitan dengan kepatuhan kebijakan atau penalaran yang rumit dalam rangkaian panjang panggilan alat. Pengguna dapat memulai dengan menambahkan alat definition dan menerapkan alat "berpikir" yang disesuaikan khusus untuk domain tersebut. Proses ini memerlukan pengkodean minimal tetapi memfasilitasi penalaran yang lebih terstruktur. Pengguna juga harus mempertimbangkan untuk menyertakan petunjuk tentang kapan dan bagaimana menggunakan alat tersebut, bersama dengan contoh-contoh yang relevan dengan domain dalam perintah sistem.

Setelah alat ini tersedia, pengguna didorong untuk memantau dan menyempurnakan penggunaannya dengan mengamati bagaimana Claude menerapkannya dalam praktik. Mereka dapat menyesuaikan perintah untuk mendorong pola pikir yang lebih efektif. Penambahan alat baru memiliki sedikit kekurangan dalam hal kinerja. Alat ini tidak akan mengubah perilaku eksternal kecuali Claude memilih untuk menggunakannya, dan alat ini tidak mengganggu alat atau alur kerja yang ada.

Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.

PoolX: Kunci untuk token baru.

APR hingga 12%. Selalu aktif, selalu dapat airdrop.

Kunci sekarang!

Kamu mungkin juga menyukai

ZKsync dan Hacker Capai Kesepakatan, US$5 Juta Token yang Dicuri Berhasil Dipulihkan

Coinfolks•2025/04/26 01:33

Ethereum menutup divisi pengembangan perangkat lunak utamanya, Gitcoin Labs

Ringkasan Cepat Gitcoin menutup divisi pengembangan perangkat lunak utamanya, Gitcoin Labs, sebagian besar karena kurangnya keuntungan, proyek tersebut mengumumkan pada hari Jumat. Sebagai bagian dari perubahan ini, proyek tersebut akan menutup Grants Stack, alat untuk mengelola program grants, dan mekanisme pendanaan blockchain Protokol Allo.

The Block•2025/04/25 22:45

Ethereum menutup divisi pengembangan perangkat lunak utamanya, Gitcoin Labs

Perusahaan Pengembangan DeFi, 'MSTR dari Solana,' mengajukan penawaran shelf $1 miliar dengan SEC

Ikhtisar Cepat Perusahaan Pengembangan DeFi, perusahaan publik terbaru yang membeli dan melakukan staking SOL sebagai bagian dari pivot Solana, telah mengajukan penawaran shelf senilai $1 miliar dengan Komisi Sekuritas dan Bursa AS. Penawaran shelf memungkinkan perusahaan untuk mendaftar untuk penerbitan sekuritas baru agar dapat menawarkan penjualan ekuitas dan utang dari waktu ke waktu.

The Block•2025/04/25 22:45