Chain of Thought (CoT) یا «تفکر زنجیرهای» یکی از مهمترین کشفیات سالهای اخیر در حوزهی مهندسی پرامپت است. ایده ساده است: بهجای اینکه از مدل بخواهی مستقیم به جواب برسد، از او میخواهی مرحلهبهمرحله توضیح بدهد. این تغییر کوچک، در مسائل ریاضی، منطقی و تصمیمسازی، دقت مدل را بهطور چشمگیری بالا میبرد. در این مقاله با مثال واقعی فارسی، علم پشتش، انواع مختلف و دامهای پنهان CoT آشنا میشویم.
Chain of Thought چیست؟
Chain of Thought بهمعنای «زنجیرهی استدلال» است. در پرامپتنویسی، یعنی به مدل میگویی نه تنها جواب نهایی را بده، بلکه مسیر فکر کردنش را هم بنویسد. این کار سه فایده دارد:
- مدل مجبور است هر گام را به دقت طی کند، نه با حدس و گمان
- اگر اشتباهی در منطقش باشد، تو سریع آن را میبینی
- مدل خودش هم در حین توضیح، خطاهای فکریاش را کشف و اصلاح میکند
مثال واقعی — قبل و بعد
پرامپت بدون CoT:
یک کافه روزانه ۱۲۰ مشتری دارد. ۳۰٪ آنها سفارش قهوهی ویژه به قیمت ۸۵ هزار تومان میدهند. ۴۵٪ سفارش قهوهی عادی ۴۵ هزار تومانی. بقیه فقط شیرینی به ارزش متوسط ۲۸ هزار تومان میگیرند. درآمد روزانه چقدر است؟
جواب مدل (بدون CoT) معمولاً مستقیم به یک عدد میرسد و گاهی اشتباه است.
همان پرامپت با CoT:
... بقیه فقط شیرینی به ارزش متوسط ۲۸ هزار تومان میگیرند.
گام به گام محاسبه کن، در پایان درآمد روزانه را بگو.
این بار مدل دستهبهدسته حساب میکند، تکتک ضربها را نشان میدهد، و در آخر جمع نهایی را میدهد. درصد خطا تقریباً صفر میشود.
چرا CoT اینقدر مؤثر است؟
مدلهای زبانی بهصورت «پیشبینی کلمهی بعدی» کار میکنند. وقتی از آنها سؤال پیچیده میپرسی و انتظار جواب کوتاه داری، مدل مجبور میشود تمام محاسبات را در یک «پرش ذهنی» انجام دهد. این پرش، خطاپذیر است.
وقتی به مدل میگویی گامبهگام فکر کن، در واقع به او اجازهی استفاده از فضای کاری بیشتر میدهی. مدل هر گام را در خروجی مینویسد، و گام بعد را بر اساس گام قبل میسازد. این دقیقاً مشابه روشی است که انسانها مسائل پیچیده را حل میکنند — با کاغذ و قلم، نه در ذهن.
سه نوع اصلی Chain of Thought
۱. Zero-shot CoT
سادهترین فرم. کافی است در انتهای پرامپتت بنویسی «گام به گام فکر کن» یا «بیا قدم به قدم پیش بریم». هیچ مثالی هم لازم نیست. این تکنیک در ۷۰٪ مواقع برای کارهای عملی کافی است.
۳ کارمند داریم. حقوق نفر اول ۲۵ میلیون، نفر دوم ۳۲ میلیون، نفر سوم ۴۰ میلیون.
مالیات بر اساس سقف ۲۸ میلیون معافیت + ۱۰٪ مازاد.
هر کدام چقدر مالیات میدهند؟ گام به گام محاسبه کن.
۲. Few-shot CoT
وقتی Zero-shot کافی نیست، چند مثال کامل با مسیر فکر میدهی. مدل از آن مثالها سبک تفکرت را یاد میگیرد و در سؤال جدید همان مسیر را تکرار میکند. این روش در ترکیب با Few-shot Learning فوقالعاده قوی است.
مثال ۱:
سؤال: ۳ سیب + ۲ پرتقال چند میوه است؟
حل: ۳ سیب میوه است. ۲ پرتقال هم میوه است. جمع = ۵ میوه.
مثال ۲:
سؤال: ۴ مداد + ۵ خودکار چند ابزار نوشتاری است؟
حل: مداد ابزار نوشتاری است. خودکار هم ابزار نوشتاری است. ۴+۵ = ۹.
حالا تو:
سؤال: ۷ کیلوگرم برنج + ۳ کیلوگرم آرد چند کیلوگرم مواد غذایی است؟
حل:
۳. Self-consistency
تکنیک پیشرفتهتر. به جای یک بار پرسیدن، چندین بار با CoT پرسیدن و رایگیری بین جوابها. اگر ۵ بار از مدل بپرسی و ۴ بار جواب X باشد و ۱ بار Y، جواب درست بهاحتمال ۹۰٪ X است. این روش برای تصمیمسازی پرخطر کاربردی است.
عبارات جادویی فعالسازی CoT
این عبارات کوتاه، میتوانند رفتار مدل را بهطور کامل عوض کنند. هر کدام را در شرایط متفاوتی استفاده کن:
- «گام به گام فکر کن» — سادهترین و عمومیترین. برای ۹۰٪ مسائل کافی است.
- «بیا قدم به قدم پیش بریم» — لحن گفتوگوییتر، خوب برای آموزش.
- «اول مسئله را تحلیل کن، بعد راهحل را بنویس» — برای مسائل پیچیدهتر که نیاز به شناخت اولیه دارند.
- «تمام احتمالات را در نظر بگیر» — برای تصمیمسازی و انتخاب.
- «قبل از جواب نهایی، ۳ فرضیهی متفاوت بساز و بررسی کن» — نسخهی پیشرفته برای مسائل خلاقانه.
- «مسئله را به ۵ زیرسؤال کوچکتر تبدیل کن، هر کدام را جداگانه پاسخ بده» — مناسب برای پروژههای بزرگ.
کاربردهای واقعی CoT در ایران
CoT فقط برای مسائل ریاضی مدرسه نیست. در کسبوکار واقعی این کاربردها فوقالعاده مؤثرند:
- تحلیل مالی: محاسبهی سود و زیان، مالیات، حقوق کارمندان — جایی که اشتباه یک گام منجر به نتیجهی کاملاً غلط میشود.
- تصمیمسازی استراتژیک: «آیا این محصول را راهاندازی کنم یا نه؟» — مدل گامبهگام مزایا، معایب، ریسکها و چشمانداز را تحلیل میکند.
- حقوقی: تفسیر یک قرارداد یا قانون. مدل اول هر بند را جداگانه میخواند، بعد ارتباطها را تحلیل میکند.
- برنامهنویسی: دیباگ کد. بهجای اینکه مستقیم بپرسی «چرا کار نمیکند؟»، بپرس «گامبهگام بررسی کن این تابع چه میکند، کجا ممکن است خطا بدهد.»
- پزشکی (با احتیاط): تشخیص افتراقی. مدل علائم را گامبهگام در برابر بیماریهای محتمل میسنجد. حتماً مشاورهی پزشک واقعی را جایگزین نکن — این فقط ابزار کمکی است.
- مارکتینگ: طراحی یک کمپین کامل. مدل اول مخاطب را تحلیل میکند، بعد پیام، بعد کانال، بعد بودجه را گامبهگام طراحی میکند.
کِی CoT جواب نمیدهد؟
CoT یک ابزار قوی است، اما جادو نیست. در این موارد فایده ندارد و حتی ممکن است ضرر داشته باشد:
- سؤالات بسیار ساده: «پایتخت ایران کجاست؟» — اضافه کردن «گام به گام فکر کن» اینجا فقط خروجی را طولانی میکند.
- کارهای خلاقانهی محض: نوشتن شعر، طراحی برند، ایدهپردازی هنری. خلاقیت گاهی نیاز به «پرش» دارد، نه استدلال خطی.
- سؤالاتی که پاسخ از نوع «بله/خیر» دارند: اینجا توضیح اضافه ارزش نمیآورد.
- وقتی سرعت اولویت است: CoT خروجی را طولانیتر میکند و در نتیجه پاسخ کندتر میآید. در چتباتهای فروش زنده گاهی ارزشش را ندارد.
سوالات متداول
Chain of Thought چیست به زبان ساده؟
Chain of Thought یا «تفکر زنجیرهای» یعنی بهجای اینکه از AI انتظار جواب مستقیم داشته باشی، از او بخواهی مرحلهبهمرحله توضیح بدهد. این کار دقت پاسخ را در مسائل پیچیده تا چندین برابر افزایش میدهد.
CoT چه فرقی با Few-shot Learning دارد؟
CoT و Few-shot دو تکنیک متفاوت اما مکملاند. CoT روی «نحوهی تفکر» تمرکز دارد، Few-shot روی «نمونههای آموزشی». ترکیب آنها (Few-shot CoT) قویترین حالت پرامپتنویسی است. جزئیات کامل Few-shot را میتوانی اینجا بخوانی.
آیا CoT در فارسی هم کار میکند؟
بله. مدلهای امروزی مثل ChatGPT و Claude در فارسی هم CoT را بهخوبی انجام میدهند و عبارت «گام به گام فکر کن» در فارسی هم مؤثر است. فقط توجه داشته باش که فارسی یک زبان کممنبعتر است و کیفیت استدلال گاهی کمی پایینتر از انگلیسی میآید. در Gemini نتایج گاهی متغیرتر است.
بهترین عبارت برای فعالسازی CoT چیست؟
برای کارهای روزمره، «گام به گام فکر کن» کافی است. برای مسائل پیچیدهتر، «اول مسئله را تحلیل کن، بعد راهحل را بنویس» نتیجهی بهتری میدهد. در مسائل تصمیمسازی، «۳ فرضیهی متفاوت بساز و هر کدام را بررسی کن» موثرترین است.
CoT برای کارهای خلاقانه هم خوب است؟
نه همیشه. در نوشتن شعر، طراحی برند یا ایدهپردازی هنری، CoT میتواند خلاقیت را محدود کند چون مدل را به استدلال خطی هدایت میکند. برای کارهای خلاقانه، روشهایی مثل Persona Prompting معمولاً نتیجهی بهتری دارند.
آیا مدلهای جدید نیاز به CoT دارند؟
مدلهای استدلالی امروزی — مثل سریهای جدید Gemini، ChatGPT و Claude (نسخههای ۲۰۲۶) — CoT را بهصورت داخلی و خودکار انجام میدهند. اما حتی این مدلها در مسائل خاص از CoT صریح بهره میبرند، مخصوصاً وقتی میخواهی مسیر فکر مدل را ببینی و کنترل کنی.
Self-consistency چیست؟
Self-consistency تکنیکی پیشرفته است که در آن چند بار با CoT از مدل سؤال میکنی و سپس بین پاسخها رایگیری میکنی. اگر ۸ بار از ۱۰ بار جواب X بود، X بهاحتمال زیاد درست است. این روش برای تصمیمهای مهم و حساس کاربرد دارد.
میخوای از تئوری به مهارت برسی؟
این مقاله یک شروع است. اگر میخواهی مهندسی پرامپت را بهصورت مدون، با پروژهی واقعی و پشتیبانی مستقیم یاد بگیری، دورهی جامع مهندسی پرامپت همان مسیری است که دنبالش هستی — ۱۳ فصل، ۵۸ جلسه، گروه پشتیبانی و ۳ روز ضمانت بازگشت وجه.
شروع دوره