Chain of Thought
تفکر زنجیره‌ای در هوش مصنوعی

یک تکنیک ساده که با دو کلمه («گام به گام فکر کن») می‌تواند دقت AI را در مسائل پیچیده دو تا پنج برابر کند.

Chain of Thought (CoT) یا «تفکر زنجیره‌ای» یکی از مهم‌ترین کشفیات سال‌های اخیر در حوزه‌ی مهندسی پرامپت است. ایده ساده است: به‌جای اینکه از مدل بخواهی مستقیم به جواب برسد، از او می‌خواهی مرحله‌به‌مرحله توضیح بدهد. این تغییر کوچک، در مسائل ریاضی، منطقی و تصمیم‌سازی، دقت مدل را به‌طور چشمگیری بالا می‌برد. در این مقاله با مثال واقعی فارسی، علم پشتش، انواع مختلف و دام‌های پنهان CoT آشنا می‌شویم.

پاسخ کوتاه: Chain of Thought (تفکر زنجیره‌ای) یک تکنیک پرامپت‌نویسی است که در آن از مدل هوش مصنوعی می‌خواهید به‌جای پاسخ مستقیم، مرحله‌به‌مرحله استدلال کند. این کار با افزودن عبارتی مثل «قدم‌به‌قدم فکر کن» انجام می‌شود و دقت مدل را در مسائل ریاضی، منطقی و چندمرحله‌ای به‌طور چشمگیر بالا می‌برد.

Chain of Thought چیست؟

Chain of Thought به‌معنای «زنجیره‌ی استدلال» است. در پرامپت‌نویسی، یعنی به مدل می‌گویی نه تنها جواب نهایی را بده، بلکه مسیر فکر کردنش را هم بنویسد. این کار سه فایده دارد:

  • مدل مجبور است هر گام را به دقت طی کند، نه با حدس و گمان
  • اگر اشتباهی در منطقش باشد، تو سریع آن را می‌بینی
  • مدل خودش هم در حین توضیح، خطاهای فکری‌اش را کشف و اصلاح می‌کند

مثال واقعی — قبل و بعد

پرامپت بدون CoT:

یک کافه روزانه ۱۲۰ مشتری دارد. ۳۰٪ آن‌ها سفارش قهوه‌ی ویژه به قیمت ۸۵ هزار تومان می‌دهند. ۴۵٪ سفارش قهوه‌ی عادی ۴۵ هزار تومانی. بقیه فقط شیرینی به ارزش متوسط ۲۸ هزار تومان می‌گیرند. درآمد روزانه چقدر است؟

جواب مدل (بدون CoT) معمولاً مستقیم به یک عدد می‌رسد و گاهی اشتباه است.

همان پرامپت با CoT:

... بقیه فقط شیرینی به ارزش متوسط ۲۸ هزار تومان می‌گیرند.

گام به گام محاسبه کن، در پایان درآمد روزانه را بگو.

این بار مدل دسته‌به‌دسته حساب می‌کند، تک‌تک ضرب‌ها را نشان می‌دهد، و در آخر جمع نهایی را می‌دهد. درصد خطا تقریباً صفر می‌شود.

چرا CoT اینقدر مؤثر است؟

مدل‌های زبانی به‌صورت «پیش‌بینی کلمه‌ی بعدی» کار می‌کنند. وقتی از آن‌ها سؤال پیچیده می‌پرسی و انتظار جواب کوتاه داری، مدل مجبور می‌شود تمام محاسبات را در یک «پرش ذهنی» انجام دهد. این پرش، خطاپذیر است.

وقتی به مدل می‌گویی گام‌به‌گام فکر کن، در واقع به او اجازه‌ی استفاده از فضای کاری بیشتر می‌دهی. مدل هر گام را در خروجی می‌نویسد، و گام بعد را بر اساس گام قبل می‌سازد. این دقیقاً مشابه روشی است که انسان‌ها مسائل پیچیده را حل می‌کنند — با کاغذ و قلم، نه در ذهن.

یافته‌ی پژوهشی: در مقاله‌ی معروف Wei و همکاران (۲۰۲۲)، Chain-of-Thought دقت مدل PaLM 540B را در بنچمارک ریاضی GSM8K از حدود ۱۸٪ به ۵۷٪ رساند — یعنی بیش از سه برابر (منبع: arXiv:2201.11903). همین اثر در مدل‌های استدلالی امروزی هم به‌شکل دیگری دیده می‌شود.

سه نوع اصلی Chain of Thought

۱. Zero-shot CoT

ساده‌ترین فرم. کافی است در انتهای پرامپتت بنویسی «گام به گام فکر کن» یا «بیا قدم به قدم پیش بریم». هیچ مثالی هم لازم نیست. این تکنیک در ۷۰٪ مواقع برای کارهای عملی کافی است.

۳ کارمند داریم. حقوق نفر اول ۲۵ میلیون، نفر دوم ۳۲ میلیون، نفر سوم ۴۰ میلیون.
مالیات بر اساس سقف ۲۸ میلیون معافیت + ۱۰٪ مازاد.
هر کدام چقدر مالیات می‌دهند؟ گام به گام محاسبه کن.

۲. Few-shot CoT

وقتی Zero-shot کافی نیست، چند مثال کامل با مسیر فکر می‌دهی. مدل از آن مثال‌ها سبک تفکرت را یاد می‌گیرد و در سؤال جدید همان مسیر را تکرار می‌کند. این روش در ترکیب با Few-shot Learning فوق‌العاده قوی است.

مثال ۱:
سؤال: ۳ سیب + ۲ پرتقال چند میوه است؟
حل: ۳ سیب میوه است. ۲ پرتقال هم میوه است. جمع = ۵ میوه.

مثال ۲:
سؤال: ۴ مداد + ۵ خودکار چند ابزار نوشتاری است؟
حل: مداد ابزار نوشتاری است. خودکار هم ابزار نوشتاری است. ۴+۵ = ۹.

حالا تو:
سؤال: ۷ کیلوگرم برنج + ۳ کیلوگرم آرد چند کیلوگرم مواد غذایی است؟
حل:

۳. Self-consistency

تکنیک پیشرفته‌تر. به جای یک بار پرسیدن، چندین بار با CoT پرسیدن و رای‌گیری بین جواب‌ها. اگر ۵ بار از مدل بپرسی و ۴ بار جواب X باشد و ۱ بار Y، جواب درست به‌احتمال ۹۰٪ X است. این روش برای تصمیم‌سازی پر‌خطر کاربردی است.

عبارات جادویی فعال‌سازی CoT

این عبارات کوتاه، می‌توانند رفتار مدل را به‌طور کامل عوض کنند. هر کدام را در شرایط متفاوتی استفاده کن:

  • «گام به گام فکر کن» — ساده‌ترین و عمومی‌ترین. برای ۹۰٪ مسائل کافی است.
  • «بیا قدم به قدم پیش بریم» — لحن گفت‌وگویی‌تر، خوب برای آموزش.
  • «اول مسئله را تحلیل کن، بعد راه‌حل را بنویس» — برای مسائل پیچیده‌تر که نیاز به شناخت اولیه دارند.
  • «تمام احتمالات را در نظر بگیر» — برای تصمیم‌سازی و انتخاب.
  • «قبل از جواب نهایی، ۳ فرضیه‌ی متفاوت بساز و بررسی کن» — نسخه‌ی پیشرفته برای مسائل خلاقانه.
  • «مسئله را به ۵ زیرسؤال کوچک‌تر تبدیل کن، هر کدام را جداگانه پاسخ بده» — مناسب برای پروژه‌های بزرگ.

کاربردهای واقعی CoT در ایران

CoT فقط برای مسائل ریاضی مدرسه نیست. در کسب‌وکار واقعی این کاربردها فوق‌العاده مؤثرند:

  1. تحلیل مالی: محاسبه‌ی سود و زیان، مالیات، حقوق کارمندان — جایی که اشتباه یک گام منجر به نتیجه‌ی کاملاً غلط می‌شود.
  2. تصمیم‌سازی استراتژیک: «آیا این محصول را راه‌اندازی کنم یا نه؟» — مدل گام‌به‌گام مزایا، معایب، ریسک‌ها و چشم‌انداز را تحلیل می‌کند.
  3. حقوقی: تفسیر یک قرارداد یا قانون. مدل اول هر بند را جداگانه می‌خواند، بعد ارتباط‌ها را تحلیل می‌کند.
  4. برنامه‌نویسی: دیباگ کد. به‌جای اینکه مستقیم بپرسی «چرا کار نمی‌کند؟»، بپرس «گام‌به‌گام بررسی کن این تابع چه می‌کند، کجا ممکن است خطا بدهد.»
  5. پزشکی (با احتیاط): تشخیص افتراقی. مدل علائم را گام‌به‌گام در برابر بیماری‌های محتمل می‌سنجد. حتماً مشاوره‌ی پزشک واقعی را جایگزین نکن — این فقط ابزار کمکی است.
  6. مارکتینگ: طراحی یک کمپین کامل. مدل اول مخاطب را تحلیل می‌کند، بعد پیام، بعد کانال، بعد بودجه را گام‌به‌گام طراحی می‌کند.

کِی CoT جواب نمی‌دهد؟

CoT یک ابزار قوی است، اما جادو نیست. در این موارد فایده ندارد و حتی ممکن است ضرر داشته باشد:

  • سؤالات بسیار ساده: «پایتخت ایران کجاست؟» — اضافه کردن «گام به گام فکر کن» اینجا فقط خروجی را طولانی می‌کند.
  • کارهای خلاقانه‌ی محض: نوشتن شعر، طراحی برند، ایده‌پردازی هنری. خلاقیت گاهی نیاز به «پرش» دارد، نه استدلال خطی.
  • سؤالاتی که پاسخ از نوع «بله/خیر» دارند: اینجا توضیح اضافه ارزش نمی‌آورد.
  • وقتی سرعت اولویت است: CoT خروجی را طولانی‌تر می‌کند و در نتیجه پاسخ کندتر می‌آید. در چت‌بات‌های فروش زنده گاهی ارزشش را ندارد.
نکته‌ی مهم: در مدل‌های استدلالی امروزی — مثل سری‌های جدید Gemini، ChatGPT و Claude (نسخه‌های ۲۰۲۶) — CoT اغلب به‌صورت داخلی و خودکار اتفاق می‌افتد. حتی بدون اینکه بگویی، مدل ممکن است در پشت‌صحنه گام‌به‌گام فکر کند. تفاوت با مدل‌های قدیمی این است که نتیجه‌ی نهایی را به‌صورت فشرده می‌بینی.

سوالات متداول

Chain of Thought چیست به زبان ساده؟

Chain of Thought یا «تفکر زنجیره‌ای» یعنی به‌جای اینکه از AI انتظار جواب مستقیم داشته باشی، از او بخواهی مرحله‌به‌مرحله توضیح بدهد. این کار دقت پاسخ را در مسائل پیچیده تا چندین برابر افزایش می‌دهد.

CoT چه فرقی با Few-shot Learning دارد؟

CoT و Few-shot دو تکنیک متفاوت اما مکمل‌اند. CoT روی «نحوه‌ی تفکر» تمرکز دارد، Few-shot روی «نمونه‌های آموزشی». ترکیب آن‌ها (Few-shot CoT) قوی‌ترین حالت پرامپت‌نویسی است. جزئیات کامل Few-shot را می‌توانی اینجا بخوانی.

آیا CoT در فارسی هم کار می‌کند؟

بله. مدل‌های امروزی مثل ChatGPT و Claude در فارسی هم CoT را به‌خوبی انجام می‌دهند و عبارت «گام به گام فکر کن» در فارسی هم مؤثر است. فقط توجه داشته باش که فارسی یک زبان کم‌منبع‌تر است و کیفیت استدلال گاهی کمی پایین‌تر از انگلیسی می‌آید. در Gemini نتایج گاهی متغیرتر است.

بهترین عبارت برای فعال‌سازی CoT چیست؟

برای کارهای روزمره، «گام به گام فکر کن» کافی است. برای مسائل پیچیده‌تر، «اول مسئله را تحلیل کن، بعد راه‌حل را بنویس» نتیجه‌ی بهتری می‌دهد. در مسائل تصمیم‌سازی، «۳ فرضیه‌ی متفاوت بساز و هر کدام را بررسی کن» موثرترین است.

CoT برای کارهای خلاقانه هم خوب است؟

نه همیشه. در نوشتن شعر، طراحی برند یا ایده‌پردازی هنری، CoT می‌تواند خلاقیت را محدود کند چون مدل را به استدلال خطی هدایت می‌کند. برای کارهای خلاقانه، روش‌هایی مثل Persona Prompting معمولاً نتیجه‌ی بهتری دارند.

آیا مدل‌های جدید نیاز به CoT دارند؟

مدل‌های استدلالی امروزی — مثل سری‌های جدید Gemini، ChatGPT و Claude (نسخه‌های ۲۰۲۶) — CoT را به‌صورت داخلی و خودکار انجام می‌دهند. اما حتی این مدل‌ها در مسائل خاص از CoT صریح بهره می‌برند، مخصوصاً وقتی می‌خواهی مسیر فکر مدل را ببینی و کنترل کنی.

Self-consistency چیست؟

Self-consistency تکنیکی پیشرفته است که در آن چند بار با CoT از مدل سؤال می‌کنی و سپس بین پاسخ‌ها رای‌گیری می‌کنی. اگر ۸ بار از ۱۰ بار جواب X بود، X به‌احتمال زیاد درست است. این روش برای تصمیم‌های مهم و حساس کاربرد دارد.

می‌خوای از تئوری به مهارت برسی؟

این مقاله یک شروع است. اگر می‌خواهی مهندسی پرامپت را به‌صورت مدون، با پروژه‌ی واقعی و پشتیبانی مستقیم یاد بگیری، دوره‌ی جامع مهندسی پرامپت همان مسیری است که دنبالش هستی — ۱۳ فصل، ۵۸ جلسه، گروه پشتیبانی و ۳ روز ضمانت بازگشت وجه.

شروع دوره
نویسنده: متین لب‌خندق — مهندس هوش مصنوعی با ۱۰ سال برنامه‌نویسی و ۵ سال تمرکز روی مدل‌های زبانی (LLM)؛ سازنده‌ی سیستم‌های واقعیِ production با ChatGPT، Claude و Gemini و بنیان‌گذار آکادمی متین لب‌خندق. مقاله‌ی پایه: راهنمای جامع مهندسی پرامپت.