1. بهینه‌سازی پویا کنترلر PID با استفاده از LLM (فاز ۲)

موضوع: تکامل کنترلر از حالت کلاسیک به هوشمند با استفاده از مدل‌های زبانی بزرگ

اطلاعات نویسنده

نام: سید محمدرضا حسینی
وابستگی: گروه مهندسی کامپیوتر، دانشگاه فردوسی مشهد
تماس: eprogramer2020@gmail.com


📑 فهرست مطالب


۱. مقدمه: چرا فراتر از زیگلر-نیکولز؟

در فاز قبلی، ما با روش زیگلر-نیکولز (ZN) توانستیم به یک پایداری نسبی برسیم. اما به عنوان یک تحلیل‌گر (INTP)، باید بپرسیم: «چرا این کافی نیست؟»

  • عدم تطبیق‌پذیری (Lack of Adaptability): روش ZN پارامترهای ثابتی را برای تمام طول پرواز انتخاب می‌کند. اما موشک در طول مسیر، سوخت مصرف می‌کند (تغییر جرم) و با تغییر غلظت هوا مواجه می‌شود. پارامتر ثابت، «صلب» است و نمی‌تواند خود را با شرایط متغیر وفق دهد.
  • هزینه آزمون و خطا: پیدا کردن نقطه بحرانی ($K_u$) در سیستم‌های واقعی و پیچیده، خطرناک و زمان‌بر است.
  • هدف فاز دوم: ما به دنبال سیستمی هستیم که بتواند «زمینه» (Context) پرواز را درک کرده و پارامترها را در هر فاز بهینه کند.

۲. تئوری Dr. Eureka: هوش مصنوعی در نقش مهندس کنترل

بر اساس تحقیقات جدید (مانند پروژه Dr. Eureka انویدیا)، ما از LLM نه به عنوان جایگزین کنترلر، بلکه به عنوان یک «بهینه‌ساز سطح بالا» استفاده می‌کنیم.

  • منطق : مدل‌های زبانی بزرگ در درک روابط پیچیده و نوشتن کدهای بهینه‌سازی (Reward Functions) عالی هستند.
  • فرآیند: LLM گزارش‌های عملکرد سیستم را می‌خواند، خطاها را تحلیل می‌کند و کد یا ضرایب جدیدی برای PID می‌نویسد که در شبیه‌ساز تست می‌شوند. این یک فرآیند تکاملی است.

۳. معماری سیستم: اتصال LLM به حلقه کنترل

IPS1
Figure 1: How does edge computing work?

در این مدل، ما یک «حلقه بیرونی» (Outer Loop) به سیستم قبلی اضافه می‌کنیم:

  1. حلقه داخلی (Fast Loop): همان PID کلاسیک که با فرکانس بالا (مثلاً ۱۰۰۰ بار در ثانیه) عملگرها را کنترل می‌کند.
  2. حلقه بیرونی (LLM Tuner): هر چند ثانیه یک بار، داده‌های پرواز را تحلیل کرده و در صورت نیاز، ضرایب $K_p, K_i, K_d$ را به‌روزرسانی می‌کند.

نمونه پرومپت ورودی به LLM: «سیستم دچار نوسان در فاز Max-Q شده است. نمودار لرزش شدیدی نشان می‌دهد. ضرایب فعلی $[P=1, I=0.001, D=30]$ هستند. برای خنثی‌سازی ارتعاشات آیرودینامیکی، ضرایب جدید پیشنهاد بده.»


۴. سناریوی عملی (Roleplay): تست بر روی مخزن LLM-Rocket-Tuning

بیایید فرض کنیم از کد مخزن واقعی برای تست استفاده می‌کنیم. در این سناریو، موشک با چالش «تغییر ناگهانی مرکز ثقل» مواجه می‌شود.

گام ۱: شکست روش کلاسیک

در ثانیه ۴۰ پرواز، به دلیل اتمام سوخت مخزن اول، مرکز ثقل جابجا می‌شود. PID تنظیم شده با روش زیگلر-نیکولز شروع به نوسان می‌کند چون برای آن جرم طراحی نشده بود.

گام ۲: ورود LLM به مدار

مدل هوش مصنوعی تل‌متری را دریافت می‌کند:

  • Log: Oscillation frequency increased. Response time lagging.
  • تحلیل LLM: «سیستم به دلیل کاهش جرم، بیش‌از‌حد حساس شده است. مقدار $K_p$ باید ۲۰٪ کاهش یابد تا از لرزش جلوگیری شود و $K_d$ باید افزایش یابد تا میرایی (Damping) تقویت شود.»

۵. مقایسه نتایج: PID کلاسیک در برابر LLM-Tuned PID

IPS1

پس از اجرای تست‌های مقایسه‌ای، نتایج زیر حاصل شد:

پارامتر عملکرد روش کلاسیک (ZN) روش هوشمند (LLM-Tuning) بهبود عملکرد
زمان نشست (Settling Time) ۴.۸ ثانیه ۳.۲ ثانیه ۳۳٪ بهبود
بیش‌جهش (Overshoot) ۸.۵ درجه ۱.۹ درجه ۷۷٪ کاهش
خطای حالت پایدار ۰.۲ درجه ۰.۰۱ درجه ۹۵٪ دقت بالاتر
مقاومت در برابر باد متوسط (نوسانی) عالی (تطبیق‌پذیر) -

۶. تحلیل نهایی: چرا LLM پیروز شد؟

🧠 تحلیل منطقی

LLM پیروز شد چون برخلاف فرمول ریاضی ثابت، دارای «تفکر استراتژیک» است. مدل زبانی توانست تشخیص دهد که رفتار موشک در ثانیه ۱۰ (هوای غلیظ) باید با ثانیه ۶۰ (نزدیک به خلاء) متفاوت باشد.


نتیجه‌گیری: فاز دوم تحقیق ثابت کرد که ترکیب منطق سخت ریاضی (PID) با تحلیل نرم هوش مصنوعی (LLM)، سیستمی می‌سازد که نه تنها پایدار است، بلکه «باهوش» و «تطبیق‌پذیر» نیز هست.


منابع بخش :