رفتن به محتوای اصلی
x

مراحل آموزش مدل های زبانی بزرگ

  1.  جمع آوری داده‌های آموزشی عظیم: میلیاردها جمله از وب، کتاب‌ها، و مقالات علمی.

  2.  پیش‌پردازش داده ها : پاک‌سازی داده، توکنیزه‌کردن (Tokenization  ) و فشرده‌سازی

  3. پیش‌آموزش (Pre-training  ) مدل با میلیاردها جمله آموزش می‌بیند تا پیش‌بینی کند واژه‌ی بعدی در جمله چیست. این مرحله یادگیری نمایش معنایی (Semantic Representation  ) از زبان است.

  4. تنظیم دقیق (Fine-tuning  ) : در این مرحله، مدل برای کاربردهای خاص مانند ترجمه، خلاصه‌سازی یا چت تنظیم می‌شود. در مدل‌های امروزی مثل GPT-4 یا Gemini از RLHF استفاده می‌شود تا خروجی مدل طبیعی‌تر و منطبق‌تر با ارزش‌های انسانی باشد.