رفتن به محتوای اصلی
x

تاریخچه‌ی پردازش زبان طبیعی

دهه ۱۹۵۰۱۹۶۰: دوران نمادگرایی (Symbolic NLP)

  • اولین تلاش‌ها با هدف ترجمه ماشینی (Machine Translation) آغاز شد.
  • استفاده از قواعد دست‌نویس (Rule-based systems) مانند قواعد صرف و نحو.
  • محدودیت: ناتوانی در پوشش پیچیدگی‌های زبان طبیعی.

دهه ۱۹۸۰۱۹۹۰: رویکردهای آماری (Statistical NLP)

  • انقلاب در استفاده از داده و آمار؛ معرفی مدل‌های n-gram.
  • مدل‌های مبتنی بر احتمال برای پیش‌بینی توالی واژگان.
  • الگوریتم‌های HMM برای برچسب‌گذاری نحوی (POS tagging).

دهه ۲۰۱۰ تا امروز: یادگیری عمیق و مدل‌های زبانی بزرگ

  • ظهور شبکه‌های عصبی بازگشتی (RNN, LSTM) و سپس ترنسفورمرها (Transformer).
  • معرفی مدل‌هایی چون BERT، GPT، T5.
  • NLP از وظیفه‌محور به سمت مدل‌محور تغییر جهت داده است:
    اکنون مدل‌های زبانی بزرگ (LLMs) توانایی انجام چندین وظیفه را دارند بدون نیاز به آموزش مجدد کامل.