دهه ۱۹۵۰–۱۹۶۰: دوران نمادگرایی (Symbolic NLP)
- اولین تلاشها با هدف ترجمه ماشینی (Machine Translation) آغاز شد.
- استفاده از قواعد دستنویس (Rule-based systems) مانند قواعد صرف و نحو.
- محدودیت: ناتوانی در پوشش پیچیدگیهای زبان طبیعی.
دهه ۱۹۸۰–۱۹۹۰: رویکردهای آماری (Statistical NLP)
- انقلاب در استفاده از داده و آمار؛ معرفی مدلهای n-gram.
- مدلهای مبتنی بر احتمال برای پیشبینی توالی واژگان.
- الگوریتمهای HMM برای برچسبگذاری نحوی (POS tagging).
دهه ۲۰۱۰ تا امروز: یادگیری عمیق و مدلهای زبانی بزرگ
- ظهور شبکههای عصبی بازگشتی (RNN, LSTM) و سپس ترنسفورمرها (Transformer).
- معرفی مدلهایی چون BERT، GPT، T5.
- NLP از وظیفهمحور به سمت مدلمحور تغییر جهت داده است:
اکنون مدلهای زبانی بزرگ (LLMs) توانایی انجام چندین وظیفه را دارند بدون نیاز به آموزش مجدد کامل.