第一階段
(20世紀60至80年代):詞典+規則時期
自然語言處理範式:「詞典+規則」,通過預設關鍵詞和規則回應人類提問
局限:機械化、程式化特徵明顯,人機交流效果受限
典型代表:伊麗莎(ELIZA)、帕里(PARRY)
第二階段(20世紀90年代至21世紀初):統計模型時期
自然語言處理範式:「統計模型」,大量匹配輸入/輸出模式,提升對話功能
局限:無法與人維持長時間對話,未能完全通過圖靈測試
典型代表:阿爾伯特一號(Albert One)
第三階段(21世紀初至20年代):深度學習模型時期
自然語言處理範式:「深度學習模型」,語音識別+信息檢索,為用戶提供個性化服務
局限:與真實人類對話交流存在較大差距
典型代表:蘋果Siri、微軟Cortana
第四階段(21世紀20年代至今):預訓練+微調時期
自然語言處理範式:「預訓練+微調」,模型包含超千億模型參數,超強大算力運行效能,人類反饋強化學習技術
特點:能在不同情境下正確理解語義,實現高質量文本生成,實現與用戶持續穩定對話
典型代表:ChatGPT