大型語言模型將開始形成更廣泛的全球化視角,拓展視野並理解文化。在這種文化交流中,有兩個研究領域將發揮關鍵作用:一是基於AI回饋的強化學習(reinforcement learning from AI feedback,RLAIF),即一個模型可以吸收另一個模型的回饋,不同的模型之間能相互影響,並根據這些影響,更新對不同文化概念的理解;二是透過自我辯論,即一個模型的多個執行個體生成回應,之後針對每個回應的有效性及背後的推論展開辯論,最後根據辯論過程得出一致的回應。這兩個研究領域都能降低訓練和微調模型所需的人力成本。大型語言模型在相互學習的過程中,從不同文化的視角獲得對複雜社會的細緻理解,這將確保模型提供更具韌性和準確性的回應。