LLM背景知识
NLP & Big Model Basics(GPU server,Linux,Bash,Conda,…)
什么是自然语言处理
NLP是让计算机能够理解人类语言的技术,或者说是手段。语...
什么是自然语言处理
NLP是让计算机能够理解人类语言的技术,或者说是手段。语...
在引人入胜的大型语言模型(LLM)世界中,模型架构、数据处理和优化备受关注。然而,在文本生成中发挥关键作用的解码策略,如beam search,却常被忽视。在本文中,我们将通过深入研究greedy search 、 beam search, 和 sampling techniques with top-k and nucleus sampling,探索 LLM 如何生成文本。
...参考资料:
(1)[Transformers (how LLMs work) explained visually | DL5](https://www.youtube.com/watch?v=wjZofJX0v4M) |