大语言模型

前言 #

LLM,也就是 Large Language Model,中文名大语言模型。

常见产品如 ChatGPT、Claude、Mistral、LLaMA

原理 #

模型是怎么推理的 #

生成多层神经网络,用户的输入会经过神经网络逐层推理,给出一个结果。

https://aws.amazon.com/cn/what-is/large-language-model/

LLM 的结构 #

如何训练一个 LLM #

如何在基座模型的基础上微调 #

利用 LLM 的工程实践 #

Prompt Engine #

  • 一些已有的 Prompt 实战例子

https://github.com/f/awesome-chatgpt-prompts

RAG #

> RAG is an AI framework for retrieving facts from an external knowledge base to ground large language models (LLMs) on the most accurate, up-to-date information and to give users insight into LLMs’ generative process.

由于 LLM 模型天生的缺陷,无法保证其对事实和最新的信息的结果,也就是所谓的大语言模型的“幻觉”。人们想到一种方法是给模型外挂一个知识库,向模型提问时,先从这个足够可靠的知识库中获取符合条件的知识,再将其跟用户的问题一起交给模型进行处理。

function calling #

函数调用。让模型生成特定格式的字符串,让工具读取并识别这些字符串中的参数并执行。这就拓展了 AI 模型的能力,使其能够做更多的事情。

Multiple Agent #

多专家模型结合多种模型、多种不同的数据源参与结果推理过程。

AI 会取代程序员吗? #