2024-12-21发表2024-12-21更新AI / AI消息14 分钟读完 (大约2082个字)0次访问

自己电脑搭建AI大模型详细教程，支持通义千问、Llama3、接口调用等

你好，我是郭震

今天教程关于在自己电脑搭建大模型，支持开源的大模型，像主流的通义千问2.5，Llama3，教程还包括如何使用这些大模型做接口调用，实现自动化输出。

如下图所示，这是我自己的电脑安装的两个AI大模型，一个是qwen 7b尺寸，另一个是llama3 8b尺寸：

ollama安装的两个开源AI大模型

本地部署大模型有哪些好处呢？

首先，因为这些大模型都是开源的，安装在自己的电脑上也是免费使用的，如下图所示启动qwen7b后，我可以直接在命令窗口提问它，全球各地有记载的历史最低温度是多少？，后面是qwen的回复：

通义千问本地回复

其次，安装大模型在自己电脑除了我们可以直接免费使用它外，还有一个很大的好处，就是我们可以结合自己的私有文件系统，打造一个大模型+个人知识库的AI系统，既保护了个人数据隐私，也让AI「更懂你」。

大模型的一些基本知识科普

可能点进来看我这篇文章的朋友，有不同行业、不同专业的，可能对一些大模型的基本概念不太了解，下面就先做一个基本梳理。

其中比较重要的比如qwen7b, llama8b，这里的7b、8b代表什么？

b是英文的billion，意思是十亿，7b就是70亿，8b就是80亿，70亿、80亿是指大模型的神经元参数（权重参数 weight+bias）的总量。目前大模型都是基于Transformer架构，并且是很多层的Transformer结构，最后还有全连接层等，所有参数加起来70亿，80亿，还有的上千亿。

大模型和我们自己基于某个特定数据集（如 ImageNet、20NewsGroup）训练的模型在本质上存在一些重要区别。主要区别之一在于，大模型通常更加通用，这是因为它们基于大量多样化的数据集进行训练，涵盖了不同领域和任务的数据。这种广泛的学习使得大模型具备了较强的知识迁移能力和多任务处理能力，从而展现出“无所不知、无所不晓”的特性。

相比之下，我们基于单一数据集训练的模型通常具有较强的针对性，但其知识范围仅限于该数据集的领域或问题。因此，这类模型的应用范围较为局限，通常只能解决特定领域或单一任务的问题。

Scaling Laws这个词大家可能在很多场合都见到过。它是一个什么法则呢？

大模型之所以能基于大量多样化的数据集进行训练，并最终“学得好”，核心原因之一是Scaling Laws（扩展规律）的指导和模型自身架构的优势。Scaling Laws指出参数越多，模型学习能力越强；训练数据规模越大、越多元化，模型最后就会越通用；即使包括噪声数据，模型仍能通过扩展规律提取出通用的知识。而Transformer这种架构正好完美做到了Scaling Laws，Transformer就是自然语言处理领域实现扩展规律的最好的网络结构。

知道这些基本知识后，我们回到安装大模型到本地步骤上。一共只需要三步就能做到和大模型在本地会话。

第一步，我使用的是ollama管理各种不同大模型，当然还有其他工具，不过ollama是比较直接、比较干净的，如下所示，一键下载后安装就行了，安装过程基本都是下一步：

安装ollama