标签 人工智能 下的文章

DevOps

以目标导向作为输入信息,这与大模型根据用户的PRD(Product Requirement Document)
1、平台:dify、cozen
2、项目:OpenClaw项目及衍生产品,如QClaw、WorkBuddy。

Skills

多模态大模型本质上集成了许多内部工具对不同的输入信息进行解析,最后转换成token进行计算。

MCP(Model Context Protocol)

大模型调用工具的过程包括工具定义,然后将工具处理结果交给模型,这一点与模型与用户之间输入、输出的token计算方式是一样的。为了满足不同工具跟模型的适配性,MCP类比主机与外设之间常见的USB接口协议。

Elements

工具名称、描述、参数,这是MCP中模型对工具调用的重要提示词信息

python
{
 "name": "real_file",
 "description": "从代码中读取内容",
 "parameters": {
      "filename": "文件名称",
      "filepath": "文件路径"
       }
}

路线

1、Transformer架构,分为bert(embedding)、gpt(LLM)两种核心
2、LLM,开发平台有Huggingface、魔搭社区
3、私有化部署,开发平台有Ollama
4、预训练(pre-training)与指令微调<SFT(Surpervised Fine-Tuning)、Prompt Tuning、Lora>
5、量化、蒸馏、剪枝

智能助手——本地知识库查询、检索

1、代码开发,Llamaindex、LangChain
2、图形工具,AnythingLLM、MaxKB.

补充

1、对话/指令微调又叫post-training,对话本质上也属于Prompt Tuning
2、开源框架是从宏观层面对向量数据库构建和索引、大模型API接口、指令微调(prompt-enginerring、temperature、top_k等超参数)进行整合,用于对垂类大模型快速部署
3、幻觉解决方式,自我对话(推理)、上下文对话窗口、网络搜索

要成为大模型算法工程师,至少应该掌握哪些内容?来自一线算法工程师的建议