ChatGPT超细粒度情感分析 分析情感的粒度和强度常见的维度是123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687 消极 恐惧 焦虑 悲伤 失望 2023-08-25
deepspeed-ninja报错解决 deepspeed训练模型时ninja报错解决1、报错如下:12345678910111213141516171819202122232425[1/3] /usr/bin/nvcc -DTORCH_EXTENSION_NAME=fused_adam -DTORCH_API_INCLUDE_EXTENSION_H -DPYBIND11_COMPILER_TYPE=\"_gcc\" 2023-08-23
weaviate连接缓慢原因分析 weaviate-client连接本地服务器缓慢原因分析我们使用python的weaviate-client客户端连接本地的weaviate时,经常会很慢,具体的代码如下,使用下面方法,可以使你的weaviate连接时提速99%。 1234import weaviateclient = weaviate.Client( url = "http://127.0.0.0:8080&qu 2023-08-18
transformers的llama2模型的一个bug transformers的4.31.0版本的关于llama2模型的一个bug在使用llama2模型进行lora微调的时候,会报一个类似RuntimeError: expected scalar type Float but found Half这样的错误。本文是针对这个错误的解决。 模型加载加载lora模型的代码,注意我们使用了量化qlora的方式,nf4格式,量化到了4bit 123456789 2023-08-15
提示工程 对检索到的答案进行提示工程设计 需要考虑检索到正确的参考的情况。 需要考虑检索为空的情况。 需要考虑检索为错误参考的情况。 需要考虑返回的格式问题。 商品推荐问题示例简版1:用户问题+检索结果(商品名称,官宣,功效,顾客体验),检索准确。 Prompt: 持久不脱妆并且能眼部提亮的商品有哪些?从商品库中搜索到的已知信息是,根据搜索到的信息进行推荐:商品名称是:雅诗兰黛舒缓眼膜。官方宣传信息是:· 2023-07-19
使用LLM进行领域问答的第4种思路Gorilla 专业领域问答的几种思路专业领域问答是让LLM回答专业的知识,这些知识一般企业私有的知识。现提供如下思路,总体方案就是:方案1就是让LLM学会这些知识,方案2就是LLM根据用户提供的参考知识回答。 1.训练领域内大语言模型这个需要自己准备通用数据,领域内数据,指令数据,自己先预训练大语言模型或者直接根据领域内指令数据微调。 优点是:利用LLM学到的知识回答,回答更流畅,方案简洁。 缺点:自己准备好领 2023-07-05
世界模型 世界模型和I-JEPA什么是世界模型 Meta AI的首席人工智能科学家Yann LeCun,图灵奖获得者,提出的一种模型结构。 世界模型是自主智能架构,能够模拟世界运作方式的人工智能,人类和动物能够通过观察互动,以无监督的方式学习关于世界如何运作的大量背景知识,使机器能够以自监督的方式学习世界模型。 世界模型的结构由六个独立的模块组成。每个模块都是可微分的,它可以很容易地计算出一些目标函数相对 2023-07-04
LangChain解决复杂问题测评 专业领域复杂问题方案测试本文选取了3种业界主流方案,对LangChain执行复杂问题进行了深度的分析。 方案1:LangChain + ChatGPT + 工具使用LangChain作为链条,ChatGPT作为大语言模型,连接人类问题和大语言模型,指导大语言模型使用工具对专业领域知识查询后回答。 方案2:LangChain + ChatGPT + 检索相比于方案1,不使用工具,直接根据问题进行 2023-06-30
langchain计划和执行复杂任务思考 关于LangChain中计划者和执行者的流程思考1.计划者和执行者LangChain官方目前代码版本是v0.0.201, 测试的是0.0.200版本, Agent的角色类型分为2种,1种是计划者,对任务进行分成多个step,计划者这里是用的LLM,另一个是执行者,负责按step逐步执行。下面用官方示例代码进行讲解: 2.参考官方示例代码:123456789101112131415161718192 2023-06-20
langchain问答和路由测试 基于APIChain和RouterChain打造的问答 首先准备好APIChain所需的api调用,我们构造2个Datatouch的api接口,使用GET的请求方式,每个接口支持多个参数。 制定好回答某类问题的标准流程SOP。 解答思路, 用户提问–RouterChain–APIChain或DefaultChain–答案LLM 代码功能实现核心代码:路由Chain的实现 1234567891 2023-06-15