深度学习自然语言处理

文章：837

阅读数：2080066

41人已关注

+关注

高效大模型的推理综述

高效大模型的推理综述

356次阅读 2024-11-15

什么是RAG，RAG学习和实践经验

什么是RAG，RAG学习和实践经验

885次阅读 2024-04-24

MOE与MOT：提升LLM效能的关键策略比较

MOE与MOT：提升LLM效能的关键策略比较

872次阅读 2024-04-15

基于双级优化（BLO）的消除过拟合的微调方法

基于双级优化（BLO）的消除过拟合的微调方法

690次阅读 2024-04-02

自然语言常用的自回归解码方法

自然语言常用的自回归解码方法

760次阅读 2024-03-28

斯坦福继Flash Attention V1和V2又推出Flash Decoding

762次阅读 2024-03-13

大模型微调开源项目全流程

大模型微调开源项目全流程

879次阅读 2024-03-13

聊一聊Transformer中的FFN

聊一聊Transformer中的FFN

1150次阅读 2024-03-13

LLM中的大规模激活

LLM中的大规模激活

569次阅读 2024-03-01

利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统（下）

利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统（下）

1208次阅读 2024-02-22

利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统（上）

利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统（上）

1103次阅读 2024-02-22

LLaMA 2是什么？LLaMA 2背后的研究工作

1119次阅读 2024-02-21

大模型系列：Flash Attention V2整体运作流程

大模型系列：Flash Attention V2整体运作流程

1976次阅读 2024-02-21

开发RAG管道过程中的12个痛点

开发RAG管道过程中的12个痛点

674次阅读 2024-02-21

聊聊小公司如何做大模型

652次阅读 2024-02-21

小红书搜索团队研究新框架：负样本在大模型蒸馏中的重要性

小红书搜索团队研究新框架：负样本在大模型蒸馏中的重要性

1061次阅读 2024-01-30

LLM推理加速新范式！推测解码（Speculative Decoding）最新综述

LLM推理加速新范式！推测解码（Speculative Decoding）最新综述

2833次阅读 2024-01-29

大模型微调实践心得与认知深化

1355次阅读 2024-01-24

大语言模型事实性幻象的实验性分析

大语言模型事实性幻象的实验性分析

477次阅读 2024-01-19

深入了解RAG技术

深入了解RAG技术

3211次阅读 2024-01-17