ash

帅气的我简直无法用语言描述!

比标准Attention提速5-9倍,大模型都在用的FlashAttention v2来了

比标准Attention提速5-9倍,大模型都在用的FlashAttention v2来了
2年前
1,776

大模型与知识图谱融合?爱数推出基于大模型的领域认知智能产品与方案

大模型与知识图谱融合?爱数推出基于大模型的领域认知智能产品与方案
2年前
1,774

Transformer取代者登场!微软、清华刚推出RetNet:成本低、速度快、性能强

Transformer取代者登场!微软、清华刚推出RetNet:成本低、速度快、性能强
2年前
1,594

一个开源方案,极速预训练650亿参数LLaMA

一个开源方案,极速预训练650亿参数LLaMA
2年前
1,548

专访AMD芯片架构师Sam Naffziger:Chiplet将如何影响芯片制造

专访AMD芯片架构师Sam Naffziger:Chiplet将如何影响芯片制造
2年前
1,910

所见,所问,所答:上海交大&上海AI Lab发布最新医疗多模态问答框架PMC-VQA

所见,所问,所答:上海交大&上海AI Lab发布最新医疗多模态问答框架PMC-VQA
2年前
1,812

当前的人工智能比二年级学生聪明吗?SMART-101挑战赛现在开始了! VLAR@ICCV 2023

当前的人工智能比二年级学生聪明吗?SMART-101挑战赛现在开始了! VLAR@ICCV 2023
2年前
1,632

蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象!

蛋白质侧链预测新方法DiffPack:扩散模型也能精准预测侧链构象!
2年前
1,506

获星1.9k,LLM微调神器Lamini上演速度与激情,免费可用

获星1.9k,LLM微调神器Lamini上演速度与激情,免费可用
2年前
1,552

字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA

字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA
2年前
1,774