什么是RLHF基于人类反馈的强化学习?知识
什么是RLHF基于人类反馈的强化学习?知识
三维ImageNet开源!港中深韩晓光团队助力计算机视觉进入三维大数据时代
三维ImageNet开源!港中深韩晓光团队助力计算机视觉进入三维大数据时代
哥伦比亚大学计算机系副教授俞舟老师招聘博士后
哥伦比亚大学计算机系副教授俞舟老师招聘博士后
了解「目标错误泛化」
了解「目标错误泛化」
了解「AI 对齐失败数据库」
了解「AI 对齐失败数据库」
了解「规范博弈」
了解「规范博弈」
吴恩达联手OpenAI上线免费课程:一个半小时学会ChatGPT Prompt工程
吴恩达联手OpenAI上线免费课程:一个半小时学会ChatGPT Prompt工程
想把半本《红楼梦》搬进ChatGPT输入框?先把这个问题解决掉
想把半本《红楼梦》搬进ChatGPT输入框?先把这个问题解决掉
谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图
谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图
160亿参数,新增多项能力,复旦MOSS开源了
160亿参数,新增多项能力,复旦MOSS开源了