机器之心报道编辑:赵阳大语言模型的微调一直是说起来容易做起来难的事儿。近日 Hugging Face 技术主管 Philipp Schmid 发表了一篇博客,详细讲解了如何利用 Hugging Fa...
如今,大模型炙手可热,通用人工智能的步伐离我们越来越近,已经成为工作、学习、生活中的新助手,大模型被嵌入到办公软件中,大大提高了效率,这也成了今天(5月6日)进行的《2024民生访谈》的热门话题。在...
图片来源@pixabay“预训练大模型的发展为实现通用人工智能提供了可能。其中算力一定要有比较大的进步,才可能有下一代。但短期内不太可能是GPU架构本身的明显跨越,而是需要千卡、万卡来适应大模型。...
人工智能带来的颠覆性安全挑战正在加快凝聚人们的共识。AI+时代,人工智能与千行百业深度融合,展现出强大的创新潜力和无限的应用前景。因此,我们迫切需要寻找一种全新的应对之策,以AI对AI,以AI管AI...
新智元报道编辑:LRS【新智元导读】Scaling Laws再次失效?微软最新的phi-3-mini模型,只用3.8B模型就击败了一众7B老大哥,用iPhone14每秒可生成12个tokens!过去...
梦晨 发自 凹非寺量子位 | 公众号 QbitAI堂堂开源之王Llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。在32k起步,100k寻常的今天,这是故意要给开源社区...
机器之心报道机器之心编辑部LeCun 一如既往地不看好自回归 LLM。机器如何能像人类和动物一样高效地学习?机器如何学习世界运作方式并获得常识?机器如何学习推理和规划……当一系列问题被提出时,有人回...
作者|黄楠编辑|张子怡随着AI在物理世界的应用日渐广泛,渗透到人们生活中,健康看护服务场景正从医院和服务机构走进家庭环境。以疾病检测为例。传统医疗模式需要人们定期前往医院或体检机构,耗费大量时间,还...
文 | 伯虎财经 铁观音2024年,小米、荣耀、vivo、一加、努比亚等品牌的AI手机新品如雨后春笋般涌现。因此,这一年也被业界广泛视为AI手机的"元年"试想,当你轻触屏幕,你的手机不仅响应你的指令...
(图片来源:钛媒体App编辑拍摄)5月6日消息,钛媒体App独家获悉,估值超200亿的国内 AI 大模型独角兽公司“智谱 AI”正在研发对标OpenAI Sora的高质量文生视频模型,预计最快年内发...
作者 | 范昕茹 编辑 | 周智宇苹果发布端侧大模型OpenELM。端侧模型成了科技巨头的兵家必争之地,继在谷歌、三星和微软后,苹果也加入了战局。4月25日凌晨,苹果发布了OpenELM。这是一个...
在深度学习的框架之下,各种数据增强方法由于其缓解过拟合的特性,而被广泛使用在模型训练过程中,例如图像的旋转、缩放、颜色的改变等等。然而,美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个...
编辑部 整理自 AIGC峰会量子位 | 公众号 QbitAI“中国有世界上最好最优秀的B端和C端市场,把做AI应用的门槛和成本降下来,就会激发出更大的产业应用空间。”这是面对AIGC产业应用现状,商...
新智元报道编辑:alan【新智元导读】为了搞钱,微软、OpenAI 、谷歌和Meta纷纷瞄准Agent这片蓝海,各顶尖高校也紧随其后。Agent才是商业学术两开花的未来!大模型发展至今早已火成了一个...
被誉为“AI 教母”的李飞飞,正在组建一家与“空间智能”有关的初创公司,它将利用类人视觉数据处理技术,让 AI 可以实现高级推理。图丨李飞飞(来源:资料图)据了解,目前李飞飞已经为该公司筹集了一轮种...
众所周知,目前的大模型大多基于 Transformer 架构。Transformer 的核心结构是多头自注意力模型(multi-head self-attention model)。大模型的一个重要...
智东西编译 ZeR0编辑 漠影智东西5月4日消息,据路透社援引知情人士的消息,著名华裔计算机科学家李飞飞正创办一家AI创企Spatial Intelligence,利用类似人类的视觉数据处理技术,使...
端侧模型成了科技巨头的兵家必争之地,继在谷歌、三星和微软后,苹果也加入了战局。五一假期之前,苹果发布全新开源语言模型(LLM)OpenELM系列,分为指令微调和预训练两种模型,有0.27B、0.45...
Yiyuan 投稿量子位 | 公众号 QbitAI万万没想到,与任务无直接关联的多模态数据也能提升Transformer模型性能。比如训练一个图像分类模型,除了标注好类别的图像数据集,增加视频、音频...
编辑部 整理自 AIGC峰会量子位 | 公众号 QbitAI在过去一年中,通义千问系列模型持续开源。不仅频繁放出多种版本,涉及不同的规模和模态,成绩在大模型竞技场中也名列前茅。比如目前最大的72B模...