AI日报:商汤科技发布“日日新5.0”大模型,微软发布小语言模型 Phi-3 系列

乌鸦智能说
关注

今日,商汤科技(SenseTime)正式推出了其人工智能大模型“日日新5.0”,该模型具备高达200K的推理上下文窗口,旨在全面对标OpenAI的GPT-4 Turbo。

在国外,微软发布小语言模型 Phi-3 系列,这些模型在保持较小的参数规模的同时,通过精心设计的训练数据集和优化的算法,实现了与大型模型相美的语言理解和推理能力。

过去一天,国内AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。

/ 01 / 国内要闻

1)商汤科技发布“日日新5.0”大模型,对标GPT-4 Turbo

商汤科技(SenseTime)正式推出了其人工智能大模型“日日新5.0”,该模型具备高达200K的推理上下文窗口,旨在全面对标OpenAI的GPT-4 Turbo。这一升级版的大模型采用了混合专家架构(MoE),基于超过10TB的tokens进行训练,并覆盖了大量合成数据。

“日日新5.0”在多项能力上进行了增强,包括知识、数学、推理和代码能力,尤其在文科和理科能力方面均有显著提升。在文科能力方面,模型的创意写作、推理和总结能力得到了增强,能够为教育和内容产业等垂直应用场景提供辅助。理科能力方面,模型在数理、代码和推理能力上达到了业内领先水平,为金融和数据分析等场景提供了坚实的基础。

此外,“日日新5.0”在多模态能力上也取得了突破,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,并在多个知名多模态榜单中取得领先成绩。该模型支持高清长图的解析和理解、文生图交互式生成,并能实现复杂的跨文档知识抽取及总结问答展示,具备丰富的多模态交互能力。

2)AIGC第一股出门问问今日上市,市值达54.89亿港元

被誉为“AIGC第一股”的出门问问于今日在香港交易所正式挂牌上市。截至收盘,出门问问收报3.68港元,跌幅3.16%,港股市值54.89亿港元。

据配发结果公告显示,此次出门问问全球发售8456.8万股股份,国际发售4228.4万股股份,公开发售4228.4万股股份,其中,公开发售获117.39 倍认购。最终发售价每股3.8港元,全球发售净筹约2.67亿港元。

3)腾讯协作SaaS产品全面接入腾讯混元大模型

近日,腾讯宣布旗下协作SaaS产品全面接入腾讯混元大模型,除企业微信、腾讯会议、腾讯文档等“一门三杰”产品,腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品也都已实现智能化升级。

/ 02 / 海外动态

1)苹果悄然收购Datakalab,增强设备端AI能力

苹果公司刚刚完成了对Datakalab的收购,这是一家总部位于巴黎的AI初创公司,专注于数据压缩和图像分析,此举将增强苹果在设备端AI领域的能力。

2)微软发布小语言模型 Phi-3 系列

Phi-3 是微软研究院推出的一系列先进的小型语言模型,旨在保持较小的参数规模的同时,实现与大型模型相媲美的语言理解和推理能力。这个系列包括三个不同规模的版本 —— phi-3-mini、phi-3-small 和 phi-3-medium。

尽管 Phi-3 Mini 的体积很小,但它在某些基准测试中的表现已经与 Llama 2 相当,微软表示它的响应速度可以与比它大 10 倍的模型相媲美。目前尚不清楚这是否会成为未来 Copilot 更新的一部分,因为微软正寻求将更多功能集成到设备上,或者这将保持作为一个独立的项目。

3)Blockade Labs发布全新模型Model3

生成式AI平台Blockade Labs发布的全新模型Model3,该模型支持超高清8192x4096分辨率,提升了文本提示器描述生成世界的能力,减少了生成世界的灰度值,使内容更加高清、细腻。

       原文标题 : 乌鸦AI日报:商汤科技发布“日日新5.0”大模型,微软发布小语言模型 Phi-3 系列

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存