OpenAI竞争对手Anthropic宣布
据外媒《华尔街日报》消息,苹果公司寻求与中国本土企业,包括百度、阿里巴巴集团、百川智能等合作,旨在中国市场提供其“苹果智能”服务,上述公司尚未作出公开回应。
过去一天,国内外AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。
/ 01 / 大模型
1)OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5
OpenAI竞争对手Anthropic发布了AI模型Claude 3.5 Sonnet,这是Claude 3.5系列中的首款产品。该模型在多项评估中均优于竞争对手及其前身Claude 3 Opus,同时保持了与中端型号相当的速度和成本。Claude 3.5 Sonnet在研究生水平推理、本科生水平知识和编码能力等方面创下新的行业基准,性能大幅提升。
2)苹果AI正寻求与中国本土企业合作,已与百度、阿里、百川等接触
据外媒《华尔街日报》消息,苹果公司寻求与中国本土企业,包括百度、阿里巴巴集团、百川智能等合作,旨在中国市场提供其“苹果智能”服务。这一举措可能是为了应对在中国市场的竞争压力。据Counterpoint Research,iPhone在中国市场份额降至第三。上述公司尚未作出公开回应。
3)大模型价格战调查:有客户调用量增5000倍,大模型落地的逻辑变了
5月中旬,超15家知名大模型厂商降价、免费,触发了大模型产业的价格战。市场反馈显示,用户新增数量大增,原有用户业务量放量,无论是互联网领域还是智能终端行业,大模型调用量大增。但降价同时也使部分厂商改变了原有的自研路线,转而更聚焦于AI应用。
4)Groq上线whisper-large-v3模型,支持语音转录和翻译、免费开放
Groq最新推出的Whisper Large-V3模型为用户提供语音转录和翻译功能,可在Playground或本地项目中使用API。用户体验高速转录,支持多种语言翻译成英文。Whisper API兼容OpenAI标准,提供语音转文本和翻译功能,便于集成到应用程序中。性能优越,采用先进的"whisper-large-v3"模型。
/ 02/ AI应用
1)快手可灵图生视频和视频续写新功能上线
据知情人士透露,快手可灵视频大模型上线“图生视频”和“视频续写”新功能。图生视频可以根据图片生成5秒视频,支持添加提示词控制图像运动。视频续写功能可对生成视频一键续写4~5秒,支持多次续写,最长3分钟,还可以通过微调提示词进行续写视频创作。另外,文生视频新增9:16和1:1视频尺寸选择。
2)Apple Intelligence 机型限制太多?苹果高管回应
Apple智能被限制在iPhone 15 Pro/Pro Max以及搭载M1或后续芯片的iPad和Mac设备上。苹果解释,这是因为大型语言模型的推理计算需求极高。分析师郭明錤认为,Apple智能是否兼容取决于设备的DRAM大小,而非AI算力。
3)腾讯元宝发布全新版本,接入微信搜索
腾讯元宝近期发布了全新版本,主要提升了对超长文本的处理能力及AI搜索和解析功能,增加了微信搜索接入。此次更新提升了处理超长文档效率,还丰富了文件格式支持、图表生成和图片解析功能。新版本增强了搜索功能,接入微信搜索等搜索引擎。
4)知网宣布推出CNKI AI学术研究助手4.0
中国知网最近推出了AI学术研究助手4.0版本,结合AI大模型技术和高质量数据,提升文献检索、研读和学术创作效率。新增功能包括可控生成、文献扩展、学者检索、全文翻译和学术拓展服务。突出升级是问答式增强检索和学者检索服务。
5)微信输入法上线“问AI”功能,答案由微信读书AI问书提供
微信输入法带来了全新的AI问答功能,AI问答答案由微信读书AI问书提供,点击链接将跳转微信读书中该文本引用的页面,让用户通过上下文更好地理解问题。目前,微信输入法暂未在iOS、Android版本上线AI问答功能。
6)复旦开源项目Hallo已适配ComfyUI插件
Hallo项目是一个根据音频和图片生成说话视频的开源项目,安装门槛高,为转绘和其他流程提供了更多可能性和乐趣。它采用端到端的扩散范式,引入分层的音频驱动视觉合成模块,实现音频输入与视觉输出的对齐精度,生成自然的说话视频。
7)环球音乐联手AI音乐公司SoundLabs 为歌手定制语音克隆模型
环球音乐集团与AI音乐技术公司SoundLabs合作推出MicDrop功能,让艺术家定制个性化语音模型,拥有完全控制权,突破语言障碍,保护艺术家权利。这一革命性技术将音乐创作带入全新的创意空间,推动AI在音乐领域的应用和发展。
/ 03 / 投融资情报
1)前Twitter工程师开发的一款AI新闻阅读器,获1090万美元融资
Particle获得Lightspeed Venture Partners领投的1090万美元A轮融资,本轮融资的投资方还包括全球媒体公司Axel Springer。Particle是由前Twitter工程师Sara Beykpour和Marcel Molina创立的初创公司,他们利用人工智能技术打造个性化新闻平台。
2)AI视频初创公司HeyGen融资6000万美元,估值超5亿美元
HeyGen在A轮融资中成功筹集6000万美元,公司估值超过5亿美元。其盈利能力强劲,年收入从100万美元增长至超过3500万美元,客户群体覆盖小型企业到财富500强公司。HeyGen计划扩大产品供应并投资于企业安全、AI伦理、信任和安全方面。
3)前GitHub CTO创业融资4亿美金做AI程序员,估值20亿美金
总部位于巴黎的生成式人工智能公司Poolside.ai,正在筹集4亿美元资金,估值为20亿美元。贝恩资本风投和DST正在就目前的轮次进行谈判。公司创始人&CEO Jason Warner曾是GitHub CTO,并领导过Heroku和Canonical的工程部门。
4)揭秘Ilya新公司:背靠5吨GPU,做核能级安全
Ilya与他人创立新公司SSI的新闻备受业界关注,Ilya表示专注于做核能级安全。据了解,他们在2023年斥资1亿美元,建立了名为Andromeda的AI算力集群,并用这些算力来换AI初创公司的股权。这一集群拥有包括近3000块英伟达H100 GPU在内的大量算力基础设施,光是GPU就重达近5吨。
5)软银准备全力押注AI?孙正义誓言不成功便成仁 透露“新投资方向”
软银掌门孙正义准备将新的科技投资瞄准AI。孙正义表示,即便是失败,也别无选择,需要尝试。软银未透露投资具体细节,但将主要在美国扩大其发电业务,为人工智能项目供电;同时也在寻求高达1000亿美元的资金来投资一家芯片企业。目前,孙正义旗下的软银积累了6.2万亿日元的现金储备。
/ 04 / AI基础设施
1)Meta发布最新RAG评价基准,公认最强的GPT-4仅得40分
Meta发布RAG评价基准,GPT-4配合RAG仅获得40分(百分制)显示技术仍有提升空间;RAG技术通过增强LLM与外部知识的结合,试图解决LLM生成答案时的“幻觉”问题;CRAG评测基准设计包括多种任务和评估方法,旨在全面测试RAG系统在多样化和动态问答场景中的性能。
2)GaussianCube:高质量3D生成建模,性能飞跃74%!
三维生成建模领域迎来了突破性进展,GaussianCube技术超越了传统NeRF,革新了3D建模。该技术采用密度约束高斯拟合算法,简化了建模过程,实现了高精度拟合。实验结果显示高达74%的性能提升,证明了其巨大潜力。
3)最火AI角色扮演流量已达谷歌搜索20%,每秒处理2万推理请求
由Transformer作者Noam Shazeer创办独角兽Character.ai,每秒处理20000个AI推理请求,达到2024年谷歌搜索流量的1/5。创始人公布了推理优化独门秘诀,迅速引起业界热议。具体如下:
高效利用显存,attention 参数量降低20倍;巧用状态缓存,95%请求无需重算;直接量化训练,推理零损失还省显存。
原文标题 : 乌鸦AI日报:OpenAI劲敌发布新模型,力压 GPT-4o