测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

用户投稿 30 0

豆包App月活破7500万,模型能力再进化,智商情商在线

AI原生应用蓬勃发展,豆包App以其卓越的表现,成为行业焦点。

QuestMobile2024年AIGC应用发展年度报告数据显示,截至2024年12月,豆包App月活跃用户规模复合增长率达到21.2%,强势突破7500万大关,在综合类AI原生App中以显著优势稳居榜首。

在综合类原生App呈现的二八流量格局中,豆包与另外两家头部应用共同包揽80%流量,凭借庞大的用户基础和高活跃度,成为行业发展的引领者。

1月22日,豆包大模型1.5Pro版本正式发布。此次更新进一步提升了豆包大模型的性价比:32k上下文长度的Doubao-1.5-pro处理100万token仅需8毛钱,输出100万token也只需2元。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

然而,豆包并不是一味“卷”价格,而是真正做到在价廉物美的基础上实现收益。报道称,豆包大模型去年大幅降价后,毛利率依然为正。其中,字节跳动最新推出的豆包大模型1.5,在推理成本优化上取得进一步突破。在火山引擎上售卖API的Doubao-1.5-pro,毛利率仍能达到50%。

豆包App的领先,得益于其持续进化的模型能力。

豆包大模型1.5Pro综合能力显著增强,低训练/推理成本和高效模型结构全面提升多模态能力和推理能力,在多项公开评测基准上全球领先。模型训练过程中,豆包大模型1.5Pro未使用任何其他模型生成的数据,扎实不走“捷径”。

智商、情商、听说读写全面提升

豆包大模型pro 1.5在同一模型中融合并提升了视觉、语音等多模态能力,可为用户带来更自然、更丰富的交互体验。

它到底有多强?先看排名。

在多项基准测试里,豆包1.5 Pro的得分达到了全球领先水平

首先,在编程和数学能力方面,豆包1.5 Pro的表现属于行业第一梯队。

其次,在更适合中国人使用的中文理解方面更是明显优于海外模型。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

图片来源:豆包技术博客

此外,豆包1.5 pro还是一个多模态模型,具备视觉、语音等多模态能力,而且多模态能力处于世界一流水平。

豆包1.5 pro的视觉推理能力表现优越,在各类评测基准上均取得了优异表现。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

漂亮的参数背后是否有真材实料?一一来看。

首先,先看逻辑推理能力。

先来一道经典的爱因斯坦谜题开开胃。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

这一问题豆包仅使用不到7秒的时间就解出了正确答案。

Doubao-1.5-pro-AS1-Preview模型能力更是炸裂,连网络梗知识都能给你分析得明明白白。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

其次,视觉多模态性能进一步提升,从容应对更复杂场景。 相比于上一版本,Doubao-1.5-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术提升,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循等方面的能力,并让模型的回复模式变得更加精简、友好。在同一模型中融入强大的视觉理解能力,使模型可以同时理解虚拟和现实世界的各类视觉信号,更好地辅助人类决策。输入任意分辨率图像,无论是高清大图、低分辨率小图还是极端长宽比图像。豆包大模型都能根据需求,实现精准的特征提取和高效的计算性能,满足提问者对图像内容深度探索的需求。

笔者请求豆包批改图片中的英文作文,豆包很快就给出了评分与理由,并提出了修改意见。豆包对错误的识别异常精准,想来以后老师们改作业就有福了。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

之后我们再加大难度,让豆包站在产品设计师的角度来评判一张椅子的产品设计图

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

这回答专业感爆表,以后做设计又要少熬几个通宵了。

豆包最新更新的语音模式更是一绝。语音多模态理解生成一体化,情商智商双双在线。 在语音多模态上,豆包团队提出了新的 Speech2Speech 的端到端框架,不仅通过原生方法将语音和文本模态进行深度融合,同时还实现了语音对话中真正意义上的语音理解生成端到端,相比传统的 ASR+LLM+TTS 的级联方式,在对话效果上有质的飞跃。这使得豆包语音模型可以理解各种人类情感,并完美的模仿出来。

视频加载中...

除此之外,豆包连方言都能轻松解读。

视频加载中...

豆包1.5 pro如何打破 “低价无高性能” 魔咒

长期以来,AI行业迷信“大力出奇迹”,认为优秀的大模型必定耗费巨大。低价和性能不可兼得。

许多同行为了降低成本,依赖外部数据或蒸馏其他大模型。

此前就有学者指出,蒸馏技术虽能提高效率,但存在巨大缺陷,就是被训练的模型(即“学生模型”)没法真正超越“教师模型”,会产生一种隐性天花板效应。更深层次看,过度依赖蒸馏可能会扼杀AI领域中新颖的、具有变革性的创意。

阿尔特曼也表示:“复制已有的东西容易,但创新却很难。”

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

图片来源:X

而豆包走的是另外一条路。豆包1.5 pro的训练过程中完全依靠自有数据,不仅保障了数据的独立性和可靠性,还有效避免了外部模型潜在的偏差影响。

其次,豆包1.5 pro采用MoE(混合专家)架构,通过训练-推理一体化设计,在保持强大模型性能的同时,极大地降低了推理成本。

从训练和推理效率的角度来说,豆包1.5 pro所使用的稀疏MoE 架构仅用较小参数激活,性能即可超过Llama3.1-405B等超大稠密预训练模型。

豆包团队通过对稀疏度Scaling Law(缩放定律)的研究,确定了性能和效率比较平衡的稀疏比例,让小参数量激活的模型同样能够达到当前世界一流大模型的性能。

此前的MoE架构普遍只能达到3倍杠杆的水平,而豆包1.5pro就把标准提升到了7倍。

在完全相同的9T tokens数据对比验证下,用激活参数仅为稠密模型参数量1/7的MoE(混合专家)模型,就超过了稠密模型的性能。不仅如此,得益于更优的预训练数据质量和训练超参,Doubao-MoE的性能同样可以超越总参数远大于它的超大规模稠密预训练模型,比如 LLaMA-3.1-405B,其训练数据为 15T tokens。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

图片来源:豆包技术博客

另外,算法团队在预训练模型的基础上,设计了一系列模型参数动态调整算法,可以根据不同应用对模型性能的需求,从模型深度、宽度、MoE专家数、激活专家数、隐藏token推理等维度来选择扩增和缩小模型参数,灵活性和适配性拉满,最大程度达成模型能力与推理成本的最优平衡。

豆包大模型携手火山引擎,深度赋能千行百业

当下,人工智能已成为各行业转型升级的核心驱动力。豆包大模型凭借其卓越性能,在火山引擎的强力支撑下,正深度融入汽车、手机等诸多行业,重塑产业格局。

火山引擎作为字节跳动旗下云服务平台,帮助企业和开发者更方便地调用豆包大模型,大幅降低了使用成本,让企业能够以极低的成本获取强大的AI能力,真正实现了AI技术的普惠,为大中小企业在数字化转型过程中减轻了经济负担,加速了AI技术在各领域的广泛应用与深度融合。

据悉,豆包大模型已经与八成主流汽车品牌合作,并接入到荣耀、VIVO等多家手机品牌。此外,豆包视觉理解模型已经接入PC端产品。覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。

火山引擎持续深耕技术研发,不断推动豆包大模型迭代升级。从豆包3D生成模型与火山引擎数字孪生平台 veOmniverse 协同打造物理世界仿真模拟器;到对标GPT-4o且价格优势显著的通用模型pro;再到音乐模型、文生图模型等功能的进阶突破,以及即将推出的视频生成模型1.5版和端到端实时语音模型所蕴含的巨大潜力,都彰显了其在AI领域的创新实力与全方位布局。在为企业提供丰富多样、高性能模型选择的同时,火山引擎还通过升级火山方舟、扣子和 HiAgent 等平台产品,助力企业高效构建自身AI能力中心,加速AI应用开发进程,全方位保障企业在智能化转型道路上稳步前行。

随着豆包大模型与火山引擎的深度融合与持续创新,在千行百业的渗透将更为深入,有望解锁更多创新应用场景,创造更大商业价值与社会福祉。

文/丘山

实测医疗APP好伴AI:数字版三甲专家人人可用,AI医疗落地走通?

卷赢大模型训练成本之后,DeepSeek正在重塑全球AI竞争格局。

微信、飞书、百度等上百家企业一个赛一个地宣布接入DeepSeek,表面喧腾之下,实则是更多应用场景的进一步落地。

随着各行各业的领导者全面拥抱AI,整个社会以及我们每个人其实都正在接入AI。

不过,作为AI领域最被看好,且一直不缺讨论度的AI医疗 ,目前始终存在“缺少领头羊” 的局面。

原因不外乎三点:

AI医疗场景细分化程度过高 。从中医到影像识别,从陪诊就医到药物研发,落地的应用很多,但真正罕有能够出圈的;缺乏统一标准来评估医疗AI大模型的能力 ,导致缺失明确的发展和改进方向,且试错成本高企;行业特征所限 ,AI医疗严格受到伦理等客观因素制约,厂商们面临严格的权限和资格审查;

然而,也是在这样的环境下,杭州的一家科技公司“智诊科技”所推出的产品——好伴AI ,上线了一些令人眼前一亮的医疗AI功能和差异化技术,获得了人们的目光。

更重要的是,与DeepSeek登陆App Store人人可用一样,好伴AI现在也以APP的形态,人人可体验。

没病纯保健,可以让好伴AI帮看看——

比如当你拿到了一份最新的体检报告,里面的专业名词让你一看一个不吱声,没关系,上传一下它就能帮你解读。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

有症状想先问问——

它能结合真实医生的临床经验、医学手记、科研论文,给三甲医院专家建立了数字分身,不用挤破头挂号就能在家问诊。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

由于观察到用户增长速度很快,我们也决定对这个AI进行一次深度测评。

一手实测「好伴AI」

目前这款产品有网页版APP版 ,下面我们直接用APP实测。

首页打开是酱紫的,一眼就能看到几个核心功能:

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

实测项目一:解读检测单、体检报告

这第一关,我们直接从最常见的检测单/体检报告解读 开启。

只需一个上传多图的动作,两张令人懵逼的检测单就秒秒钟被解读出来了。

(考虑到个人对准确性的要求,一开始就打开了深度慢思考)

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

仔细看,在一步步思考后,好伴AI最终做出了两个主要判断:

胆红素水平升高;对于乳腺结节,右侧的低回声结节(BI-RADS 3类)和左侧的无回声结节(BI-RADS 2类)都属于良性可能性较高的类型;

而这也都和检测单原版结论完全对上了。

比较贴心的是,回答过程中它还和线下医生一样,不仅明确了复查时间,还会提醒各种注意事项。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

看来小小几张检测单是难不倒它了。

那么,让难度再次升级,直接扔给它一份辣么长的体检报告PDF呢?(里面有各种检测单、超声图、心电图等)

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

点进右上角的「体检报告解读」,可以看到有两种上传方式:

一种是直接传PDF文件,另一种是复制粘贴报告链接。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

这里要插一嘴,为了真实考验好伴AI的能力,我们提前将报告里的结论页都删去了

实测过程中,它先花了大约两分钟解析PDF,然后会要求你回答一些个人健康状况(20道题),再之后你就可以和AI医生交流各项异常指标了。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

整体测下来,大约10分钟内就可以获得一份详尽报告。挨个比对其结果和原版结论,竟然也都完全吻合。

对了,眼尖的朋友想必也发现这里还有一个历史报告记录 ,作用就是收集整理你的历次体检报告。

如此一来,以后想要随时查看自己的健康史也就更方便了。

实测项目二:线上找三甲医生“数字分身”问诊

接下来,我们再来测一下好伴AI的另一大亮点——医学专家分身系统

一眼望去,光看头衔就知道这群专家线下的“号”很难挂了。

王利权(浙大医学附属二院/妇产科主任医师)、邬玲仟(中南大学湘雅医院/妇产科主任医师)、张炜(复旦大学附属妇产科医院/主任医师)……

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

等等,先解决一个好奇,这些数字分身从何而来呢?

原来,这些是通过融合真实医生的临床经验、医学手记、科研论文、授课视频等个人独有的资料,利用AI技术打造而来。

像王利权医生的“数字分身”,不仅掌握了他40余篇论文和近400个视频中的专业知识,还能模拟他的诊疗思路和沟通风格,从而为用户提供高度个性化的建议(如孕期健康管理、唐筛报告解读)。

言归正传,每一个数字分身点进去,其主页都有各自擅长领域的介绍。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

鉴于王医生擅长妊娠并发症等,我们直接咨询一个最近刚上过热搜的案例。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

只见“王医生”慢慢思考之后,非常细致地列出了这位高危产妇在手术过程中需要注意的点。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

而且深扒其思考过程,也终于解答了当时看热搜引发的好奇:

为啥要让胎儿在胎膜囊未破的情况下出生?(原来是为了保护早产儿)

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

整体测试下来,这个功能不仅解答确实专业,而且相当利国利民,毕竟这就意味着最顶尖的医疗专家资源,每个人都能无差别共享,还是7x24小时响应那种。

实测项目三:全科医学咨询OK吗?

当然,除了找专家处理复杂问题,医疗场景中更日常普遍的还是“全科门诊和咨询”。

但整体实用下来,好伴AI效果不错,或许是由于它背后是730亿参数的全科医学通用大语言模型WiseDiag-Z1,因此我们可以像对话一样,让其帮忙提供症状分析、用药咨询以及个性化健康指导。

比如身为打工人,一旦觉得身体疲劳了,我们就总是想问:

难道是气血不足了? (笑死,这个问题还经常冲上热搜)

随机找一位全科医学专家,问问他有没有哪些判断小技巧。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

结果,他直接从中医角度给了一套自检小连招,看脸色、查舌头、观眼睛、看头发,这就马上get!

此外,还有从现代医学角度的“症状”诊断:

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

很好,是谁全中了我不说,而且建议的第一条还是不要熬夜。

emmm……发出皇后娘娘的委屈,毕竟实测的时候我就在熬夜:

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

不过,虽然建议咱确实做不到,但情绪价值也给拉满了——AI还能够以非常温柔、积极的姿态关心俺们……

实测项目四:上下文和长记忆能力如何?

作为一个线上医疗产品,必须要具备的是能长“陪伴”,能够对用户过往问诊记录有记忆,不必每次都重新表达。

所以我们也测试了一下,比如模糊记得,很早之前和它聊过肝功能 的问题,刚好随机抽查一下……

没想到,它准确回忆起上次聊到还是6个月前,并且建议近期去复查。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

再来一次,前一阵有落枕的毛病,到现在还没缓解,于是又问了一遍。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

从其思考过程来看,它明确意识到了用户之前就有落枕这一点:

已知前一天有落枕史……

这种记忆和上下文联想的能力,基本上能够实现长期健康追踪与个性化服务了。

当然,出色的产品体验背后,一定是基于技术上的领先。

当我们把体验反馈给好伴AI的出品团队时,他们也分享了背后的技术关键。

技术原理=730亿参数医学大模型+推理

简单说无非就是两点,一是基座模型 ,另一方面在则是产品化 ——

模型上,团队精心训练了全学科医学基座大模型WiseDiag-Z1;产品化上,则针对市面上同类医疗AI进行了全方位改进。

先说模型训练。

第一步,垂直领域要想训练出真正有用的AI模型,大量高质量数据必不可少。

于是,团队给模型“喂”了超3万亿token 的专业医学数据,包括权威教材(如《内科学》、《妇产科学》)、最新临床指南(如NCCN、中华医学会系列)、50万篇医学论文及真实病例库。

打好地基之后,接下来的关键是如何处理这些素材。

这里,团队祭出了一项关键法宝——医学编码模型(Med-Embedding) 。与普通向量编码模型不同,它能通过捕捉医学术语的临床意义,将这些信息转化为高维向量,确保AI在诊断时不会混淆关键细节。

通俗地说,有些表达在日常语言中看似区别不大,但到了医学场景,往往失之毫厘谬以千里。

就像“发烧38度三天”和“反复低热”,前者更接近急性感染的向量,而后者则是慢性。

这种关键但又细微的差别,往往普通向量编码模型无法准确区分,不过医学编码模型会结合医学知识库和临床背景,对术语进行精准编码。

这还不算完,训练过程中,团队还邀请了临床医生深度参与

通过监督微调(SFT)和直接偏好优化(DPO),人类医生的诊疗思考逻辑(如鉴别诊断优先级、风险权衡等)也被引入模型。

最终,团队为好伴AI自研出了全学科医学基座大模型WiseDiag-Z1 ,拥有730亿参数,支持32K上下文长度。

它采用了独特的多层次推理机制,能够像专家医生一样,进行深入细致的分析思考和反复权衡;且在病因分析、鉴别诊断、制定治疗方案等关键环节,它能模拟专家医生层层思考,直至找到最优解。

测智商的软件下载 豆包App月活破7500万,模型能力再进化,智商情商在线

而基于这一具备推理能力的强大专业模型,团队更是在打磨具体产品上下足了功夫。

分析目前市面上的医疗AI,无外乎有以下几种形态:

在线问诊+药品配送,AI基于预设规则来诊疗一些常见病;医学知识科普+轻问诊,AI局限于症状自查表;医院挂号与慢病管理,AI以信息匹配为主;

但不管是哪种形态,都有些共同的缺点:1)首先还是技术不够成熟 ,大多数仍采用非推理式的模型,无法处理复杂医学推理(鉴别诊断能力差);2)顶尖医学专家供给有限 ,无法提供大规模服务;3)更偏向通用 ,无法实现个性化服务,尤其在个人身体情况本身千差万别的情况下。

针对这些竞品的不足之处,好伴AI逐渐走出了自己的差异化特征:

技术层面,730亿参数WiseDiag-Z1大模型+医学编码模型,能够支持多模态医学数据解析。

举个例子,以川崎病皮疹 为例,由于传统医疗AI依赖关键词匹配,因此很容易将它误判为普通过敏,但实际上它是一种以全身血管炎为主要病理改变的急性发热性疾病。

服务方面,借助三甲医院顶尖医生的数字分身,AI诊疗也变得更加专业化、个性化了,真·人均三甲。

最重要的是,借助多层记忆存储+动态知识库(1.2万种疾病),跨周期健康追踪也不在话下。

正如实测部分所展示的,它不仅能帮你回忆起一些旧诊疗记录,还能及时比对动态知识库,快速锁定潜在风险。

事实上,就在上周智诊科技连开几场发布会,一口气发布了三款专业模型:

WiseDiag-Z1,全科医学通用大语言模型标准版;WiseDiag-Z1 Thinking,深度推理增强版,适合多步骤复杂场景;WiseDiag-Z1 Lite,量化版,比Z1响应速度更快、更便宜。

冉冉升起的明星医疗AI

文章最开始我们有说了,不论是智诊还是好伴AI,都在越来越破圈、被热议,被视为宝藏杭州冉冉升起的明星。

但实际上,不论是技术还是产品,都离不开智诊科技创办之日就对优质医疗普惠化 的坚定追寻。

在中国乃至全世界,都存在着医疗资源分布不均、优质专家稀缺这一痛点。

与之形成鲜明对比的是,每个人都渴望有一个随叫随到的专家级私人医生。

现在,好伴AI做到了。

它没有以“医生助手”的形态示人,而是直接触达普通用户,这种做法不仅最奥卡姆剃刀,也最大程度满足了普通人对医疗资源的渴求。

而且不仅是从无到有,具体到其中的各项功能,也是个个直戳人们的内心。

人们认可专家的名号,更青睐于让专家给自己坐诊,好伴AI就直接把专家复刻成数字人;

人们希望AI助手能够更懂自己,动态掌握自己长期的健康状况,好伴AI就加入了长期记忆;

人们希望专家不仅能够提供实质的帮助,态度上也要友好亲和,好伴AI就给人们输出情绪价值……

作为一款APP,作为24小时在线的“口袋专家”,好伴AI精准地狙击了人们的痛点,架起了医疗大模型和普通用户之间的桥梁,让人们必装的APP又多了一个。

目光上升到宏观层面,好伴AI也实打实地降了低就医门槛。尤其对一些落后偏远的不发达地区来说,这一工具对避免延误诊疗至关重要。

另一方面,好伴AI对医生来说也是一种极大解放。通过上面提到的专家分身系统,他们的宝贵临床经验被转化成了可复用的数字资产。如此一来,这群人也能更加专注疑难杂症,从而最大限度发挥智力资源。

道虽远,行则将至,虽然面临着诸多困难和不确定性,但好伴AI已然在AI+医疗领域披荆斩棘,开辟出了新的道路。

虽然成立还不到两年(2023年6月),但从其一路问鼎全球最强医疗AI模型可以窥见,它可能会成为现阶段发展最快、应用价值最高的医疗AI之一。

网页已经就绪,APP也能公开下载,实力如何,可以自己上手试试了~

网页端(APP端需自行下载好伴AI):https://chat.wisediag.com

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

相关问答

11选5万能缩水免费下载[秒懂科普]测试版APPv8.8.9-图吧地图

标题:11选5万能缩水手机版免费下载中指研究院認為,整體來看,隨著下半年市場高...智商高低手掌上有信...简介11选5万能缩水手机版免费下载最新版截图#周倜1...

抱歉,评论功能暂时关闭!