阿里云百炼上线音视频实时互动功能人人都能创建专属多模态应用

发布时间：2024-12-27 18:16:47 作者：玩站小弟

近日，阿里云百炼上线了全新音视频实时互动功能，用户可在百炼上自由选择文本、语音和视觉理解等200多款模型，无需代码，数分钟即可搭建一个能听、能看、会说的专属AI助手。阿里云百炼还支持以sdk的形式集成。

近日，阿里阿里云百炼上线了全新音视频实时互动功能，云百用用户可在百炼上自由选择文本、炼上语音和视觉理解等200多款模型，线音无需代码，视频实数分钟即可搭建一个能听、互动能看、人人会说的都能多模专属AI助手。阿里云百炼还支持以sdk的创建形式集成到Web、ioS和安卓应用，专属可应用于AI虚拟助手、阿里虚拟陪伴和AI老师等场景。云百用

用户在百炼上几分钟即可搭建一个能听、炼上能看、线音会说的视频实专属AI助手

过去一年，大模型正在从纯文本模态向语音和视觉等多模态演进，极大地拓宽了大模型应用的想象空间。然而现有单一模型仍旧无法处理复杂的任务，为了进一步加速单一大模型构建成像人一样自然交互的复杂AI应用，阿里云百炼提供了200多款语言模型Qwen、视觉语言模型Qwen2-VL、语音合成模型CosyVoice等全模态全尺寸大模型，同时联合阿里云AI实时互动方案，在国内率先为用户提供了便捷的工作流应用和智能体编排应用，例如支持构建RAG知识库、Prompt调优、sdk集成等。

据介绍，在视觉理解模型方面，阿里云Qwen2-VL具备强大的视觉智能体能力，例如采用多模态旋转位置嵌入（M-ROPE）方法，能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息，模型具备更好地理解和建模复杂的多模态数据，该模型一经推出就成为开源社区最受欢迎的多模态大模型；在音频方面，阿里云语音合成模型CosyVoice，通过对生成语音的情感、韵律进行细粒度的控制，情感表现力上得到明显提升，阿里云AI实时互动方案还可提供化智能降噪、智能打断、智能断句等超拟人对话能力。

以搭建一个视觉能力的AI应用为例，用户进入百炼应用控制台后，仅需上传图片知识库、编写提示词、设置音频、调优这四步，数分钟内就能创建一个能完成专属视频交互的AI应用，基于Qwen-VL强大的视觉推理能力，它不仅能识别物体的种类，还能准确描述物体的风格、特点、位置以及物体上的文字等关键信息。此外搭建好的应用还支持以音视频sdk集成到用户的Web、ioS或者安卓应用中，帮助企业快速实现业务创新。

据介绍，阿里云百炼上的通义API每百万tokens价格已降至0.3元，一汽、金山、哈啰集团、国家天文台等超30万企业和机构在使用阿里云百炼。

Tag：

[流言板]玄学！湖人已经连续4年圣诞大战得到115分，前三年均失利
[流言板]玄学！湖人已经连续4年圣诞大战得到115分，前三年均失利由篮球资讯发表在篮球资讯 50212月26日讯今日NBA圣诞大战的比赛全部结束，其中湖人115-113险胜勇士。根据数据统计，这是湖
2024-12-27
👻三节打卡不容易！哈登27分钟砍23分8助🐿️正负值+30！
11月25日讯 NBA常规赛，快船客场125-99大胜76人，哈登三节打卡。本场，哈登出战27分钟，投篮10中4，三分7中3，罚球12中12，砍下23分2篮板8助攻1抢断，正负值+30！
2024-12-27
首发79元乔思伯推出HF2
12月4日消息，乔思伯推出了新的散热产品HF2-120风扇，首发79元。据悉，HF2-120系列ARGB风扇通过正面四角矩阵点缀光效与边框背线连贯光效，展示了简约的科技灯效，高转速PWM区间调节带来了
2024-12-27
韩国红魔球迷会回应金玟哉：嘘声非针对球员，而是撒谎成性的足协
9月6日讯据韩国媒体报道，对于韩国队主场0-0被巴勒斯坦逼平后金玟哉的相关言论，韩国红魔球迷组织给出了回应。金玟哉赛后曾表示，从比赛一开始就听到了嘘声，因此他个人感到有些失望。对于金玟哉的言论，韩国红
2024-12-27
[流言板]剑南春战报：曼城1
[流言板]剑南春战报：曼城1-1埃弗顿，B席首开记录，哈兰德失点由足球资讯发表在国际足球资讯 482技术统计VS
2024-12-27
就是投不进！丁威迪末节&加时接连三分不中 12中1&三分9中0拿7分
11月25日讯 NBA常规赛，独行侠加时118-123惜败热火。本场比赛，丁威迪进攻端手感冰凉，全场都找不到准心，末节4记三分全丢，加时赛再投4个三分也不进，最终他12投仅1中三分9中0），罚球5中5
2024-12-27