让视障人士“看见” 让鼠标成为“助理” 大模型为智能终端“赋能”
【深圳商报讯】(记者陈姝)大模型正在加快重塑智能终端。6月6日,记者从阿里云深圳AI峰会上获悉,主流手机、PC、汽车厂商已在大模型领域与阿里云深度合作,提升产品智能化体验。
中国有大约1730万视障人士,大模型技术有望打开他们的“视界”。七年前中途失明的生活博主“宝哥和他的导盲犬”用视频记录了他使用“vivo看见”乘高铁出行的全过程。他“看见”了高铁窗外的风景、桌上的水杯,“分清”了酒店里的洗漱用品。“vivo看见”为他描述路边的月季花,唤起了他似曾相识的童年回忆。
vivo AI研究院人工智能部总经理郝雄介绍,在这些“有温度”的场景背后,是vivo自研蓝心大模型的支持。从去年开始,vivo加紧大模型的研发,基于阿里云PAI机器学习的千卡大模型预训练性能接近LLaMA水平。目前,vivo蓝心大模型已包含十亿、百亿、千亿三个参数量级、五款不同尺寸,去年11月上线以来对vivo手机的AI影像、智能助理、图文创作等场景进行了全面优化,并升级了视觉辅助产品“vivo看见”。有了大模型的加持,“vivo看见”不仅可以在镜头对准周围环境和物品时自动播报画面内容及文字信息,还可切换到文字、卡证、条码等多种识别模式,并进行多轮对话,获取更多画面细节,同时支持常见物品查找。
国产新能源车创新势头不减。也在会上宣布,已在智能座舱场景中新增接入阿里云通义千问。基于小鹏自研大模型XGPT和通义千问等模型升级后的车载助理“小P”,可以在用户说“有点冷”时,准确理解意图、调节车内温度。在发布量产上车的端到端大模型后,小鹏成为同时将大模型落地座舱和智驾的车企。
创立于深圳的智能语音交互领域领军企业北科瑞声也已在智能手表、鼠标等终端解决方案中接入通义千问。通过将语音识别、语音生成技术与大模型相结合,用户可以借助这些灵巧的终端“助理”,完成跨语种无障碍对话、病案自动录入等动作,语音交互时延缩短至100毫秒。
此外,金山办公已接入阿里云通义千问。助理总裁朱熠锷介绍,WPS AI已陆续上线多项AI功能,包括一键生成PPT、AI写公式、AI文档问答等主要功能。同时,在用户高度关注的“数据安全”问题上,WPS AI采用了通义千问的可信推理专区,通过云端资源隔离、网络隔离、数据审计等方式,确保用户数据仅参与内存中的推理计算过程,不会逃逸出专区范围,确保。
WPS Office官网-适合所有人的一体化办公套件,兼容、可共享、免费Offic下载 – WPS Office官网-适一体化,不仅仅是一个办公室,免费Offic下载 » 让视障人士“看见” 让鼠标成为“助理” 大模型为智能终端“赋能”