【TechWeb】3月19日音讯,作为一款交融阿里通义大模型的「音视频转文字」产品,阿里通义听悟近来晋级发布多项新功用。
现在,通义听悟供给“实时语音转文字、上传音视频转文字、输入播客链接转写文字”三大主力音视频转文字服务,支撑的单个视频最大时长,从4小时调整为6小时,视频文件巨细上限调整为6G。
一起,通义听悟交融了十多项AI功用,包含转写、翻译、人物别离、全文摘要、章节速览、讲话总结、PPT提取等,并支撑标关键、记笔记,被许多用户称为“瑰宝AI东西”。
用户注册后,就能免费运用通义听悟。现在,用户可在PC端()、及Chrome\ Edge浏览器插件,钉钉、微信小程序方法运用通义听悟。
据悉,未来,将在通义千问APP中集成通义听悟的功用,到时候APP端也能运用通义听悟。
阿里通义听悟产品负责人杨帆介绍,自上一年6月发布以来,通义听悟累计注册用户超500万,包含学生、教师、白领、记者、律师、金融分析师等集体,每日处理音视频20万次。通义听悟面向C端用户没有收费方案,针对B端用户的需求,现在通义听悟API现已敞开。
针对音视频转文字后的更多细节才能,通义听悟不断在做功用更新。此次,就一次性推出了多项新功用和服务,包含音视频问答帮手“小悟”、音视频文件语种自动识别、思想导图、一键刺进视频时刻戳及截图、AI改写、高校公益方案等。
杨帆介绍,音视频承载了密布的内容信息,但因触及多模态了解、自然语言处理、查找等多项杂乱技能,长期以来内容查找难、回忆难、提炼难。通义听悟为这一需求而生。作为一款作业学习AI帮手,通义听悟一直在晋级新才能,期望让高常识附加值的音视频被轻松阅览、收拾和共享。
此次通义听悟上线的「小悟」拿手了解并答复与记载内容和播客内容相关的问题,帮用户更好地了解和把握常识,无论是单篇记载仍是多篇记载,小悟都能担任。
小悟经过多语言Query处理、长华章文本了解、指令演化结构优化及检索增强生成算法,在业界初次完结对超长音视频的单记载、跨记载、多语言自在问答,支撑内容问答的音视频时长和文件数均打破业界上限。
用户不只可在单一记载页呼喊小悟,对最高6小时、6G巨细的音视频发问任何相关论题,或直接小悟要求收拾金句、整理定论、写会议纪要;更可在主页针对用户一切记载发问,支撑一次性扫描了解上百条音视频内容;也可花式对英文视频用中文发问,小悟将直接给出中文答复,省去翻译。十分适用于很多视频网课/材料内容的科研学生等集体。
笔记可增加时刻戳,点击跳转对应进展。经过一键刺进视频时刻戳,右侧用户手动输入的笔记中带有时刻信息,用户点击时刻戳,能够直接把笔记记载时刻对应的原音频/原视频的方位找到。
支撑视频截图刺进笔记中。在视频东西栏中点击截图按钮,即可将当时画面截图并刺进笔记中;假如当时视频有PPT提取成果,还能够截图当时画面并刺进PPT中。
通义听悟AI改写功用,支撑中英文文本,在保存原文关键内容的基础上精简和改写原文;一键完结文本修正和润饰,进步阅览功率。
敞开AI改写后,你能够将改写成果摘取至右侧笔记。在顶部菜单栏中找到批量摘取图标,挑选「摘取改写成果」
通义听悟推出「高校公益计」”,推进AI算力普惠。一切中国大陆高校师生经过后缀教育邮箱进行认证后,均可直接获赠500小时转写时长,存储空间从20G拓宽至200G。按现在市面上语音厂商9.9元每小时的折扣价,这一教育福利价值数千元。
提交电子邮箱地址(方式为.cn或.edu.cn)后,通义听悟将向此邮箱发送认证页面链接。用户需翻开认证页面并承认进行认证。经系统验证经过,即完结认证,在认证有用期内可享专属权益。(果青)
每日头条、业界资讯、热门资讯、八卦爆料,全天盯梢微博播报。各种爆料、内情、花边、资讯一扫而光。百万互联网粉丝互动参加,TechWeb官方微博等待您的重视。
江苏卫视与WiFi打造跨年新玩法,为增强大型演唱会互动性供给新方法
TechWeb微晚报:CES 2025周二晚开端,抖音渠道不让提“钱”只能提“米”?
Gartner:到2024年6月,仅8%中国企业将生成式AI布置在出产环境中
音讯称iPad Pro所需OLED屏削减后 乐金显现有意将出产线用于为iPhone供货
CES 2025周二晚开端 主题包括AI、机器人、才智城市、智能家居等
音讯称特斯拉Cybertruck上一年Q4交给不到1.8万辆 还未能大幅度的进步交给量
音讯称特斯拉已在全球交给超越720万辆电动汽车 估计下一年超越1000万辆
青云QingCloud EHPC 打造即买即用的全流程SaaS化超算服务
蚂蚁链发布BTN:可将区块链网络吞吐量进步186% 带宽本钱下降80%
蚂蚁自研数据库OceanBase宣告开源 300万行中心代码向社区敞开