·如视的专利密码:如何构建数字空间“护城河”·2025通信会丨以创新技术赋能新型电力系统 锐捷知识大脑推动效率提升·从技术到战场:华为云联创营破解AI落地“产业密码”·Aqara 语音伴侣 H1 正式发布:全屋妙控,一句就 AI 了·Social to Sales,助力品牌全球业务增长|数说故事十周年战略升级·赋能汽车新生态:神州数码、思科携手开展圆桌研讨会·AI落地真场景,共探增长新境|数说故事D3论坛圆满收官·文心快码3.5 全新升级:为百度创造40%新增代码,累计服务760万开发者·海南联通发布"双万兆"网络建设成果,联合华为构筑自贸港数字经济新基座·外卖实况窗更便捷,百亿补贴更优惠!速来体验鸿蒙版京东品质外卖·智能驾驶热潮下的安全觉醒:华为联合11家车企推动行业自律与技术升级·小米手机时隔十年再次登顶国内榜首,超越华为、OPPO、苹果·QQ 9.1.70新版本开启测试,可支持微信小程序·恭喜林更新成为高贵的E8玩家!海信百吋大屏让客厅秒变世俱杯赛场·首发骁龙8至尊领先版!电竞性能旗舰荣耀GT Pro正式发布,3199元起·7200mAh巨兽电池、骁龙8至尊芯、电竞级操控,荣耀GT Pro重新定义3000元档位的游戏规则·“小屏大魔王”一加13T正式发布 国补后售价2899元起·抖音生活服务2025年「心动榜」发布:“好吃”和“吃好”都重要·年轻人的假期续航包:把餐厅吃成“旅行试用装”·比旗舰还旗舰?刚爆料的这款高定电视,实在令人期待!·2025中国家庭全屋用水行业高峰论坛召开,华帝引领用水健康变革·BYDFi正式上线链上交易工具MoonX 开启CEX+DEX双引擎时代·百度有驾硬核亮相2025上海车展:用创新技术打通行业对话与用户服务·星环科技入选大模型应用交付供应商名录,领航AI产业新生态·苏宁易购深耕粤海市场,战略全面启动!·酷开教育智能体:以AI互动开启“学练思”一体化革命·荣耀 MagicBook Pro16 笔记本 HUNTER 版 4 月 30 日发布,搭载 RTX5070 显卡·真我GT7正式发布,2599元起,搭载3nm天玑9400+·YOUMAGIC溯源活动圆满落幕,揭秘清华智造科技美学新范式·当西湖醋鱼遇见奥斯卡影帝:一场厨房里的中美烹饪文化外交
您现在的位置:首页 >> 新•资讯 >> 正文
Google为开发者推出改进后的语音转文本服务
发表时间:2018年4月11日 16:30 来源:太平洋电脑网 责任编辑:编 辑:麒麟

几周前,Google刚刚对“云端文本转语音”API 实施了大改版。现在,该公司又升级了自家的 Speech-to-Text 语音识别服务。改进后的 STT API 承诺显著提升了语音识别的性能,在内部所有测试中,单词错误率减少了 54% 左右。不过在某些领域,实际表现要好得多。基于用例,新版 API 现允许开发者在四种不同的机器学习模型间进行选择。

其中有面向短查询和语音命令的,以及一个理解通话语音和处理 视频中音频的。第四个模型属于新增默认,谷歌推荐在所有其它场景中使用。

此外,谷歌还带来了一项新的标点符号模型。团队承认,其录音文本长期饱受标点符号不太正常的吐槽。用标点符号来表达自己的观点,算是出了名的困难。

谷歌承诺新模型可带来更多可读的转录文本,包括更少的断句、更多的逗号、句号、以及问号。

本次更新后,谷歌还允许开发者借助一些基本的元数据标记他们的转录音视频。尽管一时发挥不了直接的益处,但谷歌表示,它将使用来自所有用户的聚合信息,来决定下一步要优先考虑哪些新功能。

最后,谷歌还试图对这项服务的收费方式做出小小的改动。此前,音频转录的收费标准为 0.006 美元 / 每 15 秒;视频模型的收费翻倍(0.012 美元 / 每 15 秒)。

不过 5 月 31 号之后,使用新模型也需要支付 0.006 美元 / 每 15 秒。

相关文章
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备15027068号】
Copyright © 2015 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。