您的位置:首页 > 科技

AIGC一路“狂飙”,如何应用到声音业务?荔枝集团给出了结论

发布时间:2023-04-26 22:31:34 来源: 编辑: 浏览:

  从AI绘画、AI视频换脸再到当下爆火的ChatGPT,越来越多的 AI 生成类软件如雨后春笋般冒出来,AIGC(人工智能生成内容)也成为当今大数据时代下最热门的话题。

  同样的,基于互联网的音频业务全球市场规模持续增长,在线音频业务平台生态和产品形态不断多样化,为互联网用户提供了播客、直播、社交、游戏等音频服务场景,提供了人工智能技术在业务广泛应用的行业实践空间。随着AIGC和大语言模型的技术突破,为音频互动产品提供了更多创新的可能性,通过AIGC和大语言模型技术赋能业务产品创新探索将成为未来的发展趋势。

  近日,白鲸技术栈携手亚马逊云科技&伊克罗德&Intel,分别在北京、广州两地举办《乘“云”而上 数智AI并行》、《游戏行业创新发展研讨会》技术沙龙活动,来自亚马逊云科技、英特尔(中国)有限公司、荔枝集团、启元世界等嘉宾,探索如何用数据+人工智能+云技术,构建企业出海、游戏行业创新新路径。

  从AI降噪到AIGC赋能音频业务

  作为以音频为中心的社交和娱乐平台,荔枝集团是行业内为数不多拥有自研声音技术的平台。2022年,荔枝推出了自研技术综合平台“声音云”,荔枝一直在研究AI语音相关的核心底层技术,结合市场上的前沿技术成果,正陆续将AI语音、NLP等技术应用在产品中。


  在技术沙龙中,荔枝集团以“AI降噪技术”为例,音频技术团队基于以站内海量内容数据,通过自研训练的AI降噪算法,可以有效抑制互动文娱场景下音视频通话过程中的背景噪声,并保证语音无损伤,最终有效提升在多种复杂场景下的实时互动体验。

  荔枝资深音频算法工程师徐潇宇介绍,互动娱乐场景相比其他场景,其技术差异方向主要在不同外设的接入、多条通道的支持、变声美声的需求、声音的理解以及链路音质的提升等方面。跟会议场景声音源主要来源采集输入通道不一样,文娱场景为了丰富娱乐性,在主播端要支持音乐播放通道、音效播放通道、屏幕共享通道等。当主播进行才艺表演或播放音乐时,整个互动娱乐场景对于音质的要求就会提高。从音频体验来讲,要让用户像在本地一样声临其境沉浸式的参与到互动场景当中,不受各种身边噪音输入干扰,这成为了音频行业的一大技术难点。

  徐潇宇现场演示了不同使用场景下的“AI降噪”效果。随着算力持续增长,基于大数据训练的AI语音降噪算法具有强大的能力,使实时AI语音降噪算法在互动娱乐场景中成为可能。相比于传统的降噪算法,荔枝技术团队自研的 AI 降噪的效果有巨大提升,对直播场景可能经常会遇到敲键盘、喝饮料、背景讨论等噪声能进行有效抑制乃至降低到最低影响。


  除了音频底层技术赋能业务,荔枝还积极利用AIGC上的技术突破,为音频互动产品提供了更多创新的可能性。据悉,荔枝已经在旗下多款产品中应用AI语音技术,并上线了聊天机器人等创新功能。包括在旗下音频产品中上线了语音聊天机器人“小吱”。据了解,荔枝团队将自然语言处理NLP技术与语音识别ASR、语音合成TTS等AI语音技术相结合,在今年2月完成了语音聊天机器人原型开发,并上线了“小吱”机器人,为用户提供一种全新的智能语音聊天体验。

  通过对自然语言处理NLP技术的深入研究和探索,荔枝在此前推出在线聊天机器人产品demo基础上,本次升级则结合荔枝在音频领域的技术能力,实现了AI语音技术的应用。在线语音聊天机器人通过语音识别ASR技术可实现语音输入内容的自动识别,并应用NLP技术进行自然语言智能分析并对语意做出判断和反馈,最后通过TTS技术实现语音回复的输出,使用户可以通过语音对话与语音聊天机器人进行互动,并收到符合语境的语音回复。


  AIGC会是荔枝新增长极

  据兴业证券研究报告,AIGC有望成为互联网下一阶段的增长驱动。Gartner 预计,2022 年AIGC 占全球数字数据量为1%,到2025 年,这一比例将提升至10%。应用领域广泛,如软件编程,医药研发,精准营销,影视娱乐等,除了内容产出的变革外,AIGC 也将有效的提高工作效率,减少工时。


  对此,不少人可能已经体验过AIGC的魅力了。当然,随着ChatGPT的大火以及中国互联网科技公司的加入,其实AIGC已经进入了一路“狂飙”的阶段。

  在海外,大厂纷纷布局,商业化速度快于预期。除了OpenAI 的ChatGPT 外,如谷歌推出聊天机器人Bard,英伟达推出AI Foundation 云服务。而在商业化方面,OpenAI 携手微软,已经在多个方面进行布局尝试,如搜索、Office 365 Copilot、Azure OpenAI 服务、Plugins、订阅等。此外Meta 发布通用图像分割模型SAM,有望加速自动驾驶发展。

  而在国内,各家厂商也纷纷加速研发与投资进度。百度于3 月份上线文心一言,此外,阿里、商汤、昆仑万维等均于4 月份举办大模型发布会或产品发布会。由于大语言模型的开源,如Meta 的LLaMA,使得大语言模型开发在算法上的门槛降低,算力、数据、落地场景成为各家大厂重要看点。

  AIGC的出现和应用,意味着基于AI技术延伸出的大规模商业时代即将来临。业内资深人士表示,对荔枝而言,抓住AIGC的机遇,持续进行前沿科技的研究和探索,进一步拓展相关技术的应用场景,包括实现语音聊天机器人在荔枝旗下音频产品中的落地,并结合音频产品的持续创新,丰富用户的声音社交、音频娱乐体验,“这有可能给荔枝业务带来新的增长极。”

  数据显示,荔枝2022年第四季度营收为5.88亿元人民币,并连续第五个季度实现盈利。荔枝2022年营收21.85亿元,首次实现全年盈利,年净利润8650万元,相比2021年1.27亿元的净亏损,大幅实现扭亏为盈。易观文娱行业研究总监廖旭华认为,稳步提升的盈利能力都证明了荔枝商业模式的竞争力和可持续性。从目前不到1美元的股价来看,荔枝已经明显低于正常估值,随着未来荔枝集团的自研技术平台发展、营收稳定提升,国际化、AI聊天机器人业务等全面推进,荔枝估值将有望迎来新的爆发期。

  (以上图片为荔枝授权中国网财经使用)

声明

  一、本站转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!

  二、标注《大视野新闻网》来源的文章,版权归本站所有,如需转载,请联系我们并注明来源及作者。

  三、本站拥有对此声明的最终解释权。

相关阅读

  “截至2023年年底,我国发明专利有效量为499.1万件。其中,国内(不含港澳台)发明专利有效量为401.5万件,同比增长22.4%,成为世界上首个国内有效发明专利数量突破400万件的国家。”1月16日,国家知[详细]

2024-01-19

  寒假即将来临,北京市文化和旅游局近日发布提示,文化艺术类校外培训机构不得一次性收取或变相收取超过60课时或时间跨度超过90日的培训费用,且不得超过5000元。广大学员及家长在选择参加文化[详细]

2024-01-19

  记者1月15日从湖南省消费者权益保护委员会获悉,2023年,湖南省消保委系统共受理消费者投诉70150件、解决66275件,投诉解决率为94.48%;为消费者挽回经济损失3629.3万元,其中加倍赔偿金额13.37万[详细]

2024-01-19

  “东方甄选1元购书”的“超值”余温未散,图书盲盒的低价效应趁热走俏。年节将至,北京商报记者注意到,各大书店及电商为了吸引流量纷纷开起“图书盲盒”来。什么书?精装还是平装?消费者都要在下[详细]

2024-01-19

  就在上市一周年来临之际,乐华娱乐因股价波动登上热搜。1月16日,港股乐华娱乐早盘持续走低,该股一度跌近80%,报1.15港元。然而2023年1月18日这天,乐华娱乐发布公告确定了发售价为每股4.08港元。[详细]

2024-01-19