人工智能 【论文笔记】ContextNet: Improving Convolutional Neural Networks for ASR with Global Context 题目 ContextNet: Improving Convolutional Neural Networks for Automatic SpeechRecognition with Global C... 03月09日5人工智能 阅读全文
人工智能 百度语音合成模型Deep Voice3 INTRODUCTION Deep Voice3是由百度提出的一个全新的全卷积TTS架构。百度的主要工作分为如下五个方面: 提出了一个全卷积的 character-to-spectrogram 架构,... 03月09日7人工智能 阅读全文
人工智能 智能音箱的五大核心技术 在很多人眼里依旧是新潮玩意的智能音箱,往往具备智能家居声控中心和个人助理两大核心功能。通过智能音箱可以实现对家居中的智能电器进行联网和语音控制,同样也可完成日常安排、订餐厅、叫车、阅读、翻译、通话等类... 03月09日6人工智能 阅读全文
人工智能 Unity 讯飞实时语音转写(三)—— 分析转写结果 目录 Unity 讯飞实时语音转写(一)—— 使用WebSocket连接讯飞语音服务器 Unity 讯飞实时语音转写(二)—— 接收转写结果 Unity 讯飞实时语音转写(三)—— 分析转写结果 (应... 03月09日6人工智能 阅读全文
人工智能 长按发送语音_语音转文字的方法分享!快速帮你将语音转成文字 现在有很多人在聊天的时候都喜欢使用语音消息,但是殊不知,很多情况下我们没办法发送语音或者接听语音,这就需要将收到的语音消息转成文字,但是这样的方法很少有人知道,这个时候应该怎么办呢?估计很多人都是和我... 03月09日5人工智能 阅读全文
人工智能 Azure Kinect DK 产品调研 1. 什么是Azure Kinect DK Azure Kinect DK是微软公司旗下的一款专门为开发人员和企业用户量身的工具包,配有先进的 AI 传感器,提供复杂的计算机视觉和语音模型。 Kine... 03月09日5人工智能 阅读全文
人工智能 TTS语音合成综述 Speaker adaptation If you have very limited data, then you can consider to try fine-turn pre-trained... 03月09日7人工智能 阅读全文
人工智能 对TIMIT数据进行格式转换(windows解决报错wave.Error: file does not start with RIFF id) 对TIMIT数据进行格式转换(windows解决报错wave.Error: file does not start with RIFF id) 在语音识别中,常用的语音开源数据库TIMIT在pytho... 03月09日5人工智能 阅读全文
人工智能 iOS 推送语音播报(类似支付宝微信的收款提醒) 项目需求: 近期项目有个需求,实现类似支付宝微信收款后的语音播报如:支付宝到账xx元。要求是APP在前台运行、锁屏、杀死进程后都会有语音播报。 预想方案: 1.通过UIBackgroundTaskId... 03月09日8人工智能 阅读全文
人工智能 多模态情感识别_Interspeech 2019 | 基于多模态对齐的语音情感识别 本文来自公众号滴滴科技合作,AI科技评论获授权转载,如需转载请联系原公众号。 Interspeech 2019 Interspeech 2019现场 作者 | 滴滴AI Labs编辑 | 唐里 语音领... 03月09日6人工智能 阅读全文