多任务语音识别,翻译,语言ID
Whisper是一种通用的语音识别模型。它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
Deepgram ASR是一款人工智能工具,旨在快速准确地将语音数据转录成文本,迎合各种规模的企业。
非营利研究小组专注于DL和AI,提供有用的课程。
从领先的初创公司和亚马逊获得一系列基础模型
SuperAPI-有史以来最快的API生成器
用于TypeScript/JS的快速、网络连接、可区分的张量库。
Ask Command是一个由AI驱动的开发人员助手,可帮助用户找到适合其特定需求的命令。