智能音箱最核心的东西是什么
其实这个答案很明显了,从它的名字上就能看出来,智能音箱最重要的肯定是智能。
也有的人说是音箱二字,其实能被成为音箱的,音质都很重要。
就像如果去参加全国厨艺大赛,人们的聚焦的点肯定是做出来的美食好不好吃,而不用考虑做出来的东西到底能不能吃一样。
如果不能吃的美食那还叫美食吗智能音箱也一样,如果都不能成为音箱,再高的智能又有什么用。
智能音箱最终是靠声音体现它自身的价值,如果唱个歌曲还带着刺刺拉拉的电流声,高音上不去,低音下不来,除了能制造噪音,别无用途。
之前林奇见过某互联公司在制造智能音箱之前做的一个问卷调查,里面有一个问题是这样的:
对于一款智能音箱,您最看重的项目依次点击排序。然后下面给出来了几个选项,内容丰富支持控制的智能家居设备多音质好品牌有名外观好看价格便宜反应速度快功能多。
林奇反复了确认了一遍,没有智能这个选项,林奇想破了脑袋也想不明白,为什么智能音箱的问卷调查没有智能。
难道是他们认为这个是智能音箱的标配,就像音质那样吗那去掉的也应该是音质而不是智能好吧,每个公司的造出来的智能音箱里面的智能可是天差地别。
所以林奇决定先编写智能音箱的最核心的东西智能模块。
与所有的智能音箱一样,林奇决定把智能模块放到服务端。
如果智能音箱不联,它可以使用一些简单的功能,比如可以定时,可以定闹钟什么的。
但是如果涉及到交互就不行了,比如你问他一个简单的问题后天的天气是什么,“他”拟人化,有的时候“它”、“他”会混着用就回答不上来。
智能音箱可以分为智能和使用方面还有硬件三部分。
智能是所有的智能音箱赖以生存的土壤,硬件是他的载体,使用方面则是一些使用方面的定义等比如唤醒词,比如周围的环境音干扰。
林奇在写智能软件后端的时候就要考虑到一些使用方面的问题,比如第二智慧科技的智能音箱是否需要唤醒词。
现在所有的智能音箱都有一个唤醒词,不论是4字5字还是6字的。
为什么会有“唤醒词”这个奇怪的东西,唤醒词是怎么来的。
经过查询资料,林奇了解到了唤醒词的故事。
和智能音箱在对话的时候,就像你和一屋子的同事在说话,有问有答。
你对同事喊道“小明。”
小明听到了就会抬头看着你,表示在听。
你接着问,“今天我们叫什么外卖”
小明打开手机翻看了一圈,“要不我们吃黄闷鸡米饭。”
“我昨天刚吃过。”
小明
人们和智能音箱的对话也类似,可以分为五个步骤唤醒、相应、输入、理解、反馈。
第一个环节就是唤醒,智能音箱是实时的在那里待命,就像一个警戒的“猫鼬”。
“小黑。”你叫了他的名字,他就会把耳朵竖起来听你讲话,否则你说其他什么任何话语他都处于神游的状态,这是在假设现在的智能音箱都遵守,不会实时监听我们说话。
因为这个是第一个环节,所以唤醒环节的体验在整个语音交互的流程中起着至关重要的作用,它的体验好坏将直接影响用户对产品的“第一印象”。
林奇对此深有感触,他买了很多的智能音箱,有的音箱他喊了好几次才有回应,而其他的响应比率就比较高。
在长期测试下来,林奇更倾向于使用唤醒率高的那些智能音箱,而唤醒率低的慢慢就被林奇遗忘了。
其实上面的举得那个例子也不是特别恰当,如果办公室里面就你和小明两个人,你就不需要先叫小明的名字