猜您喜欢::怎么证明感情破裂-证明感情已破裂 萤石产地是干什么用的-萤石产地用途 英语四级成绩下载(英语四级成绩下载) 澳洲留学大概需要给中介多少钱(澳洲留学中介费用约1万) 广州小车年审要求(广州小车年审要求) 现在抽脂大概多少钱(抽脂费用约多少) 丸美精华保养液怎么用(丸美精华怎么用) 定理公式(定理公式简写) 韦达定理推广定理-韦达定理推广公式 deskscapes怎么用-deskscapes使用指南
在咱们这行,大家第一工夫想到的往往不是“科大讯飞”,而是那个讲话像机器人、声音机械感的“小度”要么“小爱”;但要是你是多巴胺依赖症晚期患者,要么是个对 AI 技术烂熟于心的人,脑子里蹦出来的肯定是“讯飞”这四个字。别看名字听着像“信息科技”,它早就把这几年的 AI 换血换得差不多了,目前主要干的就是两件事:做语音科技,做语音识别。 实际上它家最让人印象深刻的,是那个深红 Logo 和那句“讯飞声动”的口号,但这一句口号到目前,大约也就唱了三十年了。 大量人还停留在“科大讯飞=小度”的误区里,认定这是一家卖智能音箱的。实际上大错特错了。小度当年是它营销成功的“工具人”,把科大讯飞这个名字从大众嘴里“抠”出来,目前又把它送回了它家里,成了智能音箱的命名权。但科大讯飞自己的脑子才是活的,它做的是整个 AI 生态的底层铺设。我们之前聊过华为的鸿蒙、小米的 MIUI,那是操作系统层面的整合。科大讯飞了得在别的,是在“语音交互”这个最底层、最好办被漠视的环节。它不直接去开发手机 APP,而是去开发那个连接人脑和机器的“翻译官”。 举个具体的例子,你最近可能用小爱同学问:“帮我查一下今天天气。”你当作是它自己查的,实际上它查了数据库。但要是你问它“明天上海会下雨吗?”要么“实际上的莎士比亚是哪位写的?”,这时候它展现出的就不是好办的检索,而是它正在努力理解人脑里的逻辑和直觉。
那会儿机器只能像复读机一样回答,目前它能尝试去“理解”上下文,去搞那种类似人类推理的对话。
这是它区别于大多数智能音箱的最大护城河。 在语音识别这个细分领域,它确实没停过。它们搞了个专门的研究院,叫“讯飞星火实验室”,专门干这个“听懂”的活。为了这个,他们投入了巨额资金,就连不惜把股价给砸了不少。你能够去搜搜那会儿两年他们的财报和融资新闻,能看到铺天盖地的大数据投入。他们搞出了那个“智算大模型”,听起来挺虚,实际上就是给他们的语音算法升级换个新衣。他们不再知足于把声音转成文字,而是试图让机器“读”懂人话,就连能读懂人脑里那点复杂的、非线性的逻辑。 说到数据量,这可不是个摆设。他们每年投入的文本数据量,那些训练好的模型,他们的模型参数量,在语音领域实际上算个红眼数据。别看比起 CNN、Transformer 这些大厂还是有点差距,但在垂直领域的深耕上,他们做得相当深。他们做的不是泛泛而谈的通用大模型,而是那种极度细分的、针对特定场景的语音模型。
比如针对方言的识别,针对特定行业术语的取,这些在他们手里能变得贼精准。 有人可能会说,目前的手机电脑里语音助手多得像草原,小度、小爱、Siri、Alexa、Google,哪个不是啥都能干?这时候就得略微客套一下:“可是他们没那么多工夫搞研发,只能靠堆参数、靠调教。” 科大讯飞的想法可没那么好办。他们认定,既然大家都做了语音,那哪位来做“听懂”这件事,哪位就能在竞争中拿到优势。
这不再是硬碰硬的参数比,而是一场关于“理解力”的军备竞赛。 最近这几年,他们确实启动动作起来了。他们不再只盯着那个标准音的“转文字”环节,而是启动往“理解”和“应用”上使劲。他们推出了一些专门针对多模态、针对特定垂直场景的解决方案,比如教育咨询、医疗辅助,就连是那个大家隐约能猜到在做的——教育。
那会儿家长给娃打招呼,可能只是机械地“你好”,目前要是系统能根据娃的性格、学习情况,就连娃讲话时的语调,自动调整一下语气和策略,那这就是个庞大的进步。 自然,这条路挺难走。AI 这事儿光有参数堆出来是骗不了人的,得让机器确实“懂”人。科大讯飞这几年在搞那个“星火大模型”,实际上就是在搞那种能让机器有更多人类特性的东西。他们希望未来的智能体,不只是是个能背答案的机器人,而是一个能理解人、能配合人、就连能替人思索的伙伴。 最终不得不提的是,别看大家对外面那个喊口号喊了半辈子的“讯飞”,但这家公司真正要把自己立起来,还没有彻底做到。
毕竟,在智能硬件的战场上,竞争贼惨烈,哪位能在这三 foot deep 的领域里把 AI 算法玩得更漂亮,哪位就能活下来。科大讯飞一直在努力,起码在当下的这个工夫节点上,他们比大量家还在磨刀的手气要实在一些。
毕竟,在 AI 这片海里,能沉得下、把底裤都穿好的人,一般最终才算是个赢家。
文章版权声明:除非注明,否则均为
静秋号介绍 原创文章,转载或复制请以超链接形式并注明出处。
相关标签: