科大讯飞股份有限公司(证券代码:002230)2月13日举办了一场题为“AI 尖峰时刻看龙头 科大讯飞电话会”的投资者关系活动,讨论了深度求索(DeepSeek)大模型的创新成果及其对公司的影响。

DeepSeek近期发布的DeepSeek V3和DeepSeek R1大模型围绕高效推理和经济训练的创新算法,以较低成本实现了大语言模型的性能突破。科大讯飞董事、副总裁江涛在会上表示,DeepSeek团队在梁文锋的领导下,依托国内顶尖高校资源和技术人才,创新成果显著,打破了西方对中国科技创新的刻板印象,增强了中国科技创新的信心。

DeepSeek R1在2025年1月20日发布,对标OpenAI的o1大模型,主要创新在于强化学习训练方案R1-Zero。这一方案在数学、代码等推理任务中取得显著效果,减少了对人工标注推理过程数据的依赖。

江涛指出,科大讯飞在2024年10月也实现了深度推理模型的多项工程优化,并适配了华为昇腾910B算力,训练效率大幅提升。今年1月发布的星火深度推理模型X1虽然规模较小,但性能对标OpenAI o1-preview,有望在数学答题等能力上超过其表现。

科大讯飞在大模型训练和推理成本上也有显著投入和优化,与DeepSeek类似,讯飞选择了更难的全国产算力路线,从2023年与华为合作攻克了一系列难题,将训练效率优化至85%以上。江涛特别强调,讯飞是目前唯一一家训练和推理均在国产算力上进行的公司。

关于DeepSeek的火爆效应,江涛认为这是一次全球范围内的人工智能普及教育,有助于提升公众对AI的认知,并加速中国人工智能产业生态建设。这也为科大讯飞这样的企业带来了市场加快成熟的新机会。DeepSeek的工程化探索和长思维链可读化输出,将对讯飞进一步提升大模型性价比提供借鉴。

江涛还提到,科大讯飞未来将坚持“1+N”的战略布局,即“1个底座大模型+N个行业大模型”,赋能教育、医疗、金融、汽车等关键领域。尽管DeepSeek引发的全球关注可能会带来美国对中国获取英伟达算力的限制,但讯飞已经构建了全栈国产化技术,未来将继续在国产算力上深耕。

在开放平台方面,科大讯飞于2月10日宣布上线包括DeepSeek-V3和DeepSeek-R1在内的全系列大模型,支持公有云API调用和专属模型一键部署。科大讯飞的战略定位是自主可控的大模型国家队,专注于民生刚需和科研生产的重点应用赛道,推动AI生态的合作与开放。

作者 金芒财讯

财经专家