DeepSeek-R1的“天赋异禀”
为各行各业注入了全新变量
中国电信政企信息服务事业群
迅速组建DeepSeek攻坚队
深度融合行业数据
凭借“强化学习”与“知识蒸馏”
两大核心技术
成功完成了41个行业大模型的升级
为产业智能化进程按下加速键
强化学习,小模型撬动大效能
此次升级以“轻量化部署、场景精准适配、推理效率提升”为目标,通过技术创新推动大模型从通用能力向行业纵深拓展,为千行百业提供低成本、高效率的智能化解决方案。以下将通过行业大模型的13个典型代表,展示本次攻坚成果。
此次升级将强化学习(RL)与行业知识深度融合,在保证专业性的同时大幅降低算力门槛。通过强化学习训练,在教育、卫健、能源、政法公安、交通等多个领域取得了显著成果。
教育行业
通过纯强化学习训练,让1.5B小模型在数学解题准确率上超越传统7B模型,响应速度提升40%。这种“小模型、大智慧”的技术路径,使得基层教育机构也能享受AI红利。
卫健行业
其打造的1.5B轻量化导诊模型,以85.1的综合得分反超大参数模型基线,仅需500条脱敏数据即完成训练,为基层医疗机构提供了高效的智能导诊解决方案。
能源行业
在能源行业问答领域,通过对9700条蒸馏数据集的训练,7B模型的准确率提升12.2%。升级后的模型能够快速解答复杂的能源行业问题,显著提升了能源行业的智能化应用水平。
政法公安行业
通过强化学习,Qwen-7B模型在法律领域的准确率提升9%,显著增强了模型在法律知识理解和复杂案件推理中的表现。
交通行业
在交通政策法规问答场景中,强化学习显著提升了模型的效果,证明了思维链和奖励强化对模型进行微调是提升交通行业大模型行之有效的方法。
知识蒸馏,数据炼金术赋能行业智能
面对行业高质量数据稀缺难题,此次升级采用“大模型反哺小模型”的数据生态,通过知识蒸馏技术,显著提升了各行业大模型的性能,其中在政务、车企、工业、文宣、农业、住建、要客、应急等领域的效果尤为突出。
政务行业
通过DeepSeek-V3生成高质量思维链数据,仅用200条标注数据即让14B模型意图识别准确率增加15%,为政务热线领域的多轮对话意图识别提供了高效解决方案。
车企行业
其借助DeepSeek-V3补全的行业推理数据,使14B小模型在智能座舱分类任务中以92.7的综合得分超越未微调的千亿级大模型,精准识别智能座舱用户提出的导航、娱乐等问题分类。
工业行业
通过SFT训练,模型在工业领域的专业性显著提升,输出的内容更加贴近实际应用场景的需求,逻辑严密且重点突出。
文宣行业
通过行业数据蒸馏后的模型,在文旅问答和路径规划任务中表现优异,问答评分达到87.1的综合得分,路径规划评分接近DeepSeek-V3-671B和GLM-4-PLUS的水平。
农业行业
通过对4408条农业数据的训练,14B模型的综合得分从83.7提升至87.2,升级后的模型能够快速解答复杂的农业问题,为农业领域的智能化转型提供了有力支撑。
住建行业
通过使用高质量行业数据,在工地施工规范告警中达到高质量实时预警,微调后的模型在深度推理上效果提升明显,能够运用在住建领域的工地施工规范告警中,达到高质量实时预警目的。
要客行业
在国防动员、资源分配方案生成与选择任务中,使用蒸馏数据进行SFT微调显著提升了模型的思考、推理与回答能力,SFT后的模型在方案生成任务中表现优异。
应急行业
通过DeepSeek-R1蒸馏得到的推理数据,显著提升了模型在应急行业数据中的准确率,SFT后的模型准确率提高13%,在14B的模型上效果远超未微调的DeepSeek-V3模型。
基于中国电信
“数据安全可控、模型快速迭代、
服务灵活扩展”的一体化能力
政企信息服务事业群将继续深耕行业场景
加速行业大模型规模化落地
全面赋能“新质生产力”高质量发展