,阿里云今日证实,李飞飞团队开发的人工智能推理模型s1是基于阿里通义千问模型进行训练的。
该s1模型在数学和编码能力测试中表现出与OpenAI o1和DeepSeek R1等尖端推理模型相似的效果。
据回应称,在16块H100 GPU上监督微调26分钟后,s1-32B取得了与o1和R1相当甚至更高27%竞赛数学问题表现的成果。
这一技术旨在通过训练一个人工智能模型来提取其“推理”能力,并采用了监督微调方法,比起DeepSeek使用大规模强化学习方法更具成本效益。s1利用了阿里巴巴旗下中国人工智能实验室Qwen提供的免费小型人工智能模型以及谷歌Gemini 2.0 Flash Thinking Experimental给出的答案背后思考过程。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
上一篇:群智咨询:2月份Monitor面板主流规格价格将微幅上涨...
下一篇:返回列表
农历蛇年的首个工作日,副区长朱众伟带队赴区土地储备中心调研工作,按照区委八次...
2025-02-07 13:38:02
2025年春节期间,我国线上电商市场异常火爆。据商务部数据显示,全国重点零售...
2025-02-07 13:28:21
2025年春节假期期间,全国邮政快递行业业务量实现显著增长,揽收和投递快递包...
2025-02-07 11:16:50
春节期间,租车自驾出游成为新风尚,文旅融合模式让租车市场供需两旺。交通运输部...
2025-02-07 10:33:59
2025年度居民医保缴费即将结束 须在2月25日前完成,断缴将面临至少3个...
2025-02-07 10:21:42
2025年春节假期期间,消费电子市场热度高涨,彰显出行业复苏的强劲势头。2月...
2025-02-07 09:30:50
近日,华润医药商业集团有限公司及其下属华润空港(北京)国际贸易有限公司、华润...
2025-02-07 07:43:43
重庆市沙坪坝区6日举行2025年一季度重点项目集中开竣工、投达产暨数字科技园...
2025-02-07 06:26:54
近日,由每日经济新闻主办的“2024年度中国金融发展年会暨第15届金鼎奖颁奖...
2025-02-07 05:47:09
12月14日,由内蒙古自治区人民政府驻上海办事处主办的全方位建设模范自治区暨...
2025-02-07 04:54:20