AI资讯
2025 最新 AI 创作趋势:腾讯混元大模型一站式服务降低内容制作门槛
2025-06-25
135次阅读
腾讯混元 3D 2.1 大模型在 CVPR 2025 上全链路开源,模型权重、训练代码、数据处理流程和部署教程全部开放。这意味着开发者不仅能调用模型,还能了解训练过程,根据需求二次训练或微调。比如游戏开发者可以基于开源的模型权重,快速生成符合游戏风格的 3D 角色和场景,无需从零开始训练。
更让人惊喜的是,混元 3D 2.1 适配消费级显卡,在个人电脑上就能轻松运行。这大大降低了 3D 内容创作门槛,无论是专业开发者还是普通爱好者,都能在本地无限次生成高品质 3D 作品。比如学生可以用它制作毕业设计中的 3D 模型,自由职业者可以用它为客户生成定制化的 3D 设计方案。
混元 3D 2.1 在 3D 生成的纹理质感和光影表现方面大幅提升,引入 PBR 技术,让 AI 3D 建模彻底告别 “塑料感”。生成的 3D 模型结构清晰、边缘干净,支持标准格式,可直接拖进 Unreal、Unity、Blender 等主流 3D 工具使用,无需额外转格式。这对于游戏、动画等需要逼真建模的领域来说,实用性大大提高。
腾讯同步上线的混元 AI 3D 创作引擎,是业界首个一站式、低门槛 3D 内容 AI 创作平台。用户只需输入一句话、提示词或图片,就能直接生成 3D 模型。该引擎还具备 3D 功能矩阵、3D 编辑、3D 生成工作流、创作素材库等多种功能,支持游戏开发、设计建模等专业领域的 3D 生产管线,也可供普通爱好者生成 UGC 3D 内容。
比如游戏公司可以通过该引擎快速生成游戏中的 3D 资产,将制作时间成本从 5-10 天级别下降到分钟级。普通用户也能轻松上手,生成自己想要的 3D 模型,用于虚拟社交、电商展示等场景。
混元 3D 生成大模型 2.0 版本通过几何与纹理解耦生成,在几何结构上更加精细,纹理色彩更加丰富。这种专注性使得每个模型能在其领域内进行更深入的学习和优化,整体生成能力达到更高上限。目前,混元生成 3D 质量已能满足部分游戏 3D 资产标准,包括几何布线合理性、贴图准确性与骨骼蒙皮合理性等。
腾讯混元大模型不仅在 3D 生成领域表现出色,在文本、图像、视频等多模态创作方面也有显著进展。混元文生图大模型是业内首个中文原生 DiT 架构模型,采用了 Sora、Stable Diffusion 3 等行业顶尖产品的同款架构,生成效果相比上代提升超 20%。目前,该模型已经全面开源,在 GitHub 获得 2000+star,相关能力也全面融入腾讯元宝。
混元大模型还支持视频生成,目前已经支持 16s 视频生成,单图仅需 30 秒即可生成 3D 模型。比如自媒体创作者可以用它快速生成短视频内容,企业可以用它制作产品宣传视频。
在文本生成方面,腾讯元宝提供了 AI 搜索、AI 总结、AI 写作等核心能力,支持多轮问答、结构化输出等功能。用户可以上传最多 10 个 PDF、word、txt 等多种格式的文档,并能够一次性解析多个微信公众号链接、网址,支持 256K 的原生窗口上下文。
腾讯混元大模型已在内部超过 700 个业务场景中落地应用,包括腾讯游戏、社交、腾讯地图、腾讯云、机器人等多个业务场景。在腾讯游戏业务中,通过混元 3D 创作平台的助力,3D 资产制作时间成本大幅下降,生成的 3D 模型质量也能满足部分游戏标准。
在智能客服领域,腾讯客服基于混元大模型支持客服多轮对话,在腾讯游戏、金融科技、腾讯视频、医疗健康、支付等多场景率先落地,业务喊人功率显著降低;同时作为客服助手,为人工客服提供推荐话术、历史工单摘要等支持,AI 话术采纳率达 90%。
此外,腾讯混元大模型还在广告、会议、文档等场景中发挥作用。例如,腾讯广告基于混元大模型在内容商业价值理解中,用于挖掘用户潜在商业兴趣,在广告常识推荐中用于提供推荐感,在内容关联率和 A/B 测试广告 GMV 均取得显著提升。
腾讯混元大模型一直坚持开源策略,不仅 3D 模型开源,文生图模型等也已开源。开源不仅促进了技术发展和生态繁荣,也为开发者提供了更多的学习和创新机会。比如开发者可以基于开源的模型和代码,进行二次开发,满足自己的特定需求。
在成本方面,腾讯混元 T1 模型的推理成本仅为行业标杆 DeepSeek-R1 的四分之一,吐字速度达 80 tokens/s,逻辑推理能力测试评分全面领先。这种低成本策略使得更多企业和个人能够使用到先进的 AI 技术,降低了 AI 应用的门槛。
腾讯云还提供免费 100 万 token 试用额度,并开放模型精调工具,企业可基于混元大模型快速定制垂直领域模型。这为企业提供了更多的灵活性和可扩展性,能够更好地满足不同行业的需求。
腾讯混元大模型负责人郭春超表示,混元的目标并非一次性 “接管” 整个 CG 管线,而是希望通过生成式 AI 技术逐步渗透、替代关键环节,哪怕最初只解决 30%-40% 的任务,也能带来可观的提效。未来,混元还将持续推进图像、3D、视频等方向的模型开源,构建服务于智能体的三维世界模型。
随着技术的不断完善和市场需求的不断增长,混元大模型有望在更多行业和场景中发挥重要作用。例如,在医疗领域,混元大模型可以帮助医生更好地理解患者描述,提高诊断和治疗的准确性和效率;在教育领域,混元大模型可以辅助教学,生成教学内容和练习题。
总的来说,腾讯混元大模型通过一站式服务、多模态生成、企业级应用、开发者支持等方面的努力,正在推动 AI 创作进入一个新的时代,降低内容制作门槛,提升创作效率,为用户带来更多的价值和可能性。
该文章由dudu123.com嘟嘟 ai 导航整理,嘟嘟 AI 导航汇集全网优质网址资源和最新优质 AI 工具。
用户评论 (0)
暂无评论,快来发表第一条评论吧!