Dream 7B 是一款突破性的 70 亿参数扩散语言模型,它在提供卓越的规划能力和灵活的推理能力的同时,匹配或超过了顶级的自回归模型。
https://hkunlp.github.io/blog/2025/dream?ref=aipure&utm_source=aipure
Dream 7B

产品信息

更新于:2025年05月16日

Dream 7B 月度流量趋势

Dream 7B 上个月收到了 13.7k 次访问,显示出 1843% 的显著增长。根据我们的分析,这一趋势与人工智能工具领域的典型市场动态相符。
查看历史流量

什么是 Dream 7B

Dream 7B 由香港大学和华为诺亚方舟实验室联合开发,代表了迄今为止最强大的开放扩散大型语言模型。它于 2025 年发布,在来自包括 Dolma v1.7、OpenCoder 和 DCLM-Baseline 在内的各种数据集的 5800 亿个 tokens 上进行训练。该模型有两个版本:一个基础模型 (Dream-v0-Base-7B) 和一个监督微调指令模型 (Dream-v0-Instruct-7B),两者都向研究社区开放。

Dream 7B 的主要功能

Dream 7B是由香港大学NLP和华为诺亚方舟实验室开发的突破性开源扩散大型语言模型,拥有70亿参数。它通过使用离散扩散建模,实现了并行令牌生成和双向上下文理解,代表了与传统自回归模型的重大偏离。该模型在一般任务、数学和编码方面表现出与领先的自回归模型相当的竞争性能,同时在规划能力和灵活的推理能力方面提供了独特的优势。
双向上下文建模: 能够在文本生成过程中更丰富地整合来自两个方向的信息,从而增强生成内容的全局连贯性
灵活的生成控制: 通过其迭代细化过程,支持各种生成模式,包括补全、填充和任意顺序生成
质量-速度权衡: 提供可调整的推理步骤,允许用户根据自己的需求在生成速度和输出质量之间取得平衡
上下文自适应的令牌级噪声重新调度: 根据上下文信息动态调整单个令牌的噪声水平,从而提高生成准确性

Dream 7B 的使用场景

复杂问题解决: 对于需要多个约束或特定目标的任务特别有效,例如数独求解和数学推理
代码生成: 能够生成和完成代码片段,其强大性能可与专门的编码模型相媲美
文本补全和编辑: 灵活的文本生成能力使其适用于各种内容创建和编辑任务,能够填补空白或完成部分内容

优点

与类似大小的自回归模型相比,具有卓越的规划能力
具有可控生成顺序的灵活推理选项
在一般、数学和编码任务中具有竞争优势

缺点

训练期间需要仔细调整学习率
训练期间的计算强度(需要96个NVIDIA H800 GPU)
仍然需要在后训练技术中进行更多探索

如何使用 Dream 7B

安装所需的依赖项: 从 Hugging Face 安装 PyTorch 和 Transformers 库
导入必要的库: 导入 torch 和 transformers 库:\nimport torch\nfrom transformers import AutoModel, AutoTokenizer
加载模型: 加载基础模型 'Dream-org/Dream-v0-Base-7B' 或指令调整模型 'Dream-org/Dream-v0-Instruct-7B':\nmodel_path = 'Dream-org/Dream-v0-Instruct-7B'\nmodel = AutoModel.from_pretrained(model_path, torch_dtype=torch.bfloat16, trust_remote_code=True)\ntokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
将模型移动到 GPU 并设置为 eval 模式: model = model.to('cuda').eval()
准备输入: 将您的输入格式化为消息列表:\nmessages = [{'role': 'user', 'content': '您的提示在这里'}]
标记化输入: inputs = tokenizer.apply_chat_template(messages, return_tensors='pt', return_dict=True, add_generation_prompt=True)
生成输出: 该模型支持灵活的生成模式,包括完成、填充和受控生成顺序。您可以调整扩散步骤以在质量和速度之间进行权衡。
可选:调整推理参数: 您可以通过调整参数(如扩散步骤数)来自定义生成 - 较少的步骤可获得更快但更粗略的结果,更多的步骤可获得更高质量的输出

Dream 7B 常见问题

Dream 7B是迄今为止最强大的开放扩散大型语言模型,由香港大学和华为诺亚方舟实验室联合开发。它是一个7B参数模型,在通用、数学和编码能力方面与同等规模的顶级自回归语言模型相匹配或超过它们。

Dream 7B 网站分析

Dream 7B 流量和排名
13.7K
每月访问量
#1756047
全球排名
-
类别排名
流量趋势:Feb 2025-Apr 2025
Dream 7B 用户洞察
00:01:31
平均访问时长
1.33
每次访问页数
58.53%
用户跳出率
Dream 7B 的热门地区
  1. US: 83.06%

  2. IN: 7.96%

  3. TR: 2.34%

  4. CA: 2.22%

  5. VN: 1.59%

  6. Others: 2.83%

与 Dream 7B 类似的最新 AI 工具

Athena AI
Athena AI
Athena AI 是一个多功能的 AI 驱动平台,通过文档分析、测验生成、闪卡和互动聊天功能提供个性化学习辅助、商业解决方案和生活指导。
Aguru AI
Aguru AI
Aguru AI 是一个本地软件解决方案,为基于 LLM 的应用程序提供全面的监控、安全和优化工具,包括行为跟踪、异常检测和性能优化等功能。
GOAT AI
GOAT AI
GOAT AI 是一个 AI 驱动的平台,提供一键摘要功能,适用于新闻文章、研究论文和视频等各种内容类型,同时提供针对特定领域任务的高级 AI 代理编排。
GiGOS
GiGOS
GiGOS是一个AI平台,提供访问多个高级语言模型(如Gemini、GPT-4、Claude和Grok)的权限,并通过直观的界面让用户与不同的AI模型互动和比较。