一个令硅谷感到不舒服的调查结果出炉了。伦敦咨询公司Public First对全球15个国家超过18000人进行了民意调查,结果显示:在受访的15个国家...
2026-06-22 1
核心价值:10B 参数击败 20B/80B 闭源模型,Apache-2.0 协议免费商用,中英文字渲染准确率行业第一梯队
端午黑马 Boogu-Image-0.1:统一架构一次开源 Base/Turbo/Edit 三大变体,用少一个数量级的训练数据,在 Qwen-Image-Bench 上以 53.58 分登顶开源模型榜首,比 80B 的 Hunyuan-Image-3.0 还高 2.77 分。
Boogu-Image-0.1 是 2026 年 6 月 16 日突然杀出的开源图像生成与编辑"黑马"项目。在没有铺天盖地的营销、没有大厂背书的情况下,仅凭 Hugging Face 上的几行 commit log,就在端午节引发了整个开源 AI 绘画圈的热议。
它的全量发布采用了 Apache-2.0 协议,一次性开源了 Base / Turbo / Edit 三个核心变体,统一在 100 亿参数的架构之上,联合训练(Joint Training)而成。这个项目最让人意外的核心定位是:"在训练数据量比现有开源模型少一个数量级的情况下,依然打到了第一梯队"——这话不是营销话术,而是 Qwen-Image-Bench 跑分榜上实实在在的结果。
Boogu 团队的核心思路很朴素:闭源系统(比如 GPT-Image-2、Nano Banana Pro)之所以强,不是因为某一个模型有多神奇,而是整个系统高度统一。他们在训练算力极其有限的情况下,用更小的数据量、更好的数据质量、更系统的训练方法,做出了一个有竞争力的开源方案。
核心定位:Apache-2.0 协议一次开源全家桶(Base/Turbo/Edit),10B 参数击败 20B Qwen-Image 和 80B Hunyuan-Image
Boogu 的"根模型",也是 Turbo 的蒸馏基础。它特别擅长超密集文字渲染——海报、文档、UI 界面里塞上上百个中文字符,它也能稳稳 hold 住。在统一架构下,Base 模型在多样性、可控性、长文本理解上做到了行业第一梯队水平。
Boogu 最引人注目的变体。通过 Decoupled DMD 蒸馏技术,将原本需要 25~50 步的 Base 压缩到 4 步。参数量不变,速度翻了十倍以上。在高配硬件上,单次推理可以控制在 1 秒以内,对追求效率的用户来说,几乎就是"即说即出"的体验。
Edit 支持自然语言指令驱动的图像编辑,从局部调整到创意改写都能胜任。它目前聚焦于摄影类编辑场景,在多参考图、大幅度视角变化等复杂场景下还在持续打磨。配合 ComfyUI 官方发布的 Flux Context Image 节点,可以显著降低编辑偏移问题。
显存 | 推荐配置 |
12GB | fp8 量化版 + 模型 CPU offload |
16GB | fp8 量化版 + 模型 CPU offload |
24GB | fp8 量化版 / 原始 Base 权重 |
32GB+ | 完整原始 Base 权重 |
# 1. 创建 conda 环境conda create -y -n boogu python=3.10conda activate boogu# 2. 克隆仓库并安装依赖git clone https://github.com/boogu-project/Boogu-Image.gitcd Boogu-Imagepip install -r requirements/torch2.7-cu126.txtpip install -e .# 3. 自动安装 Flash Attention(自动检测环境,下载预编译 wheel)python utils/get_flash_attn.py或者一键启动:
bash quick_start.shconda activate boogupip install -U "huggingface_hub[cli]"huggingface-cli download Boogu/Boogu-Image-0.1-Base --local-dir models/Boogu-Image-0.1-Basehuggingface-cli download Boogu/Boogu-Image-0.1-Turbo --local-dir models/Boogu-Image-0.1-Turbohuggingface-cli download Boogu/Boogu-Image-0.1-Edit --local-dir models/Boogu-Image-0.1-Edit每个模型同时提供 fp8 量化版本,可将显存占用降低约 40%。
export device="cuda:0"python inference.py \ --pretrained_pipeline_name_or_path "models/Boogu-Image-0.1-Base" \ --instruction "一幅国风琉金风格的山水画作,展现了桂林山水在金光普照下的壮丽景象。远山层叠,江水如镜,山峰边缘勾勒着发光的金色线条。画面采用石青石绿岩彩与鎏金质感相结合,局部有厚涂油画笔触,空中飘浮着金色粒子,营造出梦幻朦胧而又磅礴大气的意境。" \ --num_inference_steps 50 \ --height 1024 --width 1024 \ --text_guidance_scale 4.0 \ --output_image_path "outputs/test_base/out_1.png" \ --device "$device"注意:CFG 推荐值:Base 用 4.0,Turbo 用 1.0,Edit 用 5.0。如果遇到全黑输出,先禁用 --enable_torch_compile
ComfyUI 官方在 6 月 17 日就快速支持了 Boogu-Image,下载后放置到 ComfyUI 的 models 目录即可使用。社区还提供了 GGUF 量化版本(realrebelai/Boogu-Image-Turbo_GGUFs),Q4 量化的 Turbo 模型在 12GB 显存上就能跑得动。
在 Qwen-Image-Bench 公开评测中,Boogu-Image-0.1 以 10B 参数 的体量,击败了 20B 的 Qwen-Image-2512(52.06 分)和 80B 的 Hunyuan-Image-3.0(50.81 分),位列开源模型第一名。
核心数据:10B vs 20B/80B,53.58 vs 52.06/50.81——参数不到对手零头,分数却高过两位数
更值得关注的是它的"全家桶"优势:Qwen-Image 和 Hunyuan-Image 只有 T2I 主模型,Boogu 却一次开源了 T2I / 4步快速生成 / 图像编辑三条产品线。这对需要在 ComfyUI 中构建工作流的设计师和内容创作者来说,相当于少集成三套不同架构的依赖。
Boogu-Base 在摄影提示的理解上达到了行业第一梯队水平。无论是光线氛围、镜头参数还是人物表情细节,都能精准还原。
适用人群:电商产品摄影、广告创意、社交媒体内容 生成参数:Base 模型,50 步推理,CFG 4.0
海报、印章、文档、UI 界面、品牌指南、手写板——这些场景需要模型对密集中文字符有近乎 OCR 级别的稳定性。Boogu 在这方面的实测表现明显优于同类开源模型。
核心亮点:早摊招牌、公告栏、段落手写体场景准确率明显高于 FLUX/Qwen-Image
适用人群:中文品牌设计师、自媒体运营、电商海报设计
微缩 3D 场景、国风鎏金美学、奇幻视觉、动漫肖像、神话题材——Boogu 的风格多样性是其另一大亮点。
适用人群:概念设计师、插画师、游戏美术
Edit 变体支持自然语言指令驱动图像编辑,覆盖物体插入/替换/删除、属性/材质修改、背景/场景替换、艺术风格迁移等场景。
输入示例:"将衣服修改成红色,戴上白色帽子" 输出效果:服装颜色准确迁移,帽子自然融入构图
从油画到水墨,从赛博朋克到复古胶片,Boogu 支持对任意图像进行艺术风格迁移。
个性化海报布局与产品可视化是 Boogu 团队的研发重点之一。配合其强大的中文文字渲染能力,可以直接生成可用于商业场景的成品海报。
针对图像内的中英文字符,Boogu 支持精细的局部文字替换与修改,而无需重新生成整张图。
项目 | 说明 |
开源协议 | Apache-2.0(可商用、可微调、可分发) |
模型权重 | HuggingFace + ModelScope 双平台 |
显存起步 | 12GB(fp8 量化版) |
推荐配置 | 24GB+(原始 Base 权重) |
在线 Demo | demo-base.boogu.org / demo-edit.boogu.org / demo-turbo.boogu.org |
商业 API | ⚠️ 无任何官方付费 API/订阅服务——任何名为 "Boogu" 的付费产品都与官方无关 |
用户福利:Apache-2.0 协议意味着你可以免费下载、商用部署、私有微调——这是真正意义上"开源免费"
Boogu-Image-0.1 给开源图像生成领域注入了一剂强心针。它不完美——10B 参数的模型不可能打败 80B 的闭源巨无霸。但它证明了一件事:在合理的数据策略和训练方法下,小参数模型同样可以打出竞争力。
对于中文创作者来说,Boogu 的双语文本渲染能力尤其实用;对于ComfyUI 玩家来说,官方节点支持来得又快又稳,上手几乎没有门槛;对于算力有限的独立开发者来说,fp8 量化版 + GGUF 社区支持让 12GB 显存也能流畅运行 100 亿参数的模型。
推荐指数:⭐⭐⭐⭐⭐(满分 5 星,2026 年度最佳开源图像模型候选)
适合人群:中文内容创作者、独立开发者、ComfyUI 工作流设计师、AI 绘画玩家
立即体验: - 在线 Demo:http://demo-base.boogu.org/ / demo-edit.boogu.org/ / demo-turbo.boogu.org/ - GitHub 仓库:https://github.com/boogu-project/Boogu-Image - HuggingFace 模型:https://huggingface.co/Boogu
数据截至 2026-06-22,最新信息请以官方仓库为准。
相关文章
一个令硅谷感到不舒服的调查结果出炉了。伦敦咨询公司Public First对全球15个国家超过18000人进行了民意调查,结果显示:在受访的15个国家...
2026-06-22 1
无需打开直接搜索微信:本司针对手游进行,选择我们的四大理由: 1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信: 2、自动连接,用户只要开启...
2026-06-22 52
核心价值:10B 参数击败 20B/80B 闭源模型,Apache-2.0 协议免费商用,中英文字渲染准确率行业第一梯队端午黑马 Boogu-Imag...
2026-06-22 9
金融界2025年8月6日消息,国家知识产权局信息显示,青岛博宁福田智能交通科技发展有限公司申请一项名为“一种城市轨道交通入场售票设备的票卡输送机构”的...
2026-06-22 43
亲,微信决胜麻将老是输怎么回事这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌...
2026-06-22 156
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样.所以很多小伙伴就怀疑...
2026-06-22 36
您好,微信随意玩透视下载这款游戏可以开挂的,确实是有挂的,需要了解加微【】很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到...
2026-06-22 118
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2026-06-22 32
发表评论