释放Claude2和ComfyUI超强能力,基于亚马逊云科技的GenAI视觉管线
背景介绍
Claude2
在2023年9月底,亚马逊云科技宣布将Antrophic公司的Claude2模型纳入亚马逊云科技Amazon Bedrock服务并正式上线。作为ChatGPT-4最强有力的竞争对手,Claude2的语料库截至2023年初。其单次对话可处理高达10万个token的长文本,使其在总结归纳等涉及超长文本的任务中表现尤为突出。此外,许多影视和游戏领域的专家认为,Claude2在故事创作和角色扮演等方面展现出更加拟人化和准确的表达特点。
ComfyUI
ComfyUI是一个基于节点式工作流的WebUI,其核心采用了稳定扩散视频生成模型。它通过将稳定扩散的流程分解成多个节点,实现了更加精细化的流程定制和更高的结果可重用性。相比于SD WebUI,ComfyUI的节点工作流需要一定的学习曲线,因此普及程度不如前者。然而,在特定领域的项目中,ComfyUI依然显示出以下优势,并且受到了越来越多的青睐:
支持json文件或者图片来共享节点工作流,提高了项目组内部的工作效率(流程+质量)
由于节点内部的优化,其整体的出图速度对于SD WebUI快了10%-20%左右
在超分或者出大图的情况下也不容易将显卡打爆,得到黑图
主流的ControlNet,LoRA等等都已支持,缺少的模块,也可以通过custom_nodes方式安装
节点式工作方式,在游戏工作室(UE蓝图背景)会有天然的亲和性
由于其存储为结构化的数据结构,支持各种语言编程
架构图
本文将基于Amazon Cloud Service能力,利用Bedrock上面的Claude2模型作为驱动来输出关键提示词,然后输入到构建在SageMaker上的ComfyUI,最后的视频素材存储到S3上面,来实现自动生成视频的管线。
本方案通过CloudFormation进行一件部署,主要的架构图如下,其中包含的组建有:
SageMaker Notebook:基于g5.2xlarge的笔记本实列,包含项目运行环境以及核心代码
Claud2:Amazon Bedrock LLM大模型
S3:存储图片和视频
ComfyUI:提供了节点式的界面,进行GenAI推理网站
Ngrok:第三方反向代理软件,方便外部访问ComfyUI
实现步骤
申请Ngrok Authtoken
Ngrok是一个第三方的反向代理应用,通过安全可靠的内网穿透能力提供了较为方便的网络访问端点。在使得ComfyUI能够公开访问之前,需要去Ngrok的官方网站申请一个免费Authtoken。
CloudFormation安装
获取到安装模板后,需要填写如下参数:
StackName:CloudFormtion堆栈名字,方便管理
NotebookInstanceName:SageMaker笔记本的名字
NotebookInstanceType:SageMaker笔记本实列类型,建议g5系列
VolumeSizeInGB:SageMaker笔记本硬盘大小,建议300G以上
SageMakerIAMRole:如果留空,则会创建新的笔记本执行角色
DefaultCodeRepository:项目的Github地址
等待5-10分钟后,可以在CloudFormation Outputs中,或者SageMaker中找到对应的笔记本连接:
进去后,发现项目源码也下载好了,具体内容如下:
comfyui-Sagemaker-notebook.ipynb:安装和运行ComfyUI
comfyui-Bedrock-Claude2-notebook.ipynb:Claude2调用ComfyUI管线
workflows:ComfyUI生成视频管线
langchain_tasks:langchain模版文件
utils:python脚本
安装运行ComfyUI
进入/home/ec2-user/SageMaker/SageMaker-ComfyUI,打开comfyui-Sagemaker-notebook.ipynb,顺序执行脚本即可
将前面获取的Ngrok的authtoken替换到对应的位置
获取ComfyUI项目,安装环境依赖
按需获取VAE,Checkpoints,ControlNets,Lora等等
推荐安装ComfyUI的插件:comfyUI-manager,animatediff,upscaler等等
运行Ngrok Agent+ComfyUI
成功起来后,即可获得一个公开的访问地址(蓝色文字部分,第一次访问,可能会看到警告,可以忽略直接访问)
如果想停止对外服务,停止SageMaker notebook即可
如果想回收资源,找到对应的CloudFormation删除即可
测试管线
当ComfyUI的网站起来以后,可以做以下测试(将图片拖到ComfyUI即可使用)
txt2img:
txt2gif:
可编程管线
后面将基于下面的管线制作视频,导入ComfyUI。
使用可编程管线之前,需要开启ComfyUI的Enable Dev mode Option模式,然后保存为API模式。
Claude2安装和设置
选择Claude2的一个重要原因:对比Claude2 Vs GPT4,关于天安门升旗仪式攻略这个问题,Claude2的答案覆盖了最重要的时间和地点,而GPT4只是一些简单文字输出,没有任何具体的数字。
进入目录/home/ec2-user/SageMaker/SageMaker-ComfyUI,获取笔记comfyui-Bedrock-Claude2-notebook.ipynb,顺序执行脚本即可。
测试生成短片代码,生成目录为/home/ec2-user/SageMaker/outputs/:
安装Bedrock以及Claude2所需的依赖
测试Amazon Bedrock是否安装成功
提示词工程
如果上面都通过后,接下来就可以尝试让Claude2去生成各种prompt即可。
通过上面例子,可以看到prompt设置需要比较具体地描述业务需求。总结下来的一个比较有效的prompt工程格式为:
角色描述+业务描述
业务约束条件
参考输出例子
嵌入可替换的参数
总结
本文提供了一个快速搭建Claude2与ComfyUI的解决方案,通过程序化手段巧妙地将这两个LLM和视频生成模型融合,使其在实际业务场景中具备更显著的价值。
我们欣喜地看到,Claude2具有单次可处理10万个token的强大能力,能够帮助快速解析理解各种长度的文本提示,并生成所需的高质量输出结果。基于Claude2的这些输出,可以进一步驱动ComfyUI的视频生成流程,只需要替换其中的关键参数,就可以实现个性化的视频生成。通过这个方案,成功实现了LLM与视频生成模型的有效融合,使之为实际业务带来更多可能性。
原标题:释放Claude2和ComfyUI超强能力,基于Amazon Bedrock和SageMaker的GenAI视觉管线
原链接:https://aws.amazon.com/cn/blogs/china/a-genai-visual-pipeline-based-on-amazon-bedrock-and-sagemaker/
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
标签:
相关推荐:
最新新闻:
- 释放Claude2和ComfyUI超强能力,基于亚马逊云科技的GenAI视觉管线
- 深圳安博会圆满落幕 警翼荣获四项大奖
- 解读亚马逊云科技海外云服务器使用场景与优势
- 通过亚马逊云科技OCR以及生成式AI产品加速关键内容提取与整理
- 森海塞尔MKH 8030 8字形射频电容式麦克风预展
- 对话领袖 | 启峻中国创办人Owen L:启峻俱乐部迈入全新征途
- 珮肌数智创新塑造身心之美
- Evolution Wireless Digital 全新专业充电方案及最新软件更新
- 堪比Copilot平替?亚马逊云科技Amazon CodeWhisperer在开发效率提升上究竟如何
- 人人都是开发者,亚马逊云科技编程助手Amazon CodeWhisperer有效提升代码工作效率
- 开发者福利!一文入门亚马逊云科技基于机器学习的代码生成器Amazon CodeWhisperer
- 15组创作达人齐聚飞宇科技,稳定器新品提前曝光?!
- 森海塞尔EW-DP SKP直插式发射机:真正的无失真录制
- 基于亚马逊云科技Amazon SageMaker部署Stable Diffusion模型
- 沈逸:中德
- 亚马逊云科技五项行动,助力企业更好的落地生成式AI业务
- 锐阳基金会赋能加持|2023未来创新峰会圆满落幕!
- Dear Reality推出SPATIAL CONNECT for Wwise——XR音频制作新高度
- 兰贡生物绿色生活
- 火星皮卡48V柴油混动,一箱油穿越千里无人区
- 诺音曼微型夹式麦克风MCM在大型舞台大放光彩
- 兰贡生物:深耕生物大健康产业,服务“健康中国”战略
- 买美容仪看这篇,全网超火美容仪真实测评
- 美腕获得人民日报社“2023环境、社会及治理(ESG)年度案例”荣誉
- 美腕获得人民日报社“2023数字经济创新案例”荣誉
- 站上更高的世界舞台,长城汽车海外单月销量创历史新高!
- 使用亚马逊云科技Amazon EC2预留实例最大限度地节省成本和提高灵活性
- 火星皮卡“大”显身手 荒漠狂飙定义越野生活新方式
- 科技抗老新突破,香港美容仪品牌内地重磅上市
- 安全技术再获点赞,网商银行获国家级网络安全大赛“陇剑杯”二等奖
- 美国禁销白炽灯泡 25岁小伙囤了3500个够用一辈子
- 周杰伦天津演唱会带动消费30亿以上 6成为外地观众
- 《骑马与砍杀2》9月19日多区调涨 国区除外
- 游民晨播报:《EA Sports FC 24》最高分球员揭晓 《不羁联盟》未通过主机认证测试
- 《动物派对》将联动“白菜狗” 推出联动皮肤
- PS5多个捆绑包优惠五十美元 截至9月29日
- 《收获日3》7分钟实机公布 9月21日发售
- R星处理GTA6爆料出纰漏:删了但没完全删
- 《星空》的NPC笑容太假?一名开发者找到了原因
- 让“武老师”不再“武老师” 《装甲核心6》公布补丁更新信息
- 传闻:《龙珠Z:电光火石4》将于2024年初发售
- 《塞尔达传说》真人电影将开拍 任天堂担忧
- 克莱斯勒大厦不会出现《漫威蜘蛛侠2》
- 《星空》博主称游戏未体验满员 有玩家抱怨加载严重
- 上线数字版?《芭比》遭观众不满:削弱电影长尾表现
- 第九届中国金鹰电视艺术节颁奖晚会(第九届中国金鹰电视艺术节简介)
- 酱香拿铁爆火,盘点这些年茅台在A股创下的六大“神话”
- 飙升至六倍价格 土耳其PS Plus订阅费用大涨
- 《电锯惊魂10》全新海报:浑身浴血护士小姐
- 问女朋友的真心话刺激的话(问女朋友的真心话)
- 又一批银行跟进,9月25日起主动调降!
- 三国杀整么玩(三国杀怎么玩详细介绍)
- 小岛秀夫用索尼电视玩《星空》 B社点赞:欢迎加入!
- “英超”加“村超”架起一座桥
- 抓住文化消费升级新机遇
- 莫名心情烦躁怎么缓解(心情烦躁怎么缓解)
- “英超”加“村超”架起一座桥
- 《星空》配音演员受“主机战争”困扰:索粉自重
- 路边的枇杷你不要摘,不要摘,等我来摘#亲们早安吉祥 #用手机记录生活 #给...
- 孩子成绩全班垫底,父亲3句话让他最终考入名校!养育孩子也是家长自我提升的过程
- po 文是什么意思(po文是什么意思)
- 不到3000元买256GB的P50?华为手机秒杀活动已开启
- 浙江一地启用红色激光智能斑马线:让行人变红 事故率大降
- 淘宝AI大模型“淘宝问问”正在内测 输入信息生成文字等
- 《博德之门3》6号热更新补丁发布 修复对话与教程
- 魔兽世界向日葵宝宝铃声(魔兽世界向日葵)
- 安徽六安:童心感师恩 祝福寄深情
- 摩洛哥皇家武装部队称该国地震造成约100人死亡
- 国家统计局城市司首席统计师董莉娟解读2023年8月份CPI和PPI数据
- 市值蒸发1900亿美元:苹果被甩开
- 问界新M7开启预售:25.8-31.8万
- 华为Mate 60手机保护壳上架:99元 全包设计
- 华为Mate X5折叠屏手机开启预订
- 华为Mate X5折叠屏手机开售
- 《罗布乐思》9月登陆Quest VR 10月登陆PS主机