YAYI2
YAYI2(雅意2)是中科闻歌推出的新一代开源大语言模型,支持中文、英语等 10 多种语言。基于 Transformer 架构,参数规模达到 30B。YAYI2 采用 2 万亿 Tokens 的高质量语料进行预训练,并结合人类反馈强化学习,确保模型与人类价值观对齐。其多模态交互功能支持图文互生成、PDF 解析等。YAYI2 广泛应用于媒体宣传、舆情分析、政务治理、金融分析等领域,为企业提供 AI 辅助工具和知识库问答系统。
FlashVideo是一个由字节跳动和香港大学联合开发的高效高分辨率视频生成框架,特别适用于文本到视频的生成。通过创新的两阶段框架设计和流匹配技术,FlashVideo 能在短时间内生成 1080p 高清视频,优化视频流畅性,并减少计算成本。
FlashVideo是一个由字节跳动和香港大学联合开发的高效高分辨率视频生成框架,特别适用于文本到视频的生成。通过创新的两阶段框架设计和流匹配技术,FlashVideo 能在短时间内生成 1080p 高清视频,优化视频流畅性,并减少计算成本。该平台提供快速预览功能,让用户在 30 秒内获得初步结果,并决定是否继续生成高分辨率视频。该框架已开源,代码可以在 GitHub 上获取。
生成速度:1080p 视频仅需 102 秒,比传统方法快 4 倍。
计算成本:相比单阶段模型降低 90% 显存消耗。
生成质量:通过动态时序模块保持动作连贯性,支持每秒 24 帧流畅度。
FlashVideo 的代码在 2025 年 2 月 12 日宣布开源,可以在 GitHub 上获取。
GitHub:https://github.com/FoundationVision/FlashVideo
项目地址:https://jshilong.github.io/flashvideo-page/